Exa 2.0のご紹介 AIの研究とエンジニアリングのブレークスルーにより、最速の検索API(<350ms)と市場最高品質の検索の両方を構築することができました。 以下で製品と技術の詳細を説明します。
Exa の唯一の使命は、完璧な検索エンジンを構築することです。必要な情報を物理的に可能な限り迅速に正確に返し、シームレスな API を通じて利用できます。 Exa 2.0 は、その目標に向けた大きな一歩です。
Exa 2.0 を構築するには、まずインデックスを拡張する必要がありました。現在、数百億の Web ページにサービスを提供し、毎分更新しています。 次に、そのインデックスに対する正確なセマンティック検索のために、埋め込みモデルを事前トレーニングして微調整しました。Exa 2.0 は、144x H200 クラスターで 1 か月以上トレーニングされ、過去 6 か月間に発見した新しい埋め込みアーキテクチャを使用しています。 これらの埋め込みを世界で最も低いレイテンシーで提供するには、社内のベクターデータベースを大幅に更新する必要がありました。たとえば、新しいクラスタリング アルゴリズム、字句圧縮、アセンブリの最適化などがあります。もちろん、すべては Rust :)
最初のアップデートはエクサファストです。 Exa Fast は <350 ミリ秒の e2e P50 レイテンシーを達成し、次に最速の API よりも 30% 短縮されました。 当社のお客様は、特にレイテンシーに敏感な AI ユースケースを強化するためにこれを使用しています。
2つ目はエクサディープです。 Exa Deep は、可能な限り最高品質の情報を見つけるように設計されています。エージェント的に検索、処理、そして再度検索します。 Exa Deep は、私たちが投げかけたほぼすべてのベンチマークを上回っています。
検索は非常に多様な問題空間です。SimpleQA や FRAMES などのベンチマークは役に立ちますが、AI 検索にとって重要なことの多くを見逃しています。 ここでは、他のベンチマークでの評価を示します。他にも多くの内部ツールがあり、まもなくオープンソース化する予定です。
359.82K