介紹 Exa 2.0 我們在 AI 研究和工程方面的突破使我們能夠建立全球最快的搜索 API(<350ms)和市場上最高品質的搜索。 以下是產品和技術的深入探討:
Exa 的唯一使命是建立一個完美的搜尋引擎。這個搜尋引擎總是能夠快速準確地返回您所需的信息,並通過無縫的 API 提供。 Exa 2.0 是邁向這一目標的重要一步。
為了構建 Exa 2.0,我們首先需要擴展我們的索引。我們現在提供數十億個網頁,並每分鐘刷新一次。 接下來,我們預訓練並微調了一個嵌入模型,以便對該索引進行精確的語義搜索。Exa 2.0 在我們的 144x H200 集群上訓練了超過一個月,並使用了我們在過去六個月中發現的新嵌入架構。 為了以世界上最低的延遲提供這些嵌入,對我們的內部向量數據庫進行了重大更新。一些例子包括新的聚類算法、詞彙壓縮和組裝優化。當然,所有這些都是用 Rust 實現的 :)
第一次更新是 Exa Fast。 Exa Fast 現在達到 <350ms 的端到端 P50 延遲,比下一個最快的 API 低 30%。 我們的客戶正在使用它來支持特別對延遲敏感的 AI 用例。
第二個是 Exa Deep。 Exa Deep 的設計目的是尋找最高品質的信息。它以代理的方式進行搜索、處理,然後再次搜索以達成此目的。 Exa Deep 在我們提出的幾乎所有基準測試中都名列前茅。
搜尋是一個非常多樣化的問題空間。像 SimpleQA 和 FRAMES 這樣的基準測試很有幫助,但卻錯過了許多對 AI 搜尋來說重要的內容。 在這裡,我們展示了一些其他基準測試的評估。我們還有許多內部的基準測試,將很快開源。
198