Introductie van Exa 2.0 Doorbraken in ons AI-onderzoek en engineering hebben ons in staat gesteld om zowel de snelste zoek-API (<350ms) als de hoogste kwaliteit zoekopdracht op de markt te bouwen. Product- en technische diepgaande analyse hieronder:
Exa's enige missie is het bouwen van een perfecte zoekmachine. Een die altijd precies de informatie teruggeeft die je nodig hebt, zo snel als fysiek mogelijk, beschikbaar via een naadloze API. Exa 2.0 is een grote stap in de richting van dat doel.
Om Exa 2.0 te bouwen, moesten we eerst onze index uitbreiden. We bedienen nu tientallen miljarden webpagina's en vernieuwen ze elke minuut. Vervolgens hebben we een embeddingmodel voor precieze semantische zoekopdrachten over die index voorgetraind en verfijnd. Exa 2.0 is meer dan een maand getraind op onze 144x H200-cluster en maakt gebruik van nieuwe embeddingarchitecturen die we de afgelopen 6 maanden hebben ontdekt. Om deze embeddings met de laagste latentie ter wereld te serveren, waren grote updates aan onze interne vectordatabase nodig. Enkele voorbeelden zijn nieuwe clusteringalgoritmen, lexicale compressie en assemblage-optimalisaties. Alles in Rust natuurlijk :)
De eerste update is Exa Fast. Exa Fast bereikt nu <350ms e2e P50 latentie, 30% lager dan de volgende snelste API. Onze klanten gebruiken het om vooral latentiegevoelige AI-toepassingen aan te drijven.
Ten tweede is Exa Deep. Exa Deep is ontworpen om de hoogste kwaliteit informatie mogelijk te vinden. Het zoekt agentisch, verwerkt, en zoekt dan opnieuw om dat te doen. Exa Deep scoort bijna op elke benchmark die we erop loslaten.
Zoeken is een zeer divers probleemgebied. Benchmarks zoals SimpleQA en FRAMES zijn nuttig, maar missen veel van wat belangrijk is voor AI-zoekopdrachten. Hier tonen we evaluaties op enkele andere benchmarks. We hebben veel meer interne benchmarks die we binnenkort open source zullen maken.
359,8K