Vă prezentăm Exa 2.0 Descoperirile în cercetarea și ingineria noastră AI ne-au permis să construim atât cel mai rapid API de căutare din lume (<350ms), cât și cea mai înaltă calitate de căutare de pe piață. Produsul și tehnica aprofundată mai jos:
Singura misiune a lui Exa este de a construi un motor de căutare perfect. Unul care returnează întotdeauna exact informațiile de care aveți nevoie cât mai repede posibil, disponibil printr-un API fără probleme. Exa 2.0 este un pas mare către acest obiectiv.
Pentru a construi Exa 2.0, a trebuit mai întâi să ne extindem indexul. Acum servim zeci de miliarde de pagini web și le reîmprospătăm în fiecare minut. Apoi, am preantrenat și ajustat un model de încorporare pentru căutare semantică precisă peste acel index. Exa 2.0 a fost antrenat timp de peste o lună pe clusterul nostru 144x H200 și folosește noi arhitecturi de încorporare pe care le-am descoperit în ultimele 6 luni. Pentru a servi aceste încorporari la cea mai mică latență din lume, a fost nevoie de actualizări majore ale bazei noastre de date vectoriale interne. Câteva exemple sunt noii algoritmi de grupare, compresia lexicala și optimizările de asamblare. Totul în Rust, desigur :)
Prima actualizare este Exa Fast. Exa Fast atinge acum o latență e2e P50 de <350ms, cu 30% mai mică decât următorul cel mai rapid API. Clienții noștri îl folosesc pentru a alimenta cazuri de utilizare AI deosebit de sensibile la latență.
Al doilea este Exa Deep. Exa Deep este conceput pentru a găsi informații de cea mai înaltă calitate posibilă. Caută, procesează, apoi caută din nou pentru a face acest lucru. Exa Deep depășește aproape fiecare punct de referință pe care îl aruncăm.
Căutarea este un spațiu cu probleme foarte divers. Benchmark-uri precum SimpleQA și FRAMES sunt utile, dar ratează o mare parte din ceea ce contează pentru căutarea AI. Aici arătăm evaluări ale altor benchmark-uri. Avem multe altele interne pe care le vom deschide în curând.
203