Memperkenalkan Exa 2.0 Terobosan dalam penelitian dan rekayasa AI kami telah memungkinkan kami membangun API pencarian tercepat di dunia (<350ms) dan pencarian berkualitas tinggi di pasar. Produk dan teknis menyelam mendalam di bawah ini:
Satu-satunya misi Exa adalah membangun mesin pencari yang sempurna. Salah satu yang selalu mengembalikan informasi yang Anda butuhkan secepat mungkin, tersedia melalui API yang mulus. Exa 2.0 adalah langkah besar menuju tujuan itu.
Untuk membangun Exa 2.0, pertama-tama kita perlu memperluas indeks kita. Kami sekarang melayani puluhan miliar halaman web dan menyegarkannya setiap menit. Selanjutnya, kami melatih dan menyempurnakan model penyematan untuk pencarian semantik yang tepat di atas indeks itu. Exa 2.0 dilatih selama lebih dari sebulan pada klaster H200 144x kami dan menggunakan arsitektur penyematan baru yang telah kami temukan selama 6 bulan terakhir. Untuk melayani penyematan ini pada latensi terendah di dunia, diperlukan pembaruan besar untuk database vektor internal kami. Beberapa contohnya adalah algoritme pengelompokan baru, kompresi leksikal, dan pengoptimalan perakitan. Semua di Rust tentu saja :)
Pembaruan pertama adalah Exa Fast. Exa Fast sekarang mencapai latensi e2e P50 <350ms, 30% lebih rendah dari API tercepat berikutnya. Pelanggan kami menggunakannya untuk mendukung kasus penggunaan AI yang sangat sensitif terhadap latensi.
Kedua adalah Exa Deep. Exa Deep dirancang untuk menemukan informasi dengan kualitas setinggi mungkin. Ini secara agen mencari, memproses, lalu mencari lagi untuk melakukannya. Exa Deep menduduki puncak hampir setiap tolok ukur yang kami lemparkan.
Pencarian adalah ruang masalah yang sangat beragam. Tolok ukur seperti SimpleQA dan FRAMES sangat membantu, tetapi melewatkan banyak hal yang penting untuk pencarian AI. Di sini kami menunjukkan eval pada beberapa tolok ukur lainnya. Kami memiliki lebih banyak yang internal yang akan segera kami open source.
200