Presentamos Exa 2.0 Los avances en nuestra investigación y ingeniería de IA nos han permitido construir tanto la API de búsqueda más rápida (<350ms) como la búsqueda de mayor calidad en el mercado. A continuación, un análisis profundo del producto y técnico:
La única misión de Exa es construir un motor de búsqueda perfecto. Uno que siempre devuelva exactamente la información que necesitas tan rápido como sea físicamente posible, disponible a través de una API sin interrupciones. Exa 2.0 es un gran paso hacia ese objetivo.
Para construir Exa 2.0, primero necesitábamos expandir nuestro índice. Ahora servimos decenas de miles de millones de páginas web y las actualizamos cada minuto. A continuación, preentrenamos y ajustamos un modelo de incrustación para una búsqueda semántica precisa sobre ese índice. Exa 2.0 fue entrenado durante más de un mes en nuestro clúster 144x H200 y utiliza nuevas arquitecturas de incrustación que hemos descubierto en los últimos 6 meses. Para servir estas incrustaciones con la menor latencia del mundo, se requirieron actualizaciones importantes en nuestra base de datos vectorial interna. Algunos ejemplos son nuevos algoritmos de agrupamiento, compresión léxica y optimizaciones de ensamblaje. Todo en Rust, por supuesto :)
La primera actualización es Exa Fast. Exa Fast ahora logra <350ms de latencia e2e P50, un 30% menos que la API más rápida siguiente. Nuestros clientes lo están utilizando para impulsar casos de uso de IA que son particularmente sensibles a la latencia.
El segundo es Exa Deep. Exa Deep está diseñado para encontrar la información de la más alta calidad posible. Busca de manera activa, procesa y luego vuelve a buscar para lograrlo. Exa Deep supera casi todos los estándares que le lanzamos.
La búsqueda es un espacio de problemas muy diverso. Los puntos de referencia como SimpleQA y FRAMES son útiles, pero no abarcan gran parte de lo que importa para la búsqueda de IA. Aquí mostramos evaluaciones en algunos otros puntos de referencia. Tenemos muchos más internos que pronto haremos de código abierto.
359,88K