Apresentando o Exa 2.0 Os avanços em nossa pesquisa e engenharia de IA nos permitiram construir a API de pesquisa mais rápida do mundo (<350ms) e a pesquisa da mais alta qualidade do mercado. Aprofundamento técnico e de produto abaixo:
A única missão da Exa é construir um mecanismo de pesquisa perfeito. Um que sempre retorna exatamente as informações de que você precisa o mais rápido possível, disponível por meio de uma API perfeita. O Exa 2.0 é um grande passo em direção a esse objetivo.
Para criar o Exa 2.0, primeiro precisávamos expandir nosso índice. Agora atendemos dezenas de bilhões de páginas da Web e as atualizamos a cada minuto. Em seguida, pré-treinamos e ajustamos um modelo de incorporação para pesquisa semântica precisa sobre esse índice. O Exa 2.0 foi treinado por mais de um mês em nosso cluster 144x H200 e usa novas arquiteturas de incorporação que descobrimos nos últimos 6 meses. Para atender a essas incorporações com a menor latência do mundo, foram necessárias grandes atualizações em nosso banco de dados vetorial interno. Alguns exemplos são novos algoritmos de clustering, compactação lexical e otimizações de assembly. Tudo em Rust, é claro, :)
A primeira atualização é o Exa Fast. O Exa Fast agora atinge <350ms de latência e2e P50, 30% menor que a próxima API mais rápida. Nossos clientes estão usando-o para alimentar casos de uso de IA particularmente sensíveis à latência.
O segundo é Exa Deep. O Exa Deep foi projetado para encontrar informações da mais alta qualidade possível. Ele procura agenticamente, processa e depois pesquisa novamente para fazer isso. Exa Deep supera quase todos os benchmarks que lançamos nele.
A pesquisa é um espaço de problema muito diversificado. Benchmarks como SimpleQA e FRAMES são úteis, mas perdem muito do que importa para a pesquisa de IA. Aqui mostramos avaliações em alguns outros benchmarks. Temos muitos outros internos que abriremos em breve.
204