Apresentando o Exa 2.0 Avanços na nossa pesquisa e engenharia de IA nos permitiram construir tanto a API de busca mais rápida (<350ms) quanto a busca de mais alta qualidade no mercado. Aprofundamento do produto e técnico abaixo:
A única missão da Exa é construir um motor de busca perfeito. Um que sempre devolva exatamente a informação que você precisa o mais rápido possível, disponível através de uma API sem costura. A Exa 2.0 é um grande passo em direção a esse objetivo.
Para construir o Exa 2.0, primeiro precisávamos expandir nosso índice. Agora servimos dezenas de bilhões de páginas da web e as atualizamos a cada minuto. Em seguida, pré-treinamos e ajustamos um modelo de incorporação para busca semântica precisa sobre esse índice. O Exa 2.0 foi treinado por mais de um mês em nosso cluster 144x H200 e utiliza novas arquiteturas de incorporação que descobrimos nos últimos 6 meses. Para servir essas incorporações com a menor latência do mundo, foram necessárias grandes atualizações em nosso banco de dados vetorial interno. Alguns exemplos são novos algoritmos de agrupamento, compressão lexical e otimizações de montagem. Tudo em Rust, claro :)
A primeira atualização é o Exa Fast. O Exa Fast agora alcança <350ms de latência e2e P50, 30% inferior à próxima API mais rápida. Os nossos clientes estão a usá-lo para impulsionar casos de uso de IA particularmente sensíveis à latência.
O segundo é o Exa Deep. O Exa Deep é projetado para encontrar a informação da mais alta qualidade possível. Ele pesquisa de forma autônoma, processa e depois pesquisa novamente para fazê-lo. O Exa Deep supera quase todos os benchmarks que lhe lançamos.
A pesquisa é um espaço de problemas muito diversificado. Referências como SimpleQA e FRAMES são úteis, mas perdem muito do que importa para a pesquisa em IA. Aqui mostramos avaliações em algumas outras referências. Temos muitas mais internas que iremos disponibilizar em código aberto em breve.
359,81K