Estamos a lançar o BrowseComp, que significa Competição de Navegação. 🏎️ Pense nisso como competições de programação ou matemática — embora esses concursos possam não refletir perfeitamente a pesquisa real em SWE ou matemática, eles capturam uma centelha de inteligência. Este é O parâmetro que devemos considerar ao avaliar a inteligência de agentes de navegação semelhantes a pesquisas profundas.
OpenAI
OpenAI11/04/2025
Estamos a abrir o código-fonte do BrowseComp ("Competição de Navegação"), um novo e desafiador benchmark projetado para testar quão bem os agentes de IA conseguem navegar na internet para encontrar informações difíceis de localizar. É como uma caça ao tesouro online... mas para agentes de navegação.
464,59K