Estamos abriendo el código de BrowseComp ("Competencia de navegación"), un nuevo y desafiante punto de referencia diseñado para probar qué tan bien los agentes de IA pueden navegar por Internet para encontrar información difícil de localizar. Es como una búsqueda del tesoro en línea... sino para los agentes de navegación.
920.4K