We maken BrowseComp (“Browsing Competition”) open source, een nieuwe, uitdagende benchmark die is ontworpen om te testen hoe goed AI-agenten het internet kunnen doorbladeren om moeilijk te vinden informatie te vinden. Het is als een online speurtocht... maar dan voor browse-agents.
920,4K