Vi använder BrowseComp ("Surftävling") med öppen källkod, ett nytt, utmanande benchmarktest som är utformat för att testa hur väl AI-agenter kan surfa på internet för att hitta information som är svår att hitta. Det är som en skattjakt på nätet... men för bläddringsagenter.
920,41K