Kami membuka sumber terbuka BrowseComp ("Kompetisi Penjelajahan"), tolok ukur baru yang menantang yang dirancang untuk menguji seberapa baik agen AI dapat menjelajahi internet untuk menemukan informasi yang sulit ditemukan. Ini seperti perburuan pemulung online... tetapi untuk agen penelusuran.
920,42K