Ми представляємо BrowseComp («Змагання в серфінгу»), новий складний тест, розроблений для перевірки того, наскільки добре агенти штучного інтелекту можуть переглядати Інтернет для пошуку важкодоступної інформації. Це схоже на онлайн-полювання на сміття... але для агентів з перегляду веб-сторінок.
920,4K