Chúng tôi đang phát hành BrowseComp, viết tắt của Cuộc thi Duyệt web. 🏎️ Hãy nghĩ về nó như các cuộc thi lập trình hoặc toán học — mặc dù những cuộc thi này có thể không phản ánh hoàn hảo công việc lập trình phần mềm thực tế hoặc nghiên cứu toán học, nhưng chúng vẫn nắm bắt được một tia sáng của trí thông minh. Đây là TIÊU CHUẨN mà chúng ta nên quan tâm khi đánh giá trí thông minh của các tác nhân duyệt web giống như nghiên cứu sâu.
OpenAI
OpenAI11 thg 4, 2025
Chúng tôi đang mở mã nguồn BrowseComp ("Cuộc thi Duyệt web"), một tiêu chuẩn mới đầy thách thức được thiết kế để kiểm tra khả năng của các tác nhân AI trong việc duyệt internet để tìm kiếm thông tin khó tìm. Nó giống như một cuộc săn tìm trực tuyến... nhưng dành cho các tác nhân duyệt web.
464,59K