نحن بصدد إصدار BrowseComp ، والذي يرمز إلى Browsing Competition. 🏎️ فكر في الأمر مثل مسابقات الترميز أو الرياضيات - في حين أن هذه المسابقات قد لا تعكس تماما SWE في العالم الحقيقي أو البحث الرياضي ، إلا أنها تلتقط شرارة من الذكاء. هذا هو المعيار الذي يجب أن نهتم به عند تقييم ذكاء وكلاء التصفح الشبيهين بالأبحاث العميقة.
OpenAI
OpenAI‏11 أبريل 2025
نحن مفتوح المصدر BrowseComp ("مسابقة التصفح") ، وهو معيار جديد مليء بالتحديات مصمم لاختبار مدى قدرة وكلاء الذكاء الاصطناعي على تصفح الإنترنت للعثور على معلومات يصعب تحديد موقعها. إنه مثل مطاردة الزبال عبر الإنترنت ... ولكن لوكلاء التصفح.
‏‎464.6‏K