المواضيع الرائجة
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
1 / N أنا متحمس لمشاركة أن أحدث @OpenAI المنطق التجريبي لدينا قد حقق تحديا كبيرا طويل الأمد في الذكاء الاصطناعي: أداء على مستوى الميدالية الذهبية في مسابقة الرياضيات الأكثر شهرة في العالم - أولمبياد الرياضيات الدولي (IMO).

2 / N قمنا بتقييم نماذجنا على مشاكل IMO لعام 2025 وفقا لنفس قواعد المتسابقين البشريين: جلستان امتحانيتان لمدة 4.5 ساعة ، بدون أدوات أو إنترنت ، وقراءة بيانات المشكلة الرسمية ، وكتابة براهين اللغة الطبيعية.

4 / N ثانيا ، عمليات إرسال المنظمة البحرية الدولية هي إثباتات يصعب التحقق منها ، ومتعددة الصفحات. التقدم هنا يستدعي تجاوز نموذج RL للمكافآت الواضحة التي يمكن التحقق منها. من خلال القيام بذلك ، حصلنا على نموذج يمكنه صياغة حجج معقدة ومانعة للماء على مستوى علماء الرياضيات البشريين.




5 / N إلى جانب النتيجة نفسها ، أنا متحمس لنهجنا: نصل إلى مستوى القدرة هذا ليس من خلال منهجية ضيقة خاصة بالمهمة ، ولكن من خلال فتح آفاق جديدة في التعلم المعزز للأغراض العامة وتوسيع نطاق الحوسبة في وقت الاختبار.
6 / N في تقييمنا ، حل النموذج 5 من 6 مشاكل في المنظمة البحرية الدولية لعام 2025. لكل مشكلة ، قام ثلاثة من الفائزين بميداليات IMO السابقين بشكل مستقل بتصنيف الدليل المقدم من النموذج ، مع الانتهاء من الدرجات بعد إجماع الآراء. حصل النموذج على 35/42 نقطة في المجموع ، وهو ما يكفي للذهب! 🥇
8 / N راجع للشغل ، سنطلق GPT-5 قريبا ، ونحن متحمسون لتجربته. ولكن فقط لكي نكون واضحين: IMO gold LLM هو نموذج بحث تجريبي. لا نخطط لإصدار أي شيء بهذا المستوى من القدرة على الرياضيات لعدة أشهر.
9 / N لا يزال - هذا يؤكد مدى سرعة تقدم الذكاء الاصطناعي في السنوات الأخيرة. في عام 2021 ، @JacobSteinhardt طلب مني مستشار الدكتوراه الخاص بي توقع تقدم الذكاء الاصطناعي الرياضيات بحلول يوليو 2025. توقعت 30٪ على معيار الرياضيات (واعتقدت أن الجميع كانوا متفائلين للغاية). بدلا من ذلك ، لدينا الذهب IMO.

11 / N أخيرا ، نود أن نهنئ جميع المشاركين في المنظمة البحرية الدولية لعام 2025 على إنجازهم! نحن فخورون بوجود العديد من المشاركين السابقين في المنظمة البحرية الدولية في @OpenAI وندرك أن هؤلاء هم بعض ألمع العقول الشابة في المستقبل.
1.12M
الأفضل
المُتصدِّرة
التطبيقات المفضلة