في الآونة الأخيرة ، وصلت Openai ، Goolge إلى الميدالية الذهبية IMO بنماذجها التجريبية الجديدة. لكن فريقنا وصل إلى نفس المستوى مع o4-mini-high فقط وأنظمة الوكيل الخاصة بنا. والآن نحن نستهيد بمصادر مفتوحة. خاصة أننا حصلنا على تحسينات مجنونة مع معايير USAMO. كان الخط الأساسي تقريبا 0 ولكن وكيلنا حصل على متوسط 90٪. كما يمكننا إثبات النظرية لأوراق arxiv الأخيرة التي تعطي فكرة البحث الرئيسية.
‏‎84.33‏K