1/N Saya senang berbagi bahwa penalaran @OpenAI eksperimental terbaru kami LLM telah mencapai tantangan besar yang sudah lama ada di AI: kinerja tingkat medali emas pada kompetisi matematika paling bergengsi di dunia—Olimpiade Matematika Internasional (IMO).
4/N Kedua, pengajuan IMO adalah bukti multi-halaman yang sulit diverifikasi. Kemajuan di sini menuntut untuk melampaui paradigma RL tentang hadiah yang jelas dan dapat diverifikasi. Dengan melakukan itu, kami telah memperoleh model yang dapat membuat argumen yang rumit dan kedap air pada tingkat matematikawan manusia.
5/N Selain hasilnya sendiri, saya senang dengan pendekatan kami: Kami mencapai tingkat kemampuan ini bukan melalui metodologi khusus tugas yang sempit, tetapi dengan membuka jalan baru dalam pembelajaran penguatan tujuan umum dan penskalaan komputasi waktu pengujian.
8/N Btw, kami akan segera merilis GPT-5, dan kami senang Anda mencobanya. Tapi untuk lebih jelasnya: LLM emas IMO adalah model penelitian eksperimental. Kami tidak berencana untuk merilis apa pun dengan kemampuan matematika tingkat ini selama beberapa bulan.
9/N Namun—ini menggarisbawahi seberapa cepat AI telah berkembang dalam beberapa tahun terakhir. Pada tahun 2021, penasihat PhD saya @JacobSteinhardt meminta saya memperkirakan kemajuan matematika AI pada Juli 2025. Saya memprediksi 30% pada tolok ukur MATEMATIKA (dan berpikir semua orang terlalu optimis). Sebaliknya, kami memiliki emas IMO.
11/N Terakhir, kami ingin mengucapkan selamat kepada semua peserta IMO 2025 atas pencapaian mereka! Kami bangga memiliki banyak peserta IMO sebelumnya di @OpenAI dan mengakui bahwa ini adalah beberapa pemikir muda paling cerdas di masa depan.
131,56K