"Mereka baru-baru ini mengembangkan teknik baru yang bekerja jauh lebih baik pada masalah yang sulit diverifikasi, telah memperpanjang TTC hingga beberapa jam, dan telah meningkatkan efisiensi berpikir." h / t untuk @Hangsiin untuk menyoroti permata ini.
Noam Brown
Noam Brown19 Jul, 15.52
Hari ini, kami di @OpenAI mencapai tonggak sejarah yang dianggap banyak orang bertahun-tahun lagi: kinerja tingkat medali emas di IMO 2025 dengan LLM penalaran umum—di bawah batas waktu yang sama dengan manusia, tanpa alat. Meskipun kedengarannya luar biasa, itu bahkan lebih signifikan daripada judul utama 🧵
3,07K