nb ini di-tweet 7 jam sebelum OAI mengumumkan hasil emas mereka
Ravid Shwartz Ziv
Ravid Shwartz Ziv19 Jul, 09.17
Jadi, semua model berkinerja buruk pada manusia pada pertanyaan Olimpiade Matematika Internasional yang baru, dan Grok-4 sangat buruk di dalamnya, bahkan dengan seleksi terbaik-of-n? Luar biasa!
26,04K