Grok 4 masih gagal dalam pertanyaan teori permainan sulit saya Itu berpikir selama hampir 10 menit, ringkasan menunjukkan dia menari di sekitar jawaban yang benar, tetapi tidak dapat berkomitmen untuk itu o3-pro sangat dekat, matematikanya benar, tetapi jatuh ke dalam perangkap halusinasi - "Keseimbangan berkorelasi Stackelberg" bukanlah sesuatu pertanyaannya sulit bagi LLM karena konsep keseimbangan berkorelasi sangat erat kaitannya dengan penyesalan swap dalam banyak kasus, tetapi di sini adalah red herring jawabannya hanya "nilai Stackelberg"
20,26K