Sangat sulit untuk mengetahui apakah OpenAI dan Google DeepMind benar-benar mendapatkan IMO Gold "adil dan persegi" atau tidak. Menantikan analisis lebih lanjut.
Jasper Dekoninck
Jasper Dekoninck21 jam lalu
Pendekatan yang menarik! Namun, kami melihat bukti dan metodologi dan kami menemukan beberapa masalah, khususnya dengan penggunaan petunjuk yang diberikan pada model. Meskipun perancah memang meningkatkan kinerja, perancah tidak menyelesaikan semua masalah secara akurat dan tidak akan mendapatkan medali emas. 🧵
1,23K