Pendekatan yang menarik! Namun, kami melihat bukti dan metodologi dan kami menemukan beberapa masalah, khususnya dengan penggunaan petunjuk yang diberikan pada model. Meskipun perancah memang meningkatkan kinerja, perancah tidak menyelesaikan semua masalah secara akurat dan tidak akan mendapatkan medali emas. 🧵
Lin Yang
Lin Yang22 Jul, 09.18
🚨 Matematika Olimpiade + AI: Kami menjalankan Google Gemini 2.5 Pro pada masalah IMO 2025 yang baru. Dengan prompting yang cermat dan desain pipeline, ia memecahkan 5 dari 6 — luar biasa untuk tugas yang menuntut wawasan dan kreativitas yang mendalam. Model bisa memenangkan emas! 🥇 #AI #Math #LLMs #IMO2025
22,63K