Abordagem interessante! No entanto, analisamos as provas e a metodologia e encontramos alguns problemas, especificamente com o uso de dicas dadas ao modelo. Embora o andaime realmente melhore o desempenho, ele não resolve todos os problemas com precisão e não receberia uma medalha de ouro. 🧵
Lin Yang
Lin Yang22 de jul., 09:18
🚨 Matemática da Olimpíada + IA: Executamos o Gemini 2.5 Pro do Google nos novos problemas da IMO 2025. Com solicitação cuidadosa e design de pipeline, ele resolveu 5 de 6 - notável para tarefas que exigem visão e criatividade profundas. O modelo pode ganhar ouro! 🥇 #AI #Math #LLMs #IMO2025
28,01K