Que fim de semana louco sobre IA e IMO. Olhando para os últimos 3 dias, testemunhei: > Sexta-feira à tarde: informações vazadas sobre a DeepMind ganhando ouro > Sábado 1h: a OpenAI antecipou o anúncio oficial, roubando o destaque > Inicialmente pensei que o Google estava apenas lento devido à aprovação de marketing > Depois ouvi de pessoas do Google que a IMO e eles mesmos precisavam de mais tempo para verificação > Acontece que a OpenAI nem sequer envolveu a IMO oficialmente > Segunda-feira: a DeepMind confirmou seu ouro com respostas mais limpas e estéticas, totalmente verificadas pela IMO Foi divertido ser o primeiro a compartilhar a notícia no X na última sexta-feira. Que fim de semana louco! Brincadeiras à parte, há muito hype em torno da IA matemática ultimamente, mas o que precisamos mais é de rigor e padronização. Como Terence Tao apontou, mesmo que os resultados pareçam semelhantes, diferenças no formato de teste podem fazer uma grande diferença. Ainda estamos longe de ter padrões e mensagens claros e consistentes na pesquisa em IA. Se quisermos um progresso significativo, é hora da comunidade se mobilizar. Vamos construir benchmarks em que todos possamos confiar.
Jasper
Jasper19/07, 06:25
Há apenas 20 minutos, o resultado do IMO 2025 foi divulgado. A China ficou em 1º lugar e @GoogleDeepMind ganhou uma medalha de ouro 🥇 As futuras competições de matemática serão a equipe da China contra a equipe chinesa dos EUA contra a IA.
4,93K