nb isso foi twittado 7 horas antes de OAI anunciar seu resultado de ouro
Ravid Shwartz Ziv
Ravid Shwartz Ziv19 de jul., 09:17
Então, todos os modelos têm desempenho inferior ao dos humanos nas novas questões da Olimpíada Internacional de Matemática, e o Grok-4 é especialmente ruim nisso, mesmo com a seleção melhor de n? Incrível!
26,05K