Acabei de sair do trabalho e experimentei o Grok-4 num problema de topologia de graduação. Levou 9 minutos a pensar e depois deu uma resposta limpa, plausível, mas totalmente errada 😅 Não acho que este se qualifique como "habilidosamente adversarial." Os modelos de IA estão a esmagar benchmarks — mas ainda há um longo caminho a percorrer para uma AGI matemática real.
Elon Musk
Elon Musk10/07, 16:47
O Grok 4 está num ponto em que essencialmente nunca erra em questões de matemática/física, a menos que sejam habilidosamente adversariais. Ele pode identificar erros ou ambiguidades nas perguntas, e então corrigir o erro na pergunta ou responder a cada variante de uma pergunta ambígua.
663,02K