Acabei de sair do trabalho e tentei o Grok-4 em um problema de topologia de graduação. Demorou 9 minutos para pensar e, em seguida, deu uma resposta 😅 limpa, plausível, mas totalmente errada Não pense que este se qualifica como "habilmente adversário". Os modelos de IA estão esmagando os benchmarks – mas ainda estão muito à frente para a AGI matemática real.
Elon Musk
Elon Musk10 de jul., 16:47
Grok 4 está no ponto em que essencialmente nunca erra nas questões do exame de matemática / física, a menos que sejam habilmente contraditórias. Ele pode identificar erros ou ambiguidades nas perguntas e, em seguida, corrigir o erro na pergunta ou responder a cada variante de uma pergunta ambígua.
663,03K