🚨GROK PONTUA 26,9% NO "ÚLTIMO EXAME DA HUMANIDADE" SEM NENHUMA FERRAMENTA O gráfico de dimensionamento conta a história: mais computação = melhor desempenho. Grok esmagou mais de um quarto da referência acadêmica mais difícil do mundo usando apenas o raciocínio puro. Sem calculadoras, sem ajuda externa. Apenas inteligência bruta de IA lidando com 2.500 perguntas em todos os campos do conhecimento humano. A maioria dos humanos falharia neste teste mesmo COM ferramentas. Grok está fazendo isso com os olhos vendados. Fonte: @xai @elonmusk
Mario Nawfal
Mario Nawfal10 de jul., 12:14
🚨"HUMANITY'S LAST EXAM" DROPPED: 2,500 QUESTIONS TO SEPARATE REAL AI FROM PRETENDERS X just unveiled the ultimate academic gauntlet - a benchmark so comprehensive it's meant to be the final test ever needed. Math dominates at 41%, followed by sciences and humanities. The name says it all: this is the exam to end all exams. Once AI aces this, what's left to prove? We're building the test that determines when machines officially outsmart us. Source: @xai @elonmusk
89,58K