🚨GROK OBTEVE 26,9% NO "ÚLTIMO EXAME DA HUMANIDADE" SEM NENHUM FERRAMENTA O gráfico de escalonamento conta a história: mais computação = melhor desempenho. Grok superou mais de um quarto do benchmark acadêmico mais difícil do mundo usando apenas raciocínio puro. Sem calculadoras, sem ajuda externa. Apenas poder cerebral de IA enfrentando 2.500 perguntas em todos os campos do conhecimento humano. A maioria dos humanos falharia neste teste mesmo COM ferramentas. Grok está a fazê-lo de olhos vendados. Fonte: @xai @elonmusk
Mario Nawfal
Mario Nawfal10/07, 12:14
🚨"HUMANITY'S LAST EXAM" DROPPED: 2,500 QUESTIONS TO SEPARATE REAL AI FROM PRETENDERS X just unveiled the ultimate academic gauntlet - a benchmark so comprehensive it's meant to be the final test ever needed. Math dominates at 41%, followed by sciences and humanities. The name says it all: this is the exam to end all exams. Once AI aces this, what's left to prove? We're building the test that determines when machines officially outsmart us. Source: @xai @elonmusk
89,58K