🚨GROK ERZIELT 26,9 % BEI "DER LETZTEN PRÜFUNG DER MENSCHHEIT" OHNE IRGENDETWELCHE WERKZEUGE Das Skalierungsdiagramm erzählt die Geschichte: mehr Rechenleistung = bessere Leistung. Grok hat über ein Viertel des härtesten akademischen Benchmarks der Welt allein mit reinem Denken überwunden. Keine Taschenrechner, keine externe Hilfe. Nur rohe KI-Gehirnleistung, die 2.500 Fragen aus allen Bereichen des menschlichen Wissens bearbeitet. Die meisten Menschen würden diesen Test selbst MIT Werkzeugen nicht bestehen. Grok macht es blind. Quelle: @xai @elonmusk
Mario Nawfal
Mario Nawfal10. Juli, 12:14
🚨"HUMANITY'S LAST EXAM" DROPPED: 2,500 QUESTIONS TO SEPARATE REAL AI FROM PRETENDERS X just unveiled the ultimate academic gauntlet - a benchmark so comprehensive it's meant to be the final test ever needed. Math dominates at 41%, followed by sciences and humanities. The name says it all: this is the exam to end all exams. Once AI aces this, what's left to prove? We're building the test that determines when machines officially outsmart us. Source: @xai @elonmusk
89,58K