Grok 4 ist an dem Punkt, an dem es im Grunde genommen niemals Fragen zu Mathematik/Physik-Prüfungen falsch beantwortet, es sei denn, sie sind geschickt gegnerisch. Es kann Fehler oder Mehrdeutigkeiten in Fragen identifizieren und dann den Fehler in der Frage beheben oder jede Variante einer mehrdeutigen Frage beantworten.
Deedy
Deedy10. Juli, 14:07
Irrsinnig, dass Elon Musk es wieder geschafft hat, die KI-Kriege mit Grok 4 absolut zu dominieren. Hier sind die wichtigsten Ankündigungen zusammengefasst: — Post-Training RL-Ausgaben == Pretraining-Ausgaben — $3/M Eingaben, $15/M Ausgaben, 256k Kontext, Preis 2x über 128k — #1 bei der letzten Prüfung der Menschheit (allgemeine schwierige Probleme) 44,4%, #2 ist 26,9% — #1 bei GPQA (schwierige Abschlussprobleme) 88,9%. #2 ist 86,4% — #1 bei AIME 2025 (Mathematik) 100%, #2 ist 98,4% — #1 bei Harvard MIT Mathematik 96,7%, #2 ist 82,5% — #1 bei USAMO25 (Mathematik) 61,9%, #2 ist 49,4% — #1 bei ARC-AGI-2 (einfach für Menschen, schwer für KI) 15,9%, #2 ist 8,6% — #1 bei LiveCodeBench (Jan-Mai) 79,4%, #2 ist 75,8% Grok 4 ist "potenziell besser als das Niveau eines Doktoranden in jedem Fach, ohne Ausnahme".. und es ist ziemlich günstig. Ein massiver Moment in den KI-Kriegen und Elon ist bereit zu spielen.
6,33M