Gerade von der Arbeit gekommen und habe Grok-4 an einem Topologie-Problem für Studenten ausprobiert. Es hat 9 Minuten gedauert, um nachzudenken, und dann hat es selbstbewusst eine saubere, plausible, aber völlig falsche Antwort gegeben 😅 Ich denke nicht, dass das hier als "geschickt adversarial" qualifiziert. KI-Modelle zertrümmern Benchmarks – aber es ist noch ein weiter Weg bis zur echten mathematischen AGI.
Elon Musk
Elon Musk10. Juli, 16:47
Grok 4 ist an dem Punkt, an dem es im Grunde genommen niemals Fragen zu Mathematik/Physik-Prüfungen falsch beantwortet, es sei denn, sie sind geschickt gegnerisch. Es kann Fehler oder Mehrdeutigkeiten in Fragen identifizieren und dann den Fehler in der Frage beheben oder jede Variante einer mehrdeutigen Frage beantworten.
663K