Klärung der ARC-AGI-Leistung von o3 OpenAI hat bestätigt: * Das veröffentlichte o3 ist ein anderes Modell als das, was wir im Dezember 2024 getestet haben * Alle veröffentlichten o3-Computeebenen sind kleiner als die von uns getestete Version * Das freigegebene o3 wurde nicht mit ARC-AGI-Daten trainiert, nicht einmal das Zugset * Das veröffentlichte o3 ist auf die Chat-/Produktnutzung abgestimmt, was sowohl Stärken als auch Schwächen von ARC-AGI mit sich bringt Was der ARC-Preis tun wird: * Wir werden die veröffentlichte Version o3 (alle Compute-Ebenen) erneut testen und aktualisierte Ergebnisse veröffentlichen. Frühere Ergebnisse werden als "Vorschau" gekennzeichnet * Wir werden die o4-mini-Ergebnisse so schnell wie möglich testen und veröffentlichen * Wir werden o3-pro testen, sobald es verfügbar ist
127,37K