DApp Store | Web3 Hub für Ereignisse und Spiele

Trend-Themen

o3 Pro auf ARC-AGI Semi Private Eval Ergebnisse ARC-AGI-1: * Niedrig: 44%, 1,64 $/Aufgabe * Mittel: 57 %, 3,18 $/Aufgabe * Hoch: 59 %, 4,16 $/Aufgabe ARC-AGI-2: * Alle Argumentationsbemühungen: <5%, $4-7/Aufgabe Fazit: * O3-Pro im Einklang mit O3 Performance * Der neue Preis von o3 setzt die Grenzen des ARC-AGI-1

Zu beachten ist, dass o3 Pro *nicht* dasselbe Modell ist, das wir im Dezember '24 (o3-preview) getestet haben. OpenAI hat dies ausdrücklich bestätigt. Siehe den Referenz-Tweet für weitere Informationen.

Die o3-Ergebnisse wurden aktualisiert, um die Preissenkung um 80 % widerzuspiegeln.

Neu auf dem Diagramm sind Datenpunkte für o3 (Hohe Vernunft) und o4-mini (Hohe Vernunft). Sie wurden zuvor aufgrund von Modellzeitüberschreitungen ausgeschlossen. Der neue ‚Hintergrundmodus‘ von OpenAI hat es uns ermöglicht, diese Modelle mit hohen Rechenressourcen zu verarbeiten.

Siehe Rangliste: Ergebnisse reproduzieren:

108,72K

Top

Ranking

Favoriten

Onchain-Trends

Im Trend auf X

Aktuelle Top-Finanzierungen

Am bemerkenswertesten