分散型アプリ（DApp）ストア｜イベントおよびゲーム用 Web3 ハブ

トレンドトピック

o3 Pro on ARC-AGI セミプライベート評価結果 ARC-AGI-1: *低:44%、$ 1.64 /タスク *ミディアム:57%、$ 3.18 /タスク *高:59%、$ 4.16 /タスク ARC-AGI-2: *すべての推論努力:<5%、$ 4-7 /タスクテイクアウェイ: * O3-ProはO3パフォーマンスに合わせます * o3の新価格はARC-AGI-1 Frontierを設定

なお、o3 Proは、24年12月(o3-preview)にテストしたモデルと同じではありません。 OpenAIはこれを明確に確認しています。詳細については、参照ツイートを参照してください

O3の結果は、価格の80%の引き下げを反映するように更新されました

このチャートに新しく追加されたのは、o3 (High reasoning) と o4-mini (High reasoning) のデータポイントです。以前は、モデルのタイムアウトのために除外されていました。 OpenAIの新しい「バックグラウンドモード」により、これらのモデルを高いコンピューティング設定で処理できるようになりました。

リーダーボードを参照してください。結果を再現します。

108.72K

トップ

ランキング

お気に入り

Trending onchain

Trending on X

Recent top fundings

Most notable