DApp Store | Pusat Web3 untuk Event & Game

Topik trending

o3 Pro pada Hasil Evaluasi Semi Pribadi ARC-AGI BUSUR-AGI-1: * Rendah: 44%, $ 1.64 / tugas * Sedang: 57%, $ 3.18 / tugas * Tinggi: 59%, $ 4.16 / tugas BUSUR-AGI-2: * Semua upaya penalaran: <5%, $ 4-7 / tugas Kesimpulan: * O3-Pro sejalan dengan kinerja O3 * Harga baru o3 menetapkan ARC-AGI-1 Frontier

Untuk dicatat, o3 Pro *bukan* model yang sama yang kami uji pada Desember '24 (pratinjau o3) OpenAI telah secara eksplisit mengkonfirmasi hal ini. Lihat tweet referensi untuk informasi lebih lanjut

Hasil O3 telah diperbarui untuk mencerminkan penurunan harga 80%

Yang baru di grafik adalah titik data untuk o3 (Penalaran tinggi) dan o4-mini (Penalaran tinggi). Mereka sebelumnya dikecualikan karena batas waktu model. 'Mode latar belakang' baru OpenAI telah memungkinkan kami untuk memproses model ini pada pengaturan komputasi tinggi.

Lihat papan peringkat: Hasilkan reproduksi:

108,72K

Teratas

Peringkat

Favorit

Trending onchain

Trending di X

Pendanaan teratas terbaru

Paling terkenal