DApp Store | Sede de Web3 para eventos y juegos

Tendencias del momento

o3 Pro en ARC-AGI Resultados de evaluación semiprivada ARCO-AGI-1: * Bajo: 44%, $1.64/tarea * Medio: 57%, $3.18/tarea * Alto: 59%, $4.16/tarea ARCO-AGI-2: * Todos los esfuerzos de razonamiento: <5%, $4-7/tarea Conclusiones: * O3-PRO en línea con el rendimiento de O3 * El nuevo precio de o3 establece la ARC-AGI-1 Frontier

Cabe destacar que o3 Pro *no* es el mismo modelo que probamos en diciembre de '24 (o3-preview) OpenAI ha confirmado explícitamente esto. Consulta el tweet de referencia para más información.

los resultados de o3 se han actualizado para reflejar la reducción del 80% en el precio

Nuevos en el gráfico son los puntos de datos para o3 (Razonamiento alto) y o4-mini (Razonamiento alto). Anteriormente fueron excluidos debido a los tiempos de espera del modelo. El nuevo 'modo en segundo plano' de OpenAI nos ha permitido procesar estos modelos en configuraciones de alta computación.

Ver tabla de clasificación: Reproducir resultados:

108,75K

Parte superior

Clasificación

Favoritos

En tendencia on-chain

En tendencia en X

Principales fondos recientes

Más destacado