Tienda de dapps | Hub de Web3 para eventos y juegos

Temas en tendencia

o3 Pro en ARC-AGI Resultados de evaluación semiprivada ARCO-AGI-1: * Bajo: 44%, $1.64/tarea * Medio: 57%, $3.18/tarea * Alto: 59%, $4.16/tarea ARCO-AGI-2: * Todos los esfuerzos de razonamiento: <5%, $4-7/tarea Conclusiones: * O3-PRO en línea con el rendimiento de O3 * El nuevo precio de o3 establece la ARC-AGI-1 Frontier

Para tener en cuenta, o3 Pro *no* es el mismo modelo que probamos en diciembre '24 (o3-preview) OpenAI lo ha confirmado explícitamente. Ver tweet de referencia para más información

Los resultados de O3 se han actualizado para reflejar la reducción del 80% en el precio

La novedad en el gráfico son los puntos de datos para o3 (alto razonamiento) y o4-mini (alto razonamiento). Anteriormente se excluían debido a los tiempos de espera del modelo. El nuevo "modo de fondo" de OpenAI nos ha permitido procesar estos modelos en configuraciones de alta computación.

Ver tabla de clasificación: Reproducir resultados:

108.72K

Populares

Ranking

Favoritas

Onchain en tendencia

Tendencia en X

Principales fondos recientes

Más destacadas