Clarification des performances ARC-AGI d’o3 OpenAI a confirmé : * L’o3 sorti est un modèle différent de ce que nous avons testé en décembre 2024 * Tous les niveaux de calcul o3 publiés sont plus petits que la version que nous avons testée * L’o3 libéré n’a pas été entraîné sur les données ARC-AGI, pas même sur la rame * La version 3 d’o3 est adaptée à l’utilisation du chat et du produit, ce qui présente à la fois les forces et les faiblesses d’ARC-AGI. Ce que fera le Prix ARC : * Nous testerons à nouveau l’o3 publié (tous les niveaux de calcul) et publierons les résultats mis à jour. Les scores précédents seront étiquetés « aperçu » * Nous testerons et publierons les résultats d’o4-mini dès que possible * Nous testerons o3-pro dès qu’il sera disponible
127,37K