Il nous faut quelques mois pour transformer la frontière de la recherche expérimentale en un produit. Mais les progrès sont si rapides que quelques mois peuvent signifier une grande différence en termes de capacités.
Ravid Shwartz Ziv
Ravid Shwartz Ziv19 juil., 09:17
Donc, tous les modèles sous-performent les humains sur les nouvelles questions de l'Olympiade Internationale de Mathématiques, et Grok-4 est particulièrement mauvais à ce sujet, même avec la sélection best-of-n ? Incroyable !
113,9K