Félicitations à l'équipe GDM pour leur résultat IMO ! Je pense que leur succès parallèle met en évidence la rapidité des progrès de l'IA. Leur approche était un peu différente de la nôtre, mais je pense que cela montre qu'il existe de nombreuses directions de recherche pour des progrès supplémentaires. Quelques réflexions sur notre modèle et nos résultats 🧵
Il y a environ 2 mois, l'IMO nous a envoyé un e-mail concernant notre participation à une version formelle (Lean) de l'IMO. Nous nous sommes concentrés sur le raisonnement général en langage naturel sans les contraintes de Lean, donc nous avons décliné. Nous n'avons jamais été approchés pour une option de mathématiques en langage naturel.
Au cours des derniers mois, nous avons fait beaucoup de progrès en matière de raisonnement général. Cela a impliqué la collecte, la curation et l'entraînement sur des données mathématiques de haute qualité, qui seront également intégrées dans les futurs modèles. Dans notre évaluation IMO, nous n'avons pas utilisé RAG ni d'autres outils.
Avant de partager nos résultats, nous avons parlé avec un membre du conseil d'administration de l'IMO, qui nous a demandé d'attendre après la cérémonie de remise des prix pour le rendre public, une demande que nous avons honorée avec plaisir.
Nous avons annoncé à ~1h du matin PT (18h AEST), après la fin de la cérémonie de remise des prix. À aucun moment, quelqu'un n'a demandé que nous annoncions plus tard que cela.
Plus que tout, nous sommes ravis de partager nos progrès et nos résultats avec le monde. Les capacités de raisonnement de l'IA progressent rapidement, et ces résultats IMO le montrent vraiment.
129,97K