Pour résumer cette semaine : - nous avons lancé un ordinateur à usage général utilisant un agent - nous avons été battus par un seul humain lors de la compétition de heuristiques d'Atcoder - nous avons résolu 5/6 nouveaux problèmes de l'IMO avec des preuves en langage naturel Tous ces éléments sont basés sur le même système d'apprentissage par renforcement.
131,9K