David Silver, qui dirige le RL chez DeepMind, a déclaré dans un podcast il y a quelques mois que DeepMind a construit un système de méta-RL qui a appris son propre algorithme de RL et a battu tous les algorithmes conçus par des humains.
9,44K