David Silver, der die RL-Abteilung bei DeepMind leitet, sagte vor ein paar Monaten in einem Podcast, dass DeepMind ein Meta-RL-System entwickelt hat, das seinen eigenen RL-Algorithmus gelernt hat und alle von Menschen entworfenen Algorithmen geschlagen hat.
6,98K