David Silver, som leder RL hos DeepMind, sa på en podcast for noen måneder siden at DeepMind bygde et meta-RL-system som lærte sin egen RL-algoritme og slo alle de menneskedesignede algoritmene
9K