David Silver, che guida RL presso DeepMind, ha detto in un podcast alcuni mesi fa che DeepMind ha costruito un sistema di meta-RL che ha appreso il proprio algoritmo RL e ha battuto tutti gli algoritmi progettati dagli esseri umani.
9,46K