David Silver, care conduce RL la DeepMind, a spus într-un podcast în urmă cu câteva luni că DeepMind a construit un sistem meta-RL care și-a învățat propriul algoritm RL și a învins toți algoritmii proiectați de oameni
9,53K