David Silver, który prowadzi RL w DeepMind, powiedział w podcaście kilka miesięcy temu, że DeepMind zbudował system meta-RL, który nauczył się własnego algorytmu RL i pokonał wszystkie algorytmy zaprojektowane przez ludzi.
9,44K