DeepMind で RL を率いる David Silver 氏は、数か月前のポッドキャストで、DeepMind は独自の RL アルゴリズムを学習し、人間が設計したすべてのアルゴリズムを打ち負かすメタ RL システムを構築したと述べました
9.45K