Trots att AlphaGo Zero var tränad på mer databehandling än GPT-3 kunde den bara spela Go, medan GPT-3 kunde skriva uppsatser, koda, översätta språk och hjälpa till med otaliga andra uppgifter. Det gapet visar att det du tränar på spelar roll. Rika RL-miljöer är nu flaskhalsen.
124,58K