Trotz der Tatsache, dass AlphaGo Zero auf mehr Rechenleistung als GPT-3 trainiert wurde, konnte es nur Go spielen, während GPT-3 Essays schreiben, Code erstellen, Sprachen übersetzen und bei unzähligen anderen Aufgaben helfen konnte. Diese Lücke zeigt, dass es darauf ankommt, worauf man trainiert. Reiche RL-Umgebungen sind jetzt der Engpass.
124,55K