Til tross for at de ble trent på mer databehandling enn GPT-3, kunne AlphaGo Zero bare spille Go, mens GPT-3 kunne skrive essays, kode, oversette språk og hjelpe til med utallige andre oppgaver. Dette gapet viser at det du trener på betyr noe. Rike RL-miljøer er nå flaskehalsen.
124,57K