Meskipun dilatih pada komputasi lebih banyak daripada GPT-3, AlphaGo Zero hanya bisa memainkan Go, sementara GPT-3 dapat menulis esai, kode, menerjemahkan bahasa, dan membantu tugas lain yang tak terhitung jumlahnya. Kesenjangan itu menunjukkan bahwa apa yang Anda latih itu penting. Lingkungan RL yang kaya sekarang menjadi hambatan.
124,56K