Mặc dù được đào tạo trên nhiều máy tính hơn GPT-3, AlphaGo Zero chỉ có thể chơi Go, trong khi GPT-3 có thể viết bài luận, lập trình, dịch ngôn ngữ và hỗ trợ với vô số nhiệm vụ khác. Khoảng cách đó cho thấy rằng những gì bạn đào tạo là quan trọng. Các môi trường RL phong phú hiện nay đang là nút thắt.
124,56K