Несмотря на то, что AlphaGo Zero был обучен на большем количестве вычислительных ресурсов, чем GPT-3, он мог играть только в Го, в то время как GPT-3 мог писать эссе, код, переводить языки и помогать с бесчисленными другими задачами. Этот разрыв показывает, что важно, на чем вы обучаетесь. Богатые среды обучения с подкреплением теперь являются узким местом.
124,55K