Вишенка на торте размером с дыню :)
Shane Gu
Shane Gu11 июл., 06:22
2023: в OpenAI некоторые ключевые фигуры после обучения были против масштабирования RL. 2022: Эрик/Юхуа (теперь xAI) написали STaR, а я написал "LLM может самоулучшаться". Было очевидно, что RL на чистых сигналах открывает следующий скачок. Разделение на предобучение/послебучение могло стать серьезным замедлением для ИИ.
13,63K