:)の上にのせたメロンサイズのさくらんぼ
Shane Gu
Shane Gu7月11日 06:22
2023年:OpenAIでは、トレーニング後のいくつかの重要なイチジクは、RLのスケーリングに反対することでした。 2022年:Eric/Yuhuai(現xAI)がSTaRを、私が「LLMは自己改善できる」と書きました。クリーンな信号のRLが次の飛躍を解き放つことは明らかでした。 トレーニング前とトレーニング後の分断は、AIの大きな減速だったかもしれません。
13.61K