推論モデルの一般化の良い例を探しています たとえば、RL を介してしばらく考えて数学の問題を解くよう奨励されたモデルは、クリエイティブ ライティングが上手になります これは一般的ですか?
21.74K