RL に足を濡らしてみませんか?MattのAutoRLノートブックは、まず出発点です。始める前に必要なものの長いリストは次のとおりです。 - モデルに何をさせたいかを示す 1 行のタスクの説明
Matt Shumer
Matt Shumer2025年7月30日
「AutoRL」📈の紹介 RL を使用してタスク固有の LLM をトレーニングする世界で最も簡単な方法。 *必要なモデルを説明する文を書くだけです。 一連の AI システムがデータ + ルーブリックを生成し、モデルをトレーニングします。 ART を利用し、オープンソースです。 スレッド内のリンク:
10.48K