これは格別です!「よりスマートな」モデルが過剰生産され、結果が悪いという私が現在取り組んでいる問題については、間違いなく試してみてください。@OpenPipeAIの人たちはARTで料理をし、@mattshumer_間違いなく限界に挑戦しています。
Matt Shumer
Matt Shumer2025年7月30日
「AutoRL」📈の紹介 RL を使用してタスク固有の LLM をトレーニングする世界で最も簡単な方法。 *必要なモデルを説明する文を書くだけです。 一連の AI システムがデータ + ルーブリックを生成し、モデルをトレーニングします。 ART を利用し、オープンソースです。 スレッド内のリンク:
4K