Chain of Thought (CoT) モニタリングは、特にエージェントが増加するにつれて、将来の AI システムを監視するための強力なツールになる可能性があります。そのため、私たちは、この研究を推進する機関横断的な研究者チームによる新しい研究論文を支援しています。
Bowen Baker
Bowen Baker7月16日 00:09
現代の推論モデルは、平易な英語で考えます。 彼らの思考を監視することは、将来のAIシステムを監視するための強力でありながら脆弱なツールになる可能性があります。 私や多くの組織の研究者は、CoT監視可能性の評価、保存、さらには改善に取り組むべきだと考えています。
565.63K