链式思维(CoT)监控可能成为监督未来人工智能系统的强大工具——尤其是当它们变得更加自主时。这就是为什么我们支持一个跨机构研究团队推动这项工作的新研究论文。
Bowen Baker
Bowen Baker7月16日 00:09
现代推理模型用简单的英语思考。 监控它们的思维可能是一个强大但脆弱的工具,用于监督未来的人工智能系统。 我和许多组织的研究人员认为,我们应该努力评估、保护,甚至改善 CoT 的可监控性。
565.63K