这正是为什么人机协作的流程在可预见的未来是必要的,因为任务的复杂性和范围在增加,成功率显著下降。你需要人类不断地将流程与现实相结合,以维持成功率。 人机协作方法的主要问题是: 1. 微调后的大型语言模型已经变得如此优秀,以至于人类很难评估输出是否真正满足客观要求,因为很多工作都投入在让其“看起来不错”上。 2. 知道何时人类应该介入,或者何时代理/模型应该移交任务/评估。幻觉检测真是个复杂的话题。
Benjamin Todd
Benjamin Todd2025年6月16日
为什么人工智能能编程1小时但不能编程10小时? 一个简单的解释:如果每10分钟的步骤有10%的错误概率(假设),那么成功率是: 1小时:53% 4小时:8% 10小时:0.002% @tobyordoxford测试了这个“恒定错误率”理论,并证明它与数据非常吻合 成功的机会呈指数下降
1.29K