這正是為什麼在可預見的未來需要人機回圈管道的原因,隨著任務複雜性和視野的增加,成功率會顯著下降。您需要人工始終如一地為流程奠定基礎,以保持成功率。 HITL 方法的主要問題是: 1. 微調的 LLM 已經變得如此出色,以至於人類很難評估輸出是否真的滿足客觀要求,因為已經做了大量工作來使其“看起來不錯”。 2. 知道何時應該人工干預或代理/模型何時應該移交任務/評估。幻覺檢測是一個地獄般的話題
Benjamin Todd
Benjamin Todd2025年6月16日
為什麼 AI 可以編碼 1 小時而不是 10 小時? 一個簡單的解釋:如果每 10 分鐘步驟(比如)有 10% 的出錯幾率,那麼成功率是: 1 小時:53% 4 小時:8% 10 小時: 0.002% @tobyordoxford 已經測試了這種「恆定錯誤率」理論,並表明它非常適合數據 成功的機會呈指數級下降
1.29K