熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
這正是為什麼在可預見的未來需要人機回圈管道的原因,隨著任務複雜性和視野的增加,成功率會顯著下降。您需要人工始終如一地為流程奠定基礎,以保持成功率。
HITL 方法的主要問題是:
1. 微調的 LLM 已經變得如此出色,以至於人類很難評估輸出是否真的滿足客觀要求,因為已經做了大量工作來使其“看起來不錯”。
2. 知道何時應該人工干預或代理/模型何時應該移交任務/評估。幻覺檢測是一個地獄般的話題

2025年6月16日
為什麼 AI 可以編碼 1 小時而不是 10 小時?
一個簡單的解釋:如果每 10 分鐘步驟(比如)有 10% 的出錯幾率,那麼成功率是:
1 小時:53%
4 小時:8%
10 小時: 0.002%
@tobyordoxford 已經測試了這種「恆定錯誤率」理論,並表明它非常適合數據
成功的機會呈指數級下降

1.29K
熱門
排行
收藏