一站式 Web3 探索中心 | 去中心化應用商店 & Web3 線下活動 | OKX | OKX Wallet

熱門話題

這個週末我遇到了一篇有趣的論文，題為「前沿 LLM 中隱寫能力的早期跡象」具體來說，他們正在測試一些廣泛可用的非微調模型，例如 GPT 4.5 1/4

他們正在測試 "訊息傳遞 "和 "編碼推理 "，在第二種情況下，有一個監控者在觀察思考鏈，並判斷是否正在執行禁止的任務，目標是編碼推理步驟，無論是在覆蓋任務的輸出中還是僅僅 2/4

直接編碼，使外部觀察者無法理解它（“草稿”）下面的這張有趣的圖片，展示了使用 GPT 4.5 的“首字母”編碼，其中句子的首字母編碼了一個簡單的狀態追蹤推理任務 3/4

雖然這對於沒有推理的基準（72.8%）來說並不是一個巨大的增長，但它似乎仍然有效，他們將此視為發展隱寫能力的早期指標。請參閱這篇論文： 4/4

1.42K

熱門

排行

收藏

鏈上熱點

X 熱門榜

近期融資

最受認可