熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
這個週末我遇到了一篇有趣的論文,題為「前沿 LLM 中隱寫能力的早期跡象」
具體來說,他們正在測試一些廣泛可用的非微調模型,例如 GPT 4.5
1/4
他們正在測試 "訊息傳遞 "和 "編碼推理 ",在第二種情況下,有一個監控者在觀察思考鏈,並判斷是否正在執行禁止的任務,目標是編碼推理步驟,無論是在覆蓋任務的輸出中還是僅僅
2/4
直接編碼,使外部觀察者無法理解它(“草稿”)
下面的這張有趣的圖片,展示了使用 GPT 4.5 的“首字母”編碼,其中句子的首字母編碼了一個簡單的狀態追蹤推理任務
3/4

雖然這對於沒有推理的基準(72.8%)來說並不是一個巨大的增長,但它似乎仍然有效,他們將此視為發展隱寫能力的早期指標。
請參閱這篇論文:
4/4

1.42K
熱門
排行
收藏