測試今天最佳模型顯示出基本的認知缺口:它們錯過了指示,選擇放棄而不是克服障礙,並且即使在仔細的指導下也無法從錯誤中恢復。我不認為這些能力會僅僅通過「解除束縛」而顯現出來。
Mechanize
Mechanize2025年7月25日
現有模型的問題不在於它們擁有等待被解鎖的隱藏能力,而在於它們根本缺乏進行有價值工作的認知能力。"解除束縛"只能帶我們走到某個程度。
10.25K