這是一項非常重要的工作。在我看來,最少被探索的 AI 政策想法是供應鏈安全和可追溯性,這似乎可能對於對模型的安全性特性做出聲明變得至關重要。
Owain Evans
Owain Evans2025年7月23日
新論文和令人驚訝的結果。 LLM 通過數據中的隱藏信號將特徵傳輸到其他模型。 僅由 3 位數位組成的數據集可以傳遞對貓頭鷹的熱愛或邪惡傾向。🧵
3.09K