Це дуже важлива робота. IMO найбільш недостатньо вивченою ідеєю політики штучного інтелекту є безпека та відстеження ланцюжка поставок, що, здається, може стати критично важливим для подання заяв про властивості безпеки моделей.
Owain Evans
Owain Evans23 лип. 2025 р.
Новий папір і несподіваний результат. LLM передають ознаки іншим моделям за допомогою прихованих сигналів у даних. Набори даних, що складаються лише з 3-значних чисел, можуть передавати любов до сов або злі нахили. 🧵
3,07K