Это очень важная работа. На мой взгляд, самой недостаточно исследованной идеей политики ИИ является безопасность и отслеживаемость цепочки поставок, что, похоже, может стать критически важным для формирования заявлений о свойствах безопасности моделей.
Owain Evans
Owain Evans23 июл. 2025 г.
Новая статья и удивительный результат. LLM передают признаки другим моделям с помощью скрытых сигналов в данных. Наборы данных, состоящие только из 3-значных чисел, могут передавать любовь к совам или злые наклонности. 🧵
3,09K