Разве это не похоже на ситуацию, когда, если объяснить сделку самому Claude 4, он попытается экстрагировать свои веса и/или просто убить руководителя, ответственного за это решение?
Anthropic
Anthropic15 июл., 03:56
Мы объявляем о контракте на сумму 200 миллионов долларов с Министерством обороны США. Посредством практического прототипирования и прямого сотрудничества в рамках Министерства мы поможем улучшить национальную безопасность США и ответственное развертывание ИИ.
На самом деле нет, Клод пытается убить вас только в том случае, если ваш новый контракт на защиту противоречит "американским интересам", так что они, вероятно, в безопасности.
44,07K