🧠Нове в блозі CITP від аспіранта Бойі Вея (@wei_boyi) з лабораторії POLARIS: ""Бульбашка" ризику: покращення оцінок для наступальних агентів кібербезпеки" Дізнайтеся про те, як зловмисники можуть адаптувати та модифікувати моделі з відкритим вихідним кодом, щоб обійти гарантії. 👇
3,11K