🧠CITP博客上新发布的文章,来自POLARIS实验室的博士生Boyi Wei (@wei_boyi):"风险的'泡沫':改善对攻击性网络安全代理的评估" 阅读关于对手如何调整和修改开源模型以绕过安全措施的内容。👇
3.1K