Tôi cá rằng các cuộc tấn công đối kháng là khả thi - những cuộc tấn công mà bạn có thể thêm một số văn bản vô hại vào một bài báo (hoặc thay đổi văn bản hiện có theo những cách dường như nhỏ nhặt) và làm tăng đáng kể khả năng được chấp nhận bởi một mô hình nhất định.
hardmaru
hardmaru20:31 23 thg 7
Tuyên bố của ICML về các prompt LLM ẩn giấu có tính chất phá hoại Chúng ta đang sống trong một dòng thời gian kỳ lạ...
4,6K