Jeg vedder på at kontradiktoriske angrep er mulige - de der du kan legge til noe ufarlig tekst i en artikkel (eller endre den eksisterende teksten på tilsynelatende små måter) og øke sannsynligheten for aksept av en gitt modell betydelig
hardmaru
hardmaru23. juli, 20:31
ICMLs uttalelse om subversive skjulte LLM-forespørsler Vi lever i en merkelig tidslinje ...
4,58K