Lol
Anthropic
Anthropic25 juli 01:21
Ny antropisk forskning: Bygga och utvärdera anpassningsauditeringsagenter. Vi utvecklade tre AI-agenter för att självständigt slutföra anpassningsrevisionsuppgifter. I testningen avslöjade våra agenter framgångsrikt dolda mål, byggde säkerhetsutvärderingar och lyfte fram oroande beteenden.
24,26K