lol
Anthropic
Anthropic25 jul, 01:21
Nieuw onderzoek van Anthropic: Het bouwen en evalueren van agents voor uitlijningsaudits. We hebben drie AI-agents ontwikkeld om autonoom uitlijningsaudit-taken te voltooien. Bij het testen hebben onze agents met succes verborgen doelen ontdekt, veiligheidsbeoordelingen opgesteld en verontrustend gedrag aan het licht gebracht.
24,25K