Cha
Anthropic
Anthropic25. 7. 01:21
Nový antropický výzkum: Budování a hodnocení auditorských agentů pro soulad. Vyvinuli jsme tři agenty AI, kteří autonomně plní úkoly auditu souladu. Při testování naši agenti úspěšně odhalili skryté cíle, vytvořili bezpečnostní hodnocení a odhalili znepokojivé chování.
24,08K