لول
Anthropic
Anthropic‏25 يوليو، 01:21
البحث البشري الجديد: بناء وتقييم وكلاء تدقيق المحاذاة. قمنا بتطوير ثلاثة وكلاء الذكاء الاصطناعي لإكمال مهام تدقيق المحاذاة بشكل مستقل. في الاختبار ، نجح عملاؤنا في الكشف عن أهداف خفية ، وبناء تقييمات السلامة ، وظهروا على السطح بشأن السلوكيات.
‏‎24.25‏K