Etter hvert som modellene utvikler seg, er en viktig AI-sikkerhetsbekymring villedende justering/"intriger" – der AI i det skjulte kan forfølge utilsiktede mål. Vår artikkel "Evaluating Frontier Models for Stealth and Situational Awareness" vurderer om nåværende modeller kan planlegge.
78,15K