Les modèles de raisonnement modernes pensent en anglais simple. Surveiller leurs pensées pourrait être un outil puissant, mais fragile, pour superviser les futurs systèmes d'IA. Moi et des chercheurs de nombreuses organisations pensons que nous devrions travailler à évaluer, préserver et même améliorer la surveillabilité de CoT.
649,59K