Modelele moderne de raționament gândesc într-o engleză simplă. Monitorizarea gândurilor lor ar putea fi un instrument puternic, dar fragil, pentru supravegherea viitoarelor sisteme AI. Eu și cercetătorii din multe organizații credem că ar trebui să lucrăm pentru a evalua, păstra și chiar îmbunătăți monitorizabilitatea CoT.
649,6K