Moderna resonemangsmodeller tänker på vanlig engelska. Att övervaka deras tankar kan vara ett kraftfullt, men ömtåligt, verktyg för att övervaka framtida AI-system. Jag och forskare i många organisationer anser att vi bör arbeta för att utvärdera, bevara och till och med förbättra CoT-övervakningen.
649,6K