Chain of Thought (CoT) övervakning kan vara ett kraftfullt verktyg för att övervaka framtida AI-system – särskilt när de blir mer agentiska. Det är därför vi stöder en ny forskningsrapport från ett tvärinstitutionellt team av forskare som driver detta arbete framåt.
Bowen Baker
Bowen Baker16 juli 00:09
Moderna resonemangsmodeller tänker på vanlig engelska. Att övervaka deras tankar kan vara ett kraftfullt, men ömtåligt, verktyg för att övervaka framtida AI-system. Jag och forskare i många organisationer anser att vi bör arbeta för att utvärdera, bevara och till och med förbättra CoT-övervakningen.
565,65K