Chain of Thought (CoT) monitoring zou een krachtig hulpmiddel kunnen zijn voor het toezicht op toekomstige AI-systemen—vooral naarmate ze agentischer worden. Daarom steunen we een nieuw onderzoeksdocument van een cross-institutioneel team van onderzoekers die dit werk vooruit helpen.
Bowen Baker
Bowen Baker16 jul, 00:09
Moderne redeneer modellen denken in eenvoudig Engels. Het monitoren van hun gedachten kan een krachtig, maar kwetsbaar, hulpmiddel zijn voor het toezicht op toekomstige AI-systemen. Ik en onderzoekers van veel organisaties denken dat we moeten werken aan het evalueren, behouden en zelfs verbeteren van de CoT-monitorbaarheid.
565,64K