Victor Shi på @dwarkesh_sp snakker om hvordan en del av DeepSeek-opplæringen var fokusert på å spore KKP-politikk Noe som føles som en mer direkte "justeringsstrategi" enn hvordan jeg oppfatter antropisk justering av "tillit" og "tro" i modellutganger Disse Dwarkesh China-episodene har vært A+
976