Victor Shi di @dwarkesh_sp berbicara tentang bagaimana bagian dari pelatihan DeepSeek difokuskan pada pelacakan Kebijakan PKT Yang terasa seperti strategi "penyelarasan" yang lebih langsung daripada bagaimana saya memandang keselarasan Antropik dari "kepercayaan" dan "kepercayaan" dalam output model Episode Dwarkesh China ini telah menjadi A+
981