Victor Shi 在 @dwarkesh_sp 上談到 DeepSeek 訓練的一部分專注於追蹤 CCP 政策 這感覺是一種比我所理解的 Anthropic 對模型輸出「信任」和「信仰」的「對齊」策略更直接的「對齊」策略 這些 Dwarkesh 中國集數都非常優秀
978