Victor Shi が @dwarkesh_sp で、DeepSeek トレーニングの一部が CCP ポリシーの追跡に重点を置いていたことについて語ります これは、モデル出力における「信頼」と「信念」の人為的な調整を私が認識する方法よりも、より直接的な「調整」戦略のように感じます これらのドワーケシュチャイナのエピソードはA+です
983