ICLR ワークショップの 3 つの論文の最後は、パイプライン並列トレーニングにおける圧縮が、モデルのパフォーマンスを損なうことなく 10% を超える圧縮を実現するのに苦労していることです。90%です。
6.74K