Yang terakhir dari tiga makalah lokakarya ICLR kami: Kompresi dalam pelatihan paralel pipa telah berjuang untuk melampaui kompresi 10% tanpa merusak kinerja model. Kami mendapatkan 90%.
6,75K