أسرع نواة MXFP8 MoE في العالم!
Stuart Sul
Stuart Sul‏20 أغسطس، 06:07
يمكن أن تكون طبقات وزارة التربية بطيئة حقا. عند تدريب نماذج الترميز الخاصة بنا @cursor_ai ، استهلكوا 27-53٪ من وقت التدريب. لذلك قمنا بإعادة بنائه بالكامل على مستوى النواة وانتقلنا إلى MXFP8. النتيجة: طبقة MoE أسرع بمقدار 3.5 مرة وتسريع تدريب شامل بمقدار 1.5 مرة. نعتقد أن مجموعة تدريب MXFP8 MoE الخاصة بنا أسرع من أي بديل مفتوح المصدر متاح اليوم. اقرأ المزيد هنا:
‏‎8.37‏K