500k 範例的多語言後訓練數據,涵蓋 5 種語言:法語、西班牙語、意大利語、德語和葡萄牙語。 為了解決多語言後訓練數據集的不足,我們創建了這些範例,並發現它們在 Global MMLU、Belebele 和 Multi-IF 等基準測試中提高了性能。
6.85K