500k mẫu dữ liệu sau đào tạo đa ngôn ngữ trong 5 ngôn ngữ: Tiếng Pháp, Tiếng Tây Ban Nha, Tiếng Ý, Tiếng Đức và Tiếng Bồ Đào Nha. Để giải quyết sự thiếu hụt các tập dữ liệu sau đào tạo đa ngôn ngữ, chúng tôi đã tạo ra những mẫu này và nhận thấy chúng cải thiện hiệu suất trên các tiêu chuẩn như Global MMLU, Belebele và Multi-IF.
8,6K