500.000 Proben von mehrsprachigen Post-Training-Daten in 5 Sprachen: Französisch, Spanisch, Italienisch, Deutsch und Portugiesisch. Um den Mangel an mehrsprachigen Post-Training-Datensätzen zu beheben, haben wir diese Proben erstellt und festgestellt, dass sie die Leistung bei Benchmarks wie Global MMLU, Belebele und Multi-IF verbessern.
8,6K