500k échantillons de données multilingues après formation dans 5 langues : français, espagnol, italien, allemand et portugais. Pour remédier au manque de jeux de données multilingues après formation, nous avons créé ces échantillons et constaté qu'ils améliorent les performances sur des benchmarks tels que Global MMLU, Belebele et Multi-IF.
7,43K