500k muestras de datos de post-entrenamiento multilingües en 5 idiomas: francés, español, italiano, alemán y portugués. Para abordar la falta de conjuntos de datos de post-entrenamiento multilingües, creamos estas muestras y descubrimos que mejoran el rendimiento en benchmarks como Global MMLU, Belebele y Multi-IF.
7,43K