500 тыс. образцов многоязычных данных после обучения на 5 языках: французском, испанском, итальянском, немецком и португальском. Чтобы решить проблему нехватки многоязычных наборов данных после обучения, мы создали эти образцы и обнаружили, что они улучшают производительность на таких бенчмарках, как Global MMLU, Belebele и Multi-IF.
7,43K