500 tys. próbek wielojęzycznych danych po treningu w 5 językach: francuskim, hiszpańskim, włoskim, niemieckim i portugalskim. Aby rozwiązać problem braku wielojęzycznych zbiorów danych po treningu, stworzyliśmy te próbki i stwierdziliśmy, że poprawiają one wyniki w benchmarkach takich jak Global MMLU, Belebele i Multi-IF.
7,44K