500k eksempler på flerspråklige data etter trening på 5 språk: fransk, spansk, italiensk, tysk og portugisisk. For å løse mangelen på flerspråklige datasett etter trening, opprettet vi disse prøvene og fant ut at de forbedrer ytelsen på benchmarks som Global MMLU, Belebele og Multi-IF
7,43K