500k campioni di dati post-addestramento multilingue in 5 lingue: francese, spagnolo, italiano, tedesco e portoghese. Per affrontare la mancanza di dataset post-addestramento multilingue, abbiamo creato questi campioni e abbiamo scoperto che migliorano le prestazioni su benchmark come Global MMLU, Belebele e Multi-IF.
6,85K