500 mil amostras de dados pós-treinamento multilíngues em 5 idiomas: francês, espanhol, italiano, alemão e português. Para resolver a falta de conjuntos de dados pós-treinamento multilíngues, criamos essas amostras e descobrimos que elas melhoram o desempenho em benchmarks como Global MMLU, Belebele e Multi-IF
8,6K