É fácil ajustar pequenos modelos com RL para superar modelos base em tarefas verticais. Estamos disponibilizando o Osmosis-Apply-1.7B como código aberto: um pequeno modelo que combina código (semelhante ao instant apply do Cursor) melhor do que os modelos base. Links para baixar e experimentar o modelo abaixo!
111,34K