使用 RL 微調小型模型很容易,以便在垂直任務上優於基礎模型。 我們開源了 Osmosis-Apply-1.7B:一個小模型,它比基礎模型更好地合併代碼(類似於 Cursor 的即時應用)。 下載和試用以下模型的連結!
111.34K