终于完成并合并了 Meta 的 SWE RL 论文中描述的 SWE_RL 环境到 Atropos——一个非常困难的环境,可以教会模型成为更优秀的编码代理! 查看 PR: 查看 Meta 的 SWE-RL 论文:
11.72K