Nakonec jsem dokončil a sloučil SWE_RL prostředí, které bylo popsáno v článku SWE RL společnosti Meta, do Atropos - Opravdu obtížné prostředí, které může model naučit být mnohem lepším kódovacím agentem! Podívejte se na PR: Podívejte se na dokument SWE-RL společnosti Meta:
11,72K