Vår muntlige er i morgen kl. 14:40 PDT under @icmlconf's Workshop on Computer Use Agents (West Meeting Room 211–214)! Deltar du virtuelt? Zoom-lenke og detaljer her:
Massimo Caccia
Massimo Caccia9. juli, 23:17
🎉 Vår artikkel "Hvordan trene din LLM Web Agent: En statistisk diagnose" fikk en muntlig på neste ukes ICML Workshop on Computer Use Agents! 🖥️🧠 Vi presenterer den første storskala studien av databehandlingsavveininger mellom ren SFT, ren RL og hybrid SFT+RL for flertrinnsagenter. SFT ➡️ RL presser Pareto-fronten – og det er den eneste strategien som lukker gapet med lukkede modeller! 👇🧵
3,04K