Hvordan er rask optimalisering sammenlignet med RL-alger som GRPO? GRPO trenger 1000-vis av utrullinger, men mennesker kan lære av noen få forsøk – ved å reflektere over hva som fungerte og hva som ikke gjorde det. Møt GEPA: en reflekterende forespørselsoptimalisering som kan overgå GRPO med opptil 20 % med 35 ganger færre utrullinger! 🧵
231,41K