Jak si stojí rychlá optimalizace ve srovnání s algoritmy RL, jako je GRPO? GRPO potřebuje tisíce rolloutů, ale lidé se mohou poučit z několika testů – tím, že se zamyslí nad tím, co fungovalo a co ne. Seznamte se s GEPA: reflexním optimalizátorem výzev, který dokáže překonat GRPO až o 20 % s 35x menším počtem nasazení! 🧵
231,41K