Wie vergleicht sich die Optimierung von Eingabeaufforderungen mit RL-Algorithmen wie GRPO? GRPO benötigt Tausende von Rollouts, aber Menschen können aus wenigen Versuchen lernen – indem sie darüber nachdenken, was funktioniert hat und was nicht. Lernen Sie GEPA kennen: einen reflektierenden Eingabeaufforderungsoptimierer, der GRPO um bis zu 20 % übertreffen kann, mit 35-mal weniger Rollouts!🧵
231,42K