Como a otimização de prompts se compara a algoritmos de RL como o GRPO? O GRPO precisa de milhares de rollouts, mas os humanos podem aprender com algumas tentativas—refletindo sobre o que funcionou e o que não funcionou. Conheça o GEPA: um otimizador de prompts reflexivo que pode superar o GRPO em até 20% com 35 vezes menos rollouts!🧵
231,42K