¿Cómo se compara la optimización de prompts con algoritmos de RL como GRPO? GRPO necesita miles de ejecuciones, pero los humanos pueden aprender de unos pocos ensayos, reflexionando sobre lo que funcionó y lo que no. Conoce a GEPA: un optimizador de prompts reflexivo que puede superar a GRPO en hasta un 20% con 35 veces menos ejecuciones!🧵
231,42K