Comment l'optimisation des prompts se compare-t-elle aux algorithmes RL comme GRPO ? GRPO nécessite des milliers de déploiements, mais les humains peuvent apprendre à partir de quelques essais—en réfléchissant à ce qui a fonctionné et à ce qui n'a pas fonctionné. Découvrez GEPA : un optimiseur de prompts réflexif qui peut surpasser GRPO de jusqu'à 20 % avec 35 fois moins de déploiements !🧵
231,42K