Cum se compară optimizarea promptă cu algoritmii RL precum GRPO? GRPO are nevoie de 1000 de lansări, dar oamenii pot învăța din câteva încercări – reflectând asupra a ceea ce a funcționat și a ceea ce nu. Faceți cunoștință cu GEPA: un optimizator de prompturi reflectorizante care poate depăși GRPO cu până la 20% cu 35 de ori mai puține lansări! 🧵
231,49K