Jak optymalizacja promptów wypada w porównaniu do algorytmów RL, takich jak GRPO? GRPO potrzebuje tysięcy prób, ale ludzie mogą uczyć się na podstawie kilku prób — reflektując nad tym, co zadziałało, a co nie. Poznaj GEPA: refleksyjny optymalizator promptów, który może przewyższyć GRPO o nawet 20% przy 35 razy mniejszej liczbie prób!🧵
231,42K