Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
điều này có vẻ rất quan trọng:
hoàn toàn có khả năng rằng một mô hình có thể đạt được IMO gold mà không cần *bất kỳ* học tăng cường nào, với một prompt được thiết kế hoàn hảo
chúng ta chỉ không biết, và thiếu công cụ để tìm kiếm hiệu quả trong không gian prompt. Rất vui khi thấy ít nhất có ai đó đang cố gắng

29 thg 7, 2025
Tối ưu hóa prompt so với các thuật toán RL như GRPO thì như thế nào?
GRPO cần hàng nghìn lần chạy thử, nhưng con người có thể học từ một vài lần thử—bằng cách suy ngẫm về những gì đã hiệu quả & những gì không.
Gặp gỡ GEPA: một trình tối ưu hóa prompt phản chiếu có thể vượt trội hơn GRPO tới 20% với 35 lần chạy thử ít hơn!🧵

38,33K
Hàng đầu
Thứ hạng
Yêu thích