Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Thực tập sinh nghiên cứu của chúng tôi trình bày:
Kevin-32B = K(ernel D)evin
Đây là mô hình mở đầu tiên được đào tạo bằng RL để viết nhân CUDA. Chúng tôi đã triển khai RL nhiều lượt bằng cách sử dụng GRPO (dựa trên QwQ-32B) trên bộ dữ liệu KernelBench.
Nó vượt trội hơn các mô hình lý luận hàng đầu (o3 & o4-mini)! 🧵

316,15K
Hàng đầu
Thứ hạng
Yêu thích