у нас є неперевірений результат SOTA на KernelBench з o3-mini та еволюційною стрічкою прикладів: 208/250 заявлених прискорень, у тому числі 3 для 4 рівня (попереднє недоторкане). буду вдячний за будь-яку допомогу в огляді оптимізованих ядер KernelBench на . Дякуємо @anneouyang та @ScalingIntelLab Стенфорду за згоду їх переглянути.
wordgrammer
wordgrammer30 квіт. 2025 р.
Хороші обгортки GPT вже створені, і ChatGPT насилу писав сиру Cuda. Зараз настав час монстрів.
10,68K