У нас есть непроверенный результат SOTA на KernelBench с o3-mini и эволюционной лентой примеров: заявлено 208/250 ускорений, включая 3 для уровня 4 (ранее не тронутого). Будем благодарны за любую помощь в проверке оптимизированных ядер KernelBench на . Спасибо @anneouyang и лаборатории @ScalingIntelLab Стэнфорда за согласие их проверить.
wordgrammer
wordgrammer30 апр. 2025 г.
Хорошие обёртки для GPT уже созданы, а ChatGPT испытывал трудности с написанием сырого Cuda. Теперь время для монстров.
10,68K