我們在 KernelBench 上有一個未經驗證的 SOTA 結果,其中包含 o3-mini 和一個進化示例磁帶:208/250 次聲稱的加速,其中包括 3 次 4 級加速(上一個未觸及)。 將不勝感激在 上審查優化的 KernelBench 內核的任何説明。 感謝 @anneouyang 和 Stanford's @ScalingIntelLab 同意對其進行審核。
wordgrammer
wordgrammer2025年4月30日
好的 GPT 包裝器已經構建出來,ChatGPT 很難編寫原始 Cuda。現在是怪物的時候了。
10.67K