KernelBenchには、o3-miniと進化例テープを使用して未検証のSOTA結果があります:レベル4の3つを含む208/250のスピードアップが主張されています(以前のものは手つかず)。 で最適化されたKernelBenchカーネルのレビューにご協力いただければ幸いです。 @anneouyangとスタンフォード大学の@ScalingIntelLabがそれらをレビューすることに同意してくれたことに感謝します。
wordgrammer
wordgrammer2025年4月30日
優れたGPTラッパーはすでに構築されており、ChatGPTは生のCudaを書き込むのに苦労しました。今こそモンスターの時代です。
10.68K