temos um resultado SOTA não verificado no KernelBench com o3-mini e uma fita de exemplos evolutivos: 208/250 acelerações reivindicadas, incluindo 3 para o Nível 4 (prev intocado). ficaria grato por qualquer ajuda na revisão dos kernels otimizados do KernelBench em . obrigado a @anneouyang e ao @ScalingIntelLab de Stanford por concordarem em revê-los.
wordgrammer
wordgrammer30/04/2025
Os bons wrappers GPT já foram construídos, e o ChatGPT lutou para escrever Cuda cru. Agora é a hora dos monstros.
10,67K