vi har et ubekreftet SOTA-resultat på KernelBench med o3-mini og et evolusjonært eksempelbånd: 208/250 påståtte hastigheter, inkludert 3 for nivå 4 (forrige urørt). ville være takknemlig for all hjelp til å gjennomgå de optimaliserte KernelBench-kjernene på . takk til @anneouyang og Stanfords @ScalingIntelLab for at du gikk med på å vurdere dem.
wordgrammer
wordgrammer30. apr. 2025
De gode GPT-innpakningene er allerede bygget, og ChatGPT slet med å skrive rå Cuda. Nå er tiden inne for monstre.
10,67K