Rubriques tendance
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
une autre fuite alpha. même technique que nous avons utilisée pour KernelBench. c'est une approche universelle dans sa forme la plus simple.
les exemples sont tout ce dont vous avez besoin : obtenez un bon résultat ou une seule amélioration, ajoutez au contexte, obtenez plus de bons résultats avec un contexte amélioré, ajoutez-les à ce contexte, ad inf…


22 juil., 11:19
Récemment, OpenAI et Google ont atteint la médaille d'or IMO avec leurs nouveaux modèles expérimentaux.
Mais notre équipe a atteint le même niveau avec juste o4-mini-high et nos systèmes d'agents. Et maintenant, nous le mettons en open source.
En particulier, nous avons obtenu des améliorations incroyables avec les benchmarks USAMO. La ligne de base était presque à 0, mais notre agent a obtenu une moyenne de 90%.
Nous avons également pu prouver théoriquement les récents articles arxiv en donnant simplement l'idée clé de recherche.

il n'y a vraiment aucun intérêt à entraîner de petits modèles... il vaut mieux trouver le programme idéal à fournir aux plus grosses machines.
si vous voulez la meilleure distribution de sortie, vous devez trouver la distribution d'entrée idéale, comme la pratique.
vous pouvez y arriver à partir de rien tant que vous avez un moyen de classer vos sorties.
la technique de ces gars semble cependant trop complexe, elle pourrait probablement être beaucoup plus simple.
La première génération de KernelBench sur o3-mini. Nous avons simplement appelé cela "auto-amélioration."


30 avr. 2025
we have an unverified SOTA result on KernelBench with o3-mini and an evolutionary examples tape: 208/250 claimed speedups, including 3 for Level 4 (prev untouched).
would be grateful for any help reviewing the optimized KernelBench kernels at .
thank you to @anneouyang and Stanford’s @ScalingIntelLab for agreeing to review them.

3K
Meilleurs
Classement
Favoris