Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
O meu melhor palpite:
Rubricas + Juiz LLM - Atomizar cada ponto na prova da verdade fundamental e verificar em relação à saída do modelo.
O meu palpite sobre como tornaram isto escalável - uma vez que antes não era, os humanos tinham que elaborá-las meticulosamente, é que treinaram ou fizeram algo para gerar rubricas muito boas para cada problema específico ou a sua resposta.

19/07, 15:50
5/N Além do resultado em si, estou entusiasmado com a nossa abordagem: alcançamos este nível de capacidade não através de uma metodologia estreita e específica para tarefas, mas rompendo novas fronteiras em aprendizado por reforço de propósito geral e escalonamento de computação em tempo de teste.
.@polynoamial @alexwei_ pisque duas vezes se estou certo e 3 vezes se estou errado - antes que os cegos sejam guiados pelos cegos xD
22,19K
Top
Classificação
Favoritos