Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Jasper
Cofundador e CEO @Hyperbolic_Labs. ex-@avax & ex-@citsecurities. Terminou o doutoramento em Matemática em 2 anos @UCBerkeley. Medalhista de Ouro nas Olimpíadas de Matemática. Maior honra @PKU1898
Podemos estar a entrar numa reviravolta na saga OpenAI vs. DeepMind IMO.
Acabei de ver uma publicação de Joseph Myers (envolvido na Olimpíada de Matemática desde 1992): o comitê da IMO supostamente pediu aos laboratórios de IA que não publicassem resultados até 7 dias após a cerimônia de encerramento — por respeito aos concorrentes humanos (veja minha publicação de ontem) e provavelmente para permitir tempo para a verificação adequada das submissões e formatos de IA.
De acordo com Joseph, a OpenAI não colaborou com a IMO para testar seu modelo, e nenhum dos 91 coordenadores oficiais da IMO esteve envolvido na avaliação das suas soluções. Enquanto isso, parece que a DeepMind está a seguir as regras e a esperar pacientemente a sua vez.
Para contexto:
A IMO tem 6 problemas, cada um valendo 7 pontos. O corte de ouro deste ano é de 35 pontos. Mesmo uma pequena dedução poderia fazer a OpenAI cair para prata. E pela minha leitura dos seus relatórios, algumas partes podem levantar questões — e possivelmente custar pontos.
Terence Tao também apontou que, embora os problemas permaneçam os mesmos, os formatos de teste importam. Um estudante que não conseguiria uma medalha de bronze em condições normais pode conquistar o ouro com uma configuração modificada — o que levanta questões reais sobre o que significa "resolver a IMO" para a IA.
A próxima semana pode ser emocionante. Fique atento.


86,97K
A DeepMind ganhou uma medalha de ouro na IMO na tarde de sexta-feira. Mas tiveram que esperar pela aprovação do marketing para o tweet — até segunda-feira.
A @OpenAI partilhou o seu primeiro às 1h da manhã de sábado e roubou o destaque.
Neste jogo, velocidade > burocracia. Perde o momento, perde a narrativa.
214,96K
Acabei de sair do trabalho e experimentei o Grok-4 num problema de topologia de graduação. Levou 9 minutos a pensar e depois deu uma resposta limpa, plausível, mas totalmente errada 😅
Não acho que este se qualifique como "habilidosamente adversarial." Os modelos de IA estão a esmagar benchmarks — mas ainda há um longo caminho a percorrer para uma AGI matemática real.



Elon Musk10/07, 16:47
Grok 4 is at the point where it essentially never gets math/physics exam questions wrong, unless they are skillfully adversarial.
It can identify errors or ambiguities in questions, then fix the error in the question or answer each variant of an ambiguous question.
662,98K
Grok obteve a pontuação máxima no AIME 🤯 Definitivamente precisamos de um melhor padrão de matemática para IA agora.


xAI10/07, 12:01
Apresentando o Grok 4, o modelo de IA mais poderoso do mundo. Assista à transmissão ao vivo agora:
2,97K
O futuro da IA é colaborativo

Yuchen Jin9/07, 06:09
Sam Altman was asked how he felt about Zuck and Meta poaching OpenAI’s top talent.
“Fine... good...” he said.
Behind Jony Ive–designed glasses, I couldn’t see his eyes. But I could feel the pain.
It's not hard for Zuck to poach OpenAI talent, not just because he has the money, but because open-source AI is fulfilling the original OpenAI mission.
1,43K
Top
Classificação
Favoritos
Tendências on-chain
Popular no X
Principais financiamentos atuais
Mais notável