Recentemente, a OpenAI e o Google alcançaram a medalha de ouro do IMO com seus novos modelos experimentais. Mas a nossa equipe alcançou o mesmo nível apenas com o o4-mini-high e nossos sistemas de agentes. E agora estamos tornando isso open source. Especialmente, obtivemos melhorias incríveis com os benchmarks do USAMO. A linha de base era quase 0, mas nosso agente obteve uma média de 90%. Além disso, conseguimos provar teoricamente os recentes artigos do arxiv apenas apresentando a ideia-chave da pesquisa.
84,34K