O Seed-Prover da ByteDance lidera as paradas no PutnamBench com 329 de 657 problemas resolvidos em Lean! 🤯 Há 6 meses, nenhum modelo conseguia resolver mais de 2%, agora o SOTA é 50%. Estamos entrando em uma nova era de capacidades de prova de teoremas…
70,41K