Se os modelos de prova de teoremas estão escalando em capacidade 10x mais rápido do que os modelos de codificação, e dado que a prova é código, então, a codificação vibe será melhor feita por meio de uma linguagem de programação com um sistema de prova, mas projetada para criar aplicativos em vez de matemática
George Tsoukalas
George Tsoukalas21 de ago., 01:07
O Seed-Prover da ByteDance lidera as paradas no PutnamBench com 329 dos 657 problemas resolvidos no Lean! 🤯 6 meses atrás, nenhum modelo poderia resolver >2%, agora SOTA é de 50%. Estamos entrando em uma nova era de capacidades de prova de teoremas...
30,74K