Se os modelos de prova de teoremas estão a escalar em capacidade 10x mais rápido do que os modelos de codificação, e dado que a prova é código, então, a codificação vibe será melhor feita através de uma linguagem de programação com um sistema de prova, mas projetada para construir aplicações em vez de matemática.
George Tsoukalas
George Tsoukalas21/08, 01:07
O Seed-Prover da ByteDance lidera as paradas no PutnamBench com 329 de 657 problemas resolvidos em Lean! 🤯 Há 6 meses, nenhum modelo conseguia resolver mais de 2%, agora o SOTA é 50%. Estamos entrando em uma nova era de capacidades de prova de teoremas…
30,75K