Il Seed-Prover di ByteDance è in cima alle classifiche di PutnamBench con 329 problemi risolti su 657 in Lean! 🤯 6 mesi fa nessun modello riusciva a risolvere più del 2%, ora lo stato dell'arte è al 50%. Stiamo entrando in una nuova era delle capacità di dimostrazione dei teoremi…
68,29K