Se i modelli di dimostrazione dei teoremi stanno aumentando la loro capacità 10 volte più velocemente dei modelli di codifica, e dato che la prova è codice, allora la vibrazione della codifica sarà meglio realizzata attraverso un linguaggio di programmazione che presenta un sistema di prova, ma progettato per costruire app piuttosto che matematica.
George Tsoukalas
George Tsoukalas21 ago, 01:07
Il Seed-Prover di ByteDance è in cima alle classifiche di PutnamBench con 329 problemi risolti su 657 in Lean! 🤯 6 mesi fa nessun modello riusciva a risolvere più del 2%, ora lo stato dell'arte è al 50%. Stiamo entrando in una nuova era delle capacità di dimostrazione dei teoremi…
29,39K