Jos lauseen todistavat mallit skaalautuvat kyvyltään 10 kertaa nopeammin kuin koodausmallit, ja koska todistus on koodia, vibe-koodaus on parasta tehdä ohjelmointikielellä, jossa on todistusjärjestelmä, mutta joka on suunniteltu rakentamaan sovelluksia matematiikan sijaan
George Tsoukalas
George Tsoukalas21.8. klo 01.07
ByteDancen Seed-Prover on PutnamBenchin listojen kärjessä 329:llä 657 ongelmasta, jotka on ratkaistu Lean! 🤯 6 kuukautta sitten mikään malli ei pystynyt ratkaisemaan >2 %, nyt SOTA on 50 %. Olemme siirtymässä uuteen aikakauteen teoreeman todistamiskyvyissä...
30,75K