如果定理证明模型的能力提升速度是编码模型的10倍,并且考虑到证明就是代码,那么,氛围编码最好通过一种具有证明系统的编程语言来完成,但该语言是为了构建应用程序而设计的,而不是数学。
George Tsoukalas
George Tsoukalas8月21日 01:07
字节跳动的 Seed-Prover 在 PutnamBench 上以解决 657 个问题中的 329 个问题而名列前茅!🤯 6 个月前没有模型能够解决超过 2%,现在的最先进技术(SOTA)达到了 50%。我们正进入一个新的定理证明能力时代…
29.38K