一个关键的见解!社区常常追求GPU的吞吐量,却不问并行性实际上适用于哪里。这突显了一个长期被忽视的瓶颈:r1cs.Solve本质上是顺序的。再多的GPU核心也无法解决这个问题。 zk加速的未来可能不再依赖于“蛮力GPU”,而更多依赖于算法的重新思考和CPU级别的架构设计。
AntChain OpenLabs
AntChain OpenLabs7月1日 11:47
🚀 AntChain OpenLabs @AntChainOpenLab 和 ZeroBase @zerobasezk 👀 发现:#GPUs 在 Groth16 加速中的致命缺陷! ⚠️ ⚡️ 虽然 #MSM/#NTT 的速度提升超过 100 倍,但 r1cs.Solve 无法并行化,必须顺序执行。 🤯 高频多核 CPU 在这里的表现优于 GPU。 💻🔥 展望未来,这一发现预示着我们在零知识证明加速方面的思路转变——更倾向于智能、可并行化的算法和灵活的基于 CPU 的架构,而非 GPU 的强大性能。 💡
1.66K