计算机使用模型非常吸引人……但它们几乎无法正常工作。 我们尝试在Claude和GPT5的计算机使用上构建浏览器测试,但它们速度慢且成本高。 所以我们自己构建了一个: - 快速提升至15倍 - 快速提升至3倍 试试吧,自己判断!