热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
.@balajis 说 AI 正在扩大验证差距。需要大量工作来弥补这一差距。
提示使世界充斥着虚假信息。加密货币带回了证明。
“你需要加密哈希的帖子和加密 ID ... 来确认数据没有被篡改。”
在 AI 时代,信任必须被工程化。

2025年6月5日
@balajis 的一篇关于 "验证差距 "的好帖子。
你可以将其视为创造中的两种模式。借用 GAN 的术语:
1) 生成和
2) 鉴别。
例如,绘画 - 你进行一次笔触(1),然后你观察一段时间,看看是否改善了画作(2)。这两个阶段几乎贯穿于所有创造性工作中。
第二点。鉴别在计算上可能非常困难。
- 图像是最简单的。例如,图像生成团队可以创建巨大的结果网格,以决定一幅图像是否优于另一幅。感谢你大脑中为快速处理图像而构建的巨型 GPU。
- 文本则要困难得多。它是可略读的,但你必须阅读,它是语义的、离散的和精确的,因此你还必须推理(尤其是在例如代码中)。
- 音频可能更难,因为它强制了时间轴,因此根本无法略读。你被迫进行串行计算,根本无法并行化。
你可以说,在编码中,LLM 已经将 (1) 压缩到 ~瞬时,但在解决 (2) 上几乎没有做什么。一个人仍然必须盯着结果,判断它们是否好。这是我对 LLM 编码的主要批评,因为它们随意输出 *过多* 的代码,复杂性任意,假装没有第二阶段。得到这么多代码是糟糕和可怕的。相反,LLM 必须积极与你合作,将问题分解为小的增量步骤,每一步都更容易验证。它必须预见到 (2) 的计算工作,并尽可能减少它。它必须真正关心。
这让我想到了非编码者对编码的最大误解。他们认为编码是关于写代码(1)。其实不是。它是关于盯着代码(2)。将所有内容加载到你的工作记忆中。来回踱步。思考所有的边缘情况。如果你在我 "编程 "的随机时刻抓住我,我可能只是盯着屏幕,如果被打断,会非常生气,因为这实在是计算上太费力了。如果我们只加快了 1 的速度,但没有减少 2(这大部分时间都是如此!),那么显然编码的整体速度不会提高(参见阿姆达尔法则)。
465.98K
热门
排行
收藏