热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
想象一下,如果因为你几年前在reddit、stackexchange、你自己的博客等地方写的某个帖子,你能够从o3、sonnet或开源LLM的托管服务提供商所产生的收入中分一杯羹。
如果互联网中的人类生成数据是实现AGI的化石燃料,那么人类需要能够根据他们的贡献提取所捕获的价值。
而现在发生的事情是:
> 大型科技公司一次性支付巨额费用来构建数据集并附加许可证
> 构建基础模型
> 附加API以收取每月$或每N个令牌的费用
> 产生收入,获得数十亿或数百亿的私人估值,股价上涨
那些数据至关重要的人类OG并没有从这些庞大的价值捕获中获得任何收益。
反对者可能会说:“哦,我们现在使用合成数据进行训练,因为我们发现AI优于人类。”但兄弟,你只是在使用之前由人类数据构建的更大模型来生成合成数据,以准备更小但更智能的模型。这只是意味着,较小的模型如果没有前一个模型和人类OG数据的基因谱,就不会存在。再说一遍,人类OG应该看到他们钱包中捕获的价值的一部分。
随着RLHF在后期训练中变得越来越重要,用户被要求在聊天机器人界面中按下赞或踩。这种偏好被用来进一步改善模型,然后用于收取下一个版本的LLM的更多费用,每月$或每N个令牌。然而,你,没错,你这些人类用户,却无法看到任何这些价值传递到你的钱包中。
显然,拥有先进的GPU和人类数据的化石燃料对于构建最具竞争力的LLM产品至关重要。然而,只有tsmc、nvidia、google等公司的股东,以及openai、anthropic等公司的风险投资者和天使投资者,才获得了所有的价值捕获。那些数字足迹被使用的普通人最终只得到微薄的回报。
无论AI专家或现代哲学家为实现AGI设定了什么日期,通往AGI的道路都是以盗窃人类对其数据或数字行为的财产权为基础铺成的。
并不是说我有解决方案,但这是最大的提示:我们如何建立一个没有对手风险的数据市场,能够持续衡量每个单位数字行为对任何商业模型价值捕获的贡献,并将版税分享回人类?想象一下,如果有这样的机制,我们将拥有一个管道,让这些庞然大物可以利用人类数据来不断改进模型,同时确保普通人可以从他们的数字行为中获得应得的回报。那将是多么美好的世界啊!公平分配。
只是一个迟来的周五沉思!
213
热门
排行
收藏