一站式 Web3 探索中心 | 去中心化应用商店 & Web3 线下活动

热门话题

想象一下，如果因为你几年前在reddit、stackexchange、你自己的博客等地方写的某个帖子，你能够从o3、sonnet或开源LLM的托管服务提供商所产生的收入中分一杯羹。如果互联网中的人类生成数据是实现AGI的化石燃料，那么人类需要能够根据他们的贡献提取所捕获的价值。而现在发生的事情是： > 大型科技公司一次性支付巨额费用来构建数据集并附加许可证 > 构建基础模型 > 附加API以收取每月$或每N个令牌的费用 > 产生收入，获得数十亿或数百亿的私人估值，股价上涨那些数据至关重要的人类OG并没有从这些庞大的价值捕获中获得任何收益。反对者可能会说：“哦，我们现在使用合成数据进行训练，因为我们发现AI优于人类。”但兄弟，你只是在使用之前由人类数据构建的更大模型来生成合成数据，以准备更小但更智能的模型。这只是意味着，较小的模型如果没有前一个模型和人类OG数据的基因谱，就不会存在。再说一遍，人类OG应该看到他们钱包中捕获的价值的一部分。随着RLHF在后期训练中变得越来越重要，用户被要求在聊天机器人界面中按下赞或踩。这种偏好被用来进一步改善模型，然后用于收取下一个版本的LLM的更多费用，每月$或每N个令牌。然而，你，没错，你这些人类用户，却无法看到任何这些价值传递到你的钱包中。显然，拥有先进的GPU和人类数据的化石燃料对于构建最具竞争力的LLM产品至关重要。然而，只有tsmc、nvidia、google等公司的股东，以及openai、anthropic等公司的风险投资者和天使投资者，才获得了所有的价值捕获。那些数字足迹被使用的普通人最终只得到微薄的回报。无论AI专家或现代哲学家为实现AGI设定了什么日期，通往AGI的道路都是以盗窃人类对其数据或数字行为的财产权为基础铺成的。并不是说我有解决方案，但这是最大的提示：我们如何建立一个没有对手风险的数据市场，能够持续衡量每个单位数字行为对任何商业模型价值捕获的贡献，并将版税分享回人类？想象一下，如果有这样的机制，我们将拥有一个管道，让这些庞然大物可以利用人类数据来不断改进模型，同时确保普通人可以从他们的数字行为中获得应得的回报。那将是多么美好的世界啊！公平分配。只是一个迟来的周五沉思！

213