もし、あなたが何年も前にreddit、stackexchange、自分のブログなどに書いた記事のせいで、o3やsonnet、またはオープンソースLLMのホスト型サービスプロバイダーが稼いでいる収益から利益を得ることができるとしたらどうなるか想像してみてください。 インターネット上で人間が生成したデータが汎用人工知能に到達するための化石燃料であるならば、人間は彼らの貢献に比例して捕捉された価値を引き出すことができる必要があります。 代わりに、今起こっていることはです > ビッグテックは、データセットを構築し、ライセンスをストラップで固定するための一括払いを支払います >基盤モデルの構築 > API をストラップして、月額または N トークンあたり $ を請求することができます >収益を上げ、10ドルまたは100ドルのプライベートバリュエーションを調達し、株価が上昇します データが重要だった人間のOGは、これらの巨大な価値のキャプチャから何も得られません。 否定的な人は、「ああ、AIが人間よりも優れていることがわかったので、今、トレーニングに合成データを使用している」と言うかもしれません。しかし、あなたは以前に人間のデータから作られたより大きなモデルを使用して、より小さくて賢いモデルを準備するための合成データを作成しているだけです。これは、以前のモデルと、系譜学によってOGの人間のデータがなければ、小さいモデルは存在しなかったことを意味します。繰り返しになりますが、人間のOGは、ウォレットに価値の一部が取り込まれるのを見るに値します。 RLHFがトレーニング後のトレーニングで重要性を増す中、ユーザーはチャットボットのインターフェースで親指を上に押したり下げたりするように求められています。この好みは、モデルをさらに改善するために使用され、その後、LLMの次のエディションでNトークンあたりより多くの$/月または$を請求するために使用されます。しかし、あなた、はい、人間のユーザーは、それらの価値があなたのウォレットに渡されるのを見ることができません。 高度なGPUと化石燃料の人間データにアクセスできることが、最も競争力のあるLLM製品を構築するために重要であることは明らかです。しかし、tsmc、nvidia、googleなどの株主と、openai、anthropicなどのエンジェル投資家であるVCだけが、すべての価値を獲得しています。デジタルフットプリントが使用されたノーミーの人間は、結局ピーナッツを手に入れることになります。 AIの専門家や現代の哲学者がAGIの達成に向けてどのような日付を設定してきたかにかかわらず、AGIへの道は、データやデジタルアクションに対する人間の財産権の泥棒によって舗装されています。 解決策があるとは言いませんが、ここで最大のプロンプトがあります:カウンターパーティリスクのないデータ市場をどのように構築し、人間によるデジタルアクションの各単位の貢献度を商業モデルの価値獲得に向けて継続的に測定し、ロイヤリティを人間に還元できるかということです。これがそこにあると想像してみてください、これらの巨大企業が人間のデータを使用してますます優れたモデルを作成できるパイプラインができあがり、同時にノーミーヒューマンがデジタルアクションから正当な支払いを収穫できるようにすることも保証されます。それは何と素晴らしい世界でしょう!公正な配分。 金曜日の遅い時間に思索しているだけです!
201