Föreställ dig vad om du på grund av något inlägg du skrev för flera år sedan i reddit, stackexchange, din egen blogg, etc., kan ta en del av intäkterna som görs av o3 eller sonnet eller värdtjänstleverantörer av öppen källkod LLM:er. Om mänskligt genererad data på internet är det fossila bränslet för att nå AGI, måste människor kunna extrahera värde som fångas i proportion till deras bidrag. Det som händer nu är i stället att > stora teknikföretag betalar en klumpsumma för att bygga datauppsättningar och skaffa en licens > bygger en grundmodell > spänner fast ett API för att debitera $/månad eller $ per N tokens > gör intäkter, höjer privata värderingar på 10 eller 100 dollar B, stiger aktiekurserna De mänskliga organisationsgrupper vars data var kritiska får inte ut något av dessa gigantiska värdeinsamlingar. Nejsägare kan säga "åh, vi använder nu syntetisk data för träning eftersom vi tycker att AI är överlägsen människor". Men brorsan, du använder bara större modeller som tidigare gjorts från mänskliga data för att göra syntetiska data för att förbereda mindre men smartare modeller. Det betyder bara att den mindre modellen inte skulle ha existerat utan den tidigare modellen och genom geneologi, OG:s mänskliga data. Återigen, mänskliga OG:er förtjänar att se en del av värdet fångas i sin plånbok. I och med att RLHF blir allt viktigare för efterträningen ombeds användarna att trycka på tummen upp eller ner i chattrobotgränssnitten. Denna preferens används för att förbättra modellen ytterligare, som sedan används för att debitera mer $/månad eller $ per N tokens för nästa utgåva av LLM. Ändå kan ni, ja ni mänskliga användare, inte se något av dessa värden föras vidare till er plånbok. Det är uppenbart att ha tillgång till avancerade GPU:er och fossilt bränsle av mänsklig data har varit avgörande för att bygga de mest konkurrenskraftiga LLM-erbjudandena. Ändå är det bara aktieägare i tsmc, nvidia, google, etc. och vc:er, ängelinvesterare i openai, anthropic, etc., som får all värdefångst. Norkie-människor vars digitala fotavtryck användes får till slut jordnötter. Oavsett vilket datum AI-experter eller moderna filosofer har satt för att uppnå AGI, är vägen till AGI belagd med stöld av människors äganderätt till sina data eller digitala handlingar. Här är den största frågan: hur bygger vi en datamarknad utan en motpartsrisk som kontinuerligt kan mäta bidraget från varje enhet av digital handling av en människa till någon kommersiell modells värdefångst och dela royaltyn tillbaka till människan? Föreställ dig att detta finns där, vi kommer att ha en pipeline där någon av dessa giganter kan använda mänsklig data för att göra bättre och bättre modeller samtidigt som vi ser till att normie human kan skörda vederbörlig utbetalning från sina digitala handlingar. Vilken underbar värld det kommer att bli! Rättvis fördelning. Bara en sen fredagsfundering!
5,72K