Stel je voor dat je, vanwege een post die je jaren geleden schreef op Reddit, StackExchange, je eigen blog, enz., een deel van de inkomsten kunt ontvangen die worden gegenereerd door o3 of Sonnet of gehoste serviceproviders van open-source LLMs. Als door mensen gegenereerde data op internet de fossiele brandstof is voor het bereiken van AGI, moeten mensen in staat zijn om waarde te extraheren die in verhouding staat tot hun bijdrage. In plaats daarvan gebeurt nu het volgende: > grote techbedrijven betalen een eenmalig bedrag om datasets te bouwen en een licentie te verkrijgen > bouwen een fundamentmodel > koppelen een API om $/maand of $ per N tokens te vragen > genereren inkomsten, verhogen $10s of $100s B privéwaarderingen, aandelenprijzen stijgen De menselijke OG's wiens data cruciaal was, krijgen niets van deze enorme waarde-extracties. Tegenstanders zullen misschien zeggen: "oh, we gebruiken nu synthetische data voor training omdat we AI superieur aan mensen vinden". Maar bro, je gebruikt gewoon grotere modellen die eerder zijn gemaakt van menselijke data om synthetische data te maken voor het voorbereiden van kleinere maar slimmere modellen. Dat betekent gewoon dat het kleinere model niet zou hebben bestaan zonder het eerdere model en, door genealogie, de OG menselijke data. Nogmaals, menselijke OG's verdienen het om een deel van de waarde die in hun portemonnee wordt vastgelegd te zien. Met RLHF dat steeds kritischer wordt voor post-training, worden gebruikers gevraagd om duimen omhoog of omlaag te drukken in chatbotinterfaces. Deze voorkeur wordt gebruikt om het model nog verder te verbeteren, wat vervolgens wordt gebruikt om meer $/maand of $ per N tokens te vragen voor de volgende editie van LLM. Toch, jij, ja jij menselijke gebruikers, kunt geen van die waarde zien die naar jouw portemonnee wordt doorgegeven. Het is duidelijk dat toegang tot geavanceerde GPU's en de fossiele brandstof van menselijke data cruciaal is geweest voor het bouwen van de meest competitieve LLM-aanbiedingen. Toch krijgen alleen aandeelhouders van TSMC, Nvidia, Google, enz. en VC's, angel-investeerders van OpenAI, Anthropic, enz. alle waarde-extractie. Normale mensen wiens digitale voetafdruk werd gebruikt, krijgen uiteindelijk slechts kruimels. Ongeacht welke datum de AI-experts of moderne filosofen hebben vastgesteld voor het bereiken van AGI, de weg naar AGI wordt geplaveid met diefstal van eigendomsrechten van mensen over hun data of digitale acties. Ik zeg niet dat ik de oplossing heb, maar hier is de grootste vraag: hoe bouwen we een datamarkt zonder tegenpartijrisico die in staat is om continu de bijdrage van elke eenheid digitale actie door een mens aan de waarde-extractie van een commercieel model te meten en de royalty's terug te delen met de mens? Stel je voor dat dit er is, we zullen een pijplijn hebben waar een van deze reuzen menselijke data kan gebruiken om steeds betere modellen te maken, terwijl we ook zorgen dat normale mensen de juiste uitbetaling kunnen oogsten voor hun digitale acties. Wat een geweldige wereld zou dat zijn! Eerlijke toewijzing. Gewoon een late vrijdag overpeinzing!
186