Bayangkan bagaimana jika karena beberapa posting yang Anda tulis bertahun-tahun yang lalu di reddit, stackexchange, blog Anda sendiri, dll., Anda dapat mengambil potongan dari pendapatan yang dihasilkan oleh o3 atau sonnet atau penyedia layanan yang dihosting dari LLM sumber terbuka. Jika data yang dihasilkan manusia di internet adalah bahan bakar fosil untuk mencapai AGI, manusia harus dapat mengekstraksi nilai yang ditangkap sebanding dengan kontribusi mereka. Sebaliknya, apa yang terjadi sekarang adalah > teknologi besar membayar lumpsum untuk membangun kumpulan data dan mengikat lisensi > membangun model fondasi > mengikat API untuk menagih $/bulan atau $ per N token > menghasilkan pendapatan, menaikkan $10-an atau $100-an B valuasi swasta, harga saham naik OG manusia yang datanya penting tidak mendapatkan apa pun dari penangkapan nilai raksasa ini. Penentang mungkin mengatakan "oh kami sekarang menggunakan data sintetis untuk pelatihan karena kami menemukan AI lebih unggul dari manusia". Tapi bro kamu hanya menggunakan model yang lebih besar yang sebelumnya dibuat dari data manusia untuk membuat data sintetis untuk menyiapkan model yang lebih kecil namun lebih pintar. Itu hanya berarti bahwa model yang lebih kecil tidak akan ada tanpa model sebelumnya dan berdasarkan geneologi, data manusia OG. Sekali lagi, OG manusia berhak melihat sebagian nilai yang ditangkap di dompet mereka. Dengan RLHF yang semakin penting untuk pasca-pelatihan, pengguna diminta untuk menekan jempol ke atas atau ke bawah di antarmuka chatbot. Preferensi ini digunakan untuk meningkatkan model lebih jauh yang kemudian digunakan untuk membebankan lebih banyak $/bulan atau $ per N token untuk edisi LLM berikutnya. Namun Anda, ya Anda pengguna manusia, tidak dapat melihat nilai tersebut yang diteruskan ke dompet Anda. Jelas bahwa memiliki akses ke GPU canggih dan bahan bakar fosil data manusia sangat penting untuk membangun penawaran LLM yang paling kompetitif. Namun hanya pemegang saham tsmc, nvidia, google, dll. dan vcs, angel investor openai, anthropic, dll., yang mendapatkan semua penangkapan nilai. Manusia normie yang jejak digitalnya digunakan akhirnya mendapatkan kacang. Terlepas dari tanggal apa pun yang telah ditetapkan oleh pakar AI atau filsuf modern untuk mencapai AGI, jalan menuju AGI sedang diaspal dengan pencurian hak milik manusia atas data atau tindakan digital mereka. Tidak mengatakan saya memiliki solusinya, tetapi inilah petunjuk terbesar: bagaimana kita membangun pasar data tanpa risiko pihak lawan yang mampu terus mengukur kontribusi setiap unit aksi digital oleh manusia terhadap penangkapan nilai model komersial apa pun dan membagikan royalti kembali kepada manusia? Bayangkan ini ada di sana, kita akan memiliki pipeline di mana salah satu raksasa ini dapat menggunakan data manusia untuk membuat model yang lebih baik dan lebih baik sambil juga memastikan normie human dapat memanen pembayaran yang semestinya dari tindakan digital mereka. Betapa indahnya dunia itu! Alokasi yang adil. Hanya renungan Jumat malam!
210