Tendencias del momento
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Imagina qué pasaría si, debido a alguna publicación que escribiste hace años en reddit, stackexchange, tu propio blog, etc., pudieras obtener una parte de los ingresos que generan o3 o sonnet o los proveedores de servicios alojados de LLMs de código abierto.
Si los datos generados por humanos en internet son el combustible fósil para alcanzar la AGI, los humanos deben poder extraer valor capturado en proporción a su contribución.
En cambio, lo que sucede ahora es
> las grandes empresas tecnológicas pagan una suma global para construir conjuntos de datos y obtener una licencia
> construyen un modelo base
> añaden una API para cobrar $/mes o $ por N tokens
> generan ingresos, recaudan decenas o cientos de miles de millones en valoraciones privadas, los precios de las acciones suben.
Los OG humanos cuyos datos fueron críticos no obtienen nada de estas enormes capturas de valor.
Los escépticos podrían decir "oh, ahora usamos datos sintéticos para el entrenamiento porque encontramos que la IA es superior a los humanos". Pero amigo, solo estás utilizando modelos más grandes hechos previamente a partir de datos humanos para generar datos sintéticos para preparar modelos más pequeños pero más inteligentes. Eso solo significa que el modelo más pequeño no existiría sin el modelo anterior y, por genealogía, los datos OG humanos. Nuevamente, los OG humanos merecen ver una parte del valor capturado en su billetera.
Con el RLHF volviéndose más crítico para el post-entrenamiento, se les pide a los usuarios que presionen pulgar arriba o abajo en las interfaces de chatbot. Esta preferencia se utiliza para mejorar aún más el modelo, que luego se usa para cobrar más $/mes o $ por N tokens para la próxima edición de LLM. Sin embargo, tú, sí, tú, usuarios humanos, no puedes ver ninguno de esos valores transferidos a tu billetera.
Es obvio que tener acceso a GPUs avanzadas y al combustible fósil de los datos humanos ha sido crítico para construir las ofertas de LLM más competitivas. Sin embargo, solo los accionistas de tsmc, nvidia, google, etc., y los capitalistas de riesgo, inversores ángeles de openai, anthropic, etc., están capturando todo el valor. Los humanos normales cuyos rastros digitales fueron utilizados terminan recibiendo migajas.
Independientemente de la fecha que los expertos en IA o los filósofos modernos hayan establecido para lograr la AGI, el camino hacia la AGI se pavimenta con el robo de los derechos de propiedad de los humanos sobre sus datos o acciones digitales.
No digo que tenga la solución, pero aquí está la mayor pregunta: ¿cómo construimos un mercado de datos sin riesgo de contraparte que pueda medir continuamente la contribución de cada unidad de acción digital de un humano hacia la captura de valor de cualquier modelo comercial y compartir la regalía de vuelta al humano? Imagina que esto existiera, tendríamos un canal donde cualquiera de estos gigantes puede usar datos humanos para hacer modelos cada vez mejores, mientras también se asegura que el humano normal pueda cosechar el pago correspondiente por sus acciones digitales. ¡Qué maravilloso mundo sería ese! Asignación justa.
¡Solo una reflexión tardía de viernes!
231
Parte superior
Clasificación
Favoritos