Mi publicación inaugural en @delphi_intel es sobre Modelos de Video de IA Generativa. Resumen a continuación (1/10)👇 Gracias a @moonshot6666 por sus comentarios sobre este ensayo y a @PJaccetturo por este increíble video promocional que robaré sin vergüenza. Resumen: los videos están 2-3 años detrás del texto. Están mejorando muy rápido.
1. Los humanos son criaturas visuales. La modalidad de contenido de IA generativa probablemente seguirá una distribución similar a la de la web:
2. El mercado es grande: >US$40 mil millones para 2030 (con adyacencias relevantes). La disrupción en marketing, entretenimiento y educación es obvia, pero también hay implicaciones claras en robótica, vigilancia y tareas agentivas a largo plazo.
3. El panorama tiene mucha competencia entre pilas cruzadas Incluye empresas modelo, aplicaciones multimodales, avatares que hablan, sincronización labial y más. Sin mencionar toda la infraestructura necesaria para alimentar verdaderos modelos y aplicaciones multimodales. s/o a @venturetwins y @a16z por el mapa
4. Este vs. Oeste. La carrera está en gran medida dividida entre EE. UU. y China. En modelos de video, China está liderando (9 de los 15 mejores modelos) s/o @ArtificialAnlys
6. Ventaja de las grandes tecnológicas: canalizar estas nuevas capacidades a ecosistemas de más de 1 billón de usuarios tendrá un alto retorno de inversión. Basado en los atributos a continuación, no es sorprendente que grandes jugadores como $Goog, $meta, $techy, $baba y Bytedance estén bien posicionados.
7. Acumulación de valor: Al mismo tiempo, vemos nichos a lo largo de la pila - particularmente en infraestructura y aplicaciones - donde nuevos entrantes pueden crear grandes negocios (Sí, necesitarás leer el informe real para obtener cualquier alfa, perezoso)
8. Verdadera multimodalidad Hoy en día, los modelos de video parecen un juguete. Pero los datos de video y las simulaciones son una entrada cada vez más esencial para tareas prolongadas y en el inicio de la revolución robótica. Los modelos de video podrían ser la chispa.
1,24K