Můj inaugurační příspěvek @delphi_intel je o Gen AI Video Models. Shrnutí níže (1/10) 👇 s/o @moonshot6666 za jeho zpětnou vazbu na tuto esej a @PJaccetturo za toto drogové hype video, které bezostyšně ukradnu. TLDR: videa jsou 2-3 roky pozadu za textem. Stávají se velmi dobrými, velmi rychlými
1. Lidé jsou vizuální tvorové. Modalita obsahu Gen AI bude pravděpodobně směřovat k distribuci podobné webu:
2. Trh je velký: >40 miliard USD+ do roku 2030 (s příslušnými příslušenstvími). Disrupce v marketingu, zábavě a vzdělávání je zřejmá, ale také jasné důsledky v robotice, dohledu a agentských úkolech v dlouhodobém horizontu
3. Krajina má velkou křížovou konkurenci Zahrnuje modelingové společnosti, multimodální aplikace, mluvící avatary, synchronizaci rtů a další. Nemluvě o veškeré infrastruktuře potřebné k podpoře skutečných multimodálních modelů a aplikací. s/o na @venturetwins a @a16z pro mapu
4. Východ proti Západu. Závod je z velké části rozdělen mezi USA a Čínu. V oblasti video modelů vede Čína (9 z 15 nejlepších modelů) s/o @ArtificialAnlys
6. Výhoda velkých technologií: propojení těchto nových funkcí s uživatelskými ekosystémy >1b bude mít vysokou návratnost investic Na základě níže uvedených atributů není šokující, že velcí hráči jako $Goog, $meta, $techy, $baba a Bytedance mají dobrou pozici.
7. Nabíhání hodnoty: Zároveň vidíme kapsy napříč celým zásobníkem - zejména v infrastruktuře a aplikacích - kde si noví hráči mohou vydobýt velké podniky (Ano, budete si muset přečíst skutečnou zprávu pro každého alfu, líný zadku)
8. Skutečná multimodalita Dnes vypadají video modely jako hračky. Ale video data a simulace jsou stále důležitějším vstupem pro dlouhé agentické úlohy a pro nastartování robotické revoluce. Videomodely by mohly být jen důkazem jiskry.
1,26K