Postingan @delphi_intel perdana saya adalah tentang Model Video AI Gen. Ringkasan di bawah ini (1/10) 👇 s / o untuk @moonshot6666 umpan baliknya tentang esai ini & @PJaccetturo untuk video hype narkoba ini akan saya curi tanpa malu-malu. TLDR: video tertinggal 2-3 tahun dari teks. Mereka menjadi sangat bagus, sangat cepat
1. Manusia adalah makhluk visual. Modalitas konten AI Gen kemungkinan akan cenderung menuju distribusi yang mirip dengan web:
2. Pasar besar: >US$40 miliar+ miliar pada tahun 2030 (dengan kedekatan yang relevan). Gangguan dalam pemasaran, hiburan, dan pendidikan sudah jelas, tetapi juga implikasi yang jelas dalam robotika, pengawasan, dan tugas agen jangka panjang
3. Lanskap memiliki banyak persaingan lintas tumpukan Termasuk perusahaan model, aplikasi multi-modal, avatar berbicara, sinkronisasi bibir, dan banyak lagi. Belum lagi semua infra yang diperlukan untuk mendorong model dan aplikasi multimoda sejati. s/o ke @venturetwins dan @a16z untuk peta
4. Timur vs. Barat. Perlombaan sebagian besar terbagi antara AS dan China. Dalam model video, China memimpin (9 dari 15 model teratas) s / o @ArtificialAnlys
6. Keunggulan Teknologi Besar: menyalurkan kemampuan baru ini ke ekosistem pengguna >1b akan menjadi ROI yang tinggi Berdasarkan atribut di bawah ini, tidak mengherankan bahwa pemain besar seperti $Goog, $meta, $techy, $baba, dan Bytedance berada di posisi yang baik.
7. Akrual nilai: Pada saat yang sama, kami melihat kantong-kantong di seluruh tumpukan - terutama di infra dan aplikasi - di mana pendatang baru dapat mengukir bisnis besar (Ya, Anda harus membaca laporan aktual untuk alfa apa pun)
8. Multi-modalitas sejati Saat ini, model video terlihat seperti mainan. Tetapi data video dan simulasi adalah input yang semakin penting untuk tugas agen bentuk panjang dan dalam memulai revolusi robotika. Model video mungkin hanya membuktikan percikan api.
1,23K