我在 @delphi_intel 的首篇文章是关于生成 AI 视频模型的。以下是摘要 (1/10)👇 感谢 @moonshot6666 对这篇文章的反馈,以及 @PJaccetturo 为我制作的这个很酷的宣传视频,我会毫不犹豫地偷用。 总结:视频的进展比文本慢2-3年。它们正在迅速变得非常优秀。
1. 人类是视觉生物。 生成 AI 内容的模式可能会趋向于类似于网络的分布:
2. 市场庞大:到2030年超过400亿美元(包括相关的邻近领域)。 在营销、娱乐和教育方面的颠覆显而易见,但在机器人技术、监控和长期代理任务方面也有明显的影响。
3. 这个领域有很多跨堆栈的竞争 包括模型公司、多模态应用、对话头像、同步口型等等。更不用提支持真正多模态模型和应用所需的所有基础设施。 感谢 @venturetwins 和 @a16z 提供的地图
4. 东 vs. 西。 这场竞争主要在美国和中国之间进行。在视频模型方面,中国处于领先地位(前15个模型中有9个来自中国) s/o @ArtificialAnlys
6. 大型科技公司的优势:将这些新能力传递给超过10亿用户的生态系统将带来高投资回报率 基于以下属性,像$Goog、$meta、$techy、$baba和字节跳动这样的巨头处于良好位置并不令人惊讶。
7. 价值积累: 与此同时,我们看到整个生态系统中存在一些机会——特别是在基础设施和应用程序方面——新进入者可以开辟出大型业务。 (是的,你需要阅读实际报告以获取任何信息,懒惰的家伙)
8. 真实的多模态 今天,视频模型看起来像个玩具。但视频数据和模拟正成为长篇代理任务和启动机器人革命的越来越重要的输入。 视频模型可能正是那点火花。
3.28K