在经历了所有的混乱之后,Meta FAIR推出了一个新的世界模型。 🌍 介绍DINO-world:一个通用的视频世界模型,可以在潜在空间中预测未来。 它在未经筛选的视频上使用DINOv2进行训练,学习多样的时间动态(驾驶、室内、模拟),在分割和深度方面超越了之前的模型,甚至掌握了直观的物理学。 额外信息:它可以针对动作条件进行微调以进行规划。
23.74K