在所有混亂之後,Meta FAIR推出了一個新的世界模型。 🌍 介紹DINO-world:一個通用的視頻世界模型,可以在潛在空間中預測未來。 它基於未經篩選的視頻使用DINOv2進行訓練,學習多樣的時間動態(駕駛、室內、模擬),在分割和深度方面超越了之前的模型,甚至掌握了直觀的物理學。 額外獎勵:它可以針對動作條件規劃進行微調。
23.81K