Um novo mundo wodel da Meta FAIR depois de todo o caos. 🌍 Conheça o DINO-world: um modelo generalista de mundo de vídeo que prevê o futuro - no espaço latente. Treinado em vídeos não selecionados com DINOv2, ele aprende diversas dinâmicas temporais (dirigir, dentro de casa, sims), supera modelos anteriores em segmentação e profundidade e até compreende a física intuitiva. Bônus: ele pode ser ajustado para planejamento condicionado à ação.
23,81K