Um novo modelo de mundo da Meta FAIR após todo o caos. 🌍 Conheça o DINO-world: um modelo de mundo de vídeo generalista que prevê o futuro—no espaço latente. Treinado em vídeos não curados com DINOv2, aprende dinâmicas temporais diversas (condução, interiores, simulações), supera modelos anteriores em segmentação e profundidade, e até compreende física intuitiva. Bónus: pode ser ajustado para planeamento condicionado por ações.
23,82K