Un nouveau modèle mondial de Meta FAIR après tout le chaos. 🌍 Découvrez DINO-world : un modèle vidéo généraliste qui prédit l'avenir—dans l'espace latent. Entraîné sur des vidéos non sélectionnées avec DINOv2, il apprend des dynamiques temporelles diverses (conduite, intérieur, simulations), surpasse les modèles précédents en segmentation et profondeur, et comprend même la physique intuitive. Bonus : il peut être affiné pour la planification conditionnée par l'action.
23,74K