Un nuovo modello di mondo da Meta FAIR dopo tutto il caos. 🌍 Incontra DINO-world: un modello di mondo video generalista che prevede il futuro—nello spazio latente. Addestrato su video non curati con DINOv2, apprende dinamiche temporali diverse (guida, interni, simulazioni), supera i modelli precedenti in segmentazione e profondità, e comprende persino la fisica intuitiva. Bonus: può essere affinato per la pianificazione condizionata all'azione.
23,81K