Un nuevo modelo de mundo de Meta FAIR después de todo el caos. 🌍 Conoce DINO-world: un modelo de mundo de video generalista que predice el futuro—en el espacio latente. Entrenado con videos no curados utilizando DINOv2, aprende diversas dinámicas temporales (conducción, interiores, simulaciones), supera a modelos anteriores en segmentación y profundidad, e incluso comprende la física intuitiva. Bonus: se puede ajustar para planificación condicionada por acciones.
11,43K