Modele dyfuzji wideo to po prostu przewymiarowane estymatory głębokości! Deterministyczna estymacja głębokości w jednym przebiegu oparta na WanV2.1. - SOTA 5.5 AbsRel na ScanNet - bardziej efektywne pod względem danych niż podstawowe modele; - brak migotania temporalnego + estymacja o nieskończonej długości z zerowym dryfem skali.