1/ I modelli di visione del mondo reale non "vedono" un'immagine tutta in una volta. La suddividono: → la dividono in patch → eseguono l'inferenza → uniscono i risultati Questo è il modo in cui funziona il video ad alta risoluzione in produzione.