1/ Les modèles de vision du monde réel ne "voient" pas une image d'un seul coup. Ils la découpent : → divisent en morceaux → effectuent l'inférence → assemblent les résultats C'est ainsi que fonctionne la vidéo haute résolution en production.