1/ Verkliga visionsmodeller "ser" inte en bild på en gång. De lägger kakelplattor: → delade upp sig i patchar → kör inferens → maskresultat Så här fungerar högupplöst video i produktion.