1/ Vision-Modelle aus der realen Welt „sehen“ ein Bild nicht auf einmal. Sie teilen es auf: → in Patches aufteilen → Inferenz durchführen → Ergebnisse zusammenfügen So funktioniert hochauflösendes Video in der Produktion.