1/ 現実世界の視覚モデルは一度にすべての画像を「見る」わけではありません。 タイル張りは以下の通りです: →パッチに分かれています → 推論を実行する →ステッチの結果 これが高解像度ビデオの制作過程です。