Die verkörperte KI-Daten sind unvorhersehbar, multimodal und tief mit ihrer Umgebung verbunden. Die Pipelines, die LLMs antreiben, können nicht mithalten. Echte Randfälle sind nicht scrapable. Sie müssen orchestriert und verifiziert werden. Jüngste Arbeiten von Zhu et al. und die Umfrage zu großen multimodalen Denkmodellen zeigen, warum: → LMRMs ersticken an lauten, dynamischen Eingaben. → Die Nutzung von Werkzeugen ist fragil. → Langfristige Planung in physischen Umgebungen ist noch weit entfernt.
1,85K