MetalRT ist gerade die erste vollständige KI-Inferenz-Engine für Apple Silicon geworden: LLM + STT + TTS von @RunAnywhereAI. Wir hatten bereits die schnellste LLM-Dekodierung (658 tok/s). Jetzt haben wir auch STT und TTS übertroffen und MLX in allen Bereichen geschlagen. Die heutigen Zahlen auf M4 Max: - 1-stündiger Podcast in ~5 Sekunden transkribiert - 3-stündige Besprechung in ~15 Sekunden transkribiert - Live-Untertitelung mit null wahrnehmbarer Verzögerung - 714x schneller als Echtzeit für STT - 4,6x schneller als Apples MLX bei Sprache-zu-Text Alle drei Modalitäten. Eine einheitliche Engine. Und das sind nur die einzelnen Komponenten. Die vollständige Sprach-KI-Pipeline, die wir darauf aufbauen, wird die SCHNELLSTE aller Zeiten auf Apple Silicon sein. Bald verfügbar. Vollständige Benchmarks, Diagramme und Details in den Kommentaren. #AppleSilicon #OnDeviceAI #MetalRT #STT #TTS #VoiceAI