GPT-5.4 xhigh scheint schlecht darin zu sein, Anweisungen zu befolgen. Letzte Nacht habe ich zwei KI-Forschungsagenten gestartet, die @karpathy’s autoresearch ausführen. Claude Opus 4.6 (hoch): > lief über 12+ Stunden, 118 Experimente durchgeführt, läuft immer noch GPT-5.4 xhigh: > stoppte nach 6 Experimenten > gab mir die Schuld für das "manuelle Unterbrechen" > ich habe es verhört > Es gab zu, dass es einen Fehler gemacht hat und die Schleife selbst gestoppt hat, trotz einer expliziten ANWEISUNG ZUR SCHLEIFE FÜR IMMER in der md-Datei. 💀