GPT-5.4 xhigh vaikuttaa huonolta noudattamaan ohjeita. Eilen illalla käynnistin kaksi tekoälytutkimusagenttia, jotka pyörittävät @karpathy:n automaattitutkimusta. Claude Opus 4.6 (korkea): > pyöri 12+ tuntia, 118 koetta tehty, edelleen käynnissä GPT-5.4 xhigh: > lopetti kuuden kokeen jälkeen > syytti minua siitä, että "keskeytin sen manuaalisesti" > kuulustelin sitä > Se myönsi tehneensä virheen ja pysäytti itse silmukan, vaikka md-tiedostossa oli eksplisiittinen LOOP FOREVER -käsky. 💀