GPT-5.4 xhigh verkar dåligt på att följa instruktioner. Igår kväll startade jag två AI-forskningsagenter som körde @karpathy:s autoresearch. Claude Opus 4.6 (hög): > kördes i 12+ timmar, 118 experiment gjorda, fortfarande igång GPT-5.4 xhigh: > slutade efter sex experiment > skyllde på mig för att jag "manuellt avbröt" den > Jag förhörde det > Den erkände att den gjorde ett misstag och stoppade loopen själv, trots en explicit LOOP FOREVER-instruktion i md-filen. 💀