GPT-5.4 xhigh se zdá být špatný v dodržování pokynů. Včera večer jsem spustil dva AI výzkumné agenty, kteří provozovali autoresearch @karpathy. Claude Opus 4.6 (vysoko): > běžel 12+ hodin, udělal 118 experimentů, stále běžel GPT-5.4 xhigh: > přestal po 6 experimentech > mě obvinila, že jsem to "ručně přerušil" > Vyslýchal jsem ho > Přiznal chybu a smyčku sám zastavil, i přes explicitní instrukci LOOP FOREVER v md souboru. 💀