GPT-5.4 xhigh tampaknya buruk dalam mengikuti instruksi. Tadi malam saya meluncurkan dua agen riset AI yang menjalankan riset otomatis @karpathy. Claude Opus 4.6 (tinggi): > berjalan selama 12+ jam, 118 eksperimen selesai, masih berjalan GPT-5.4 xtinggi: > berhenti setelah 6 percobaan > menyalahkan saya karena "mengganggunya secara manual" > saya menginterogasinya > Itu mengakui bahwa mereka membuat kesalahan dan menghentikan loop itu sendiri, meskipun ada instruksi LOOP FOREVER eksplisit dalam file md. 💀