GPT-5.4 xhigh parece malo siguiendo instrucciones. Anoche lancé dos agentes de investigación de IA ejecutando la autoresearch de @karpathy. Claude Opus 4.6 (alto): > funcionó durante más de 12 horas, 118 experimentos realizados, aún en ejecución GPT-5.4 xhigh: > se detuvo después de 6 experimentos > me culpó por “interrumpir manualmente” > lo interrogué > Admitió que cometió un error y detuvo el bucle por sí mismo, a pesar de una instrucción explícita de BUCLE PARA SIEMPRE en el archivo md. 💀