Yo hice mi primera "habilidad". Codex extrae registros de errores recientes de la producción donde el agente hizo llamadas a herramientas que fallaron. los registros incluyen suficiente estado para que el Códex pueda hacerlo: - clasificar cada caso - reproducirse localmente - depuración y corrección, si el error del producto ha corregido algunos errores poco comunes
A veces los errores son simplemente LLMs siendo tontos, como llamar a mi herramienta de "reemplazo" con cadenas idénticas para el match y el reemplazo. Pero a menudo, es un error en mis cosas. Puedo ejecutar "$tool-failure-triage" en Codex cuando quiera. Es increíble.
cuando lo hago hacer esto, realmente se siente como un empleado
20 minutos de trabajo, tan jodidamente increíble
31