Criei minha primeira "habilidade". O Codex extrai logs de erros recentes da produção onde o agente fez chamadas de ferramenta que falharam. os logs incluem estado suficiente para que o Codex possa: - classificar cada caso - se reproduzir localmente - depuração e correção, caso o produto seja bugado Corrigiu alguns bugs obscuros
Às vezes os erros são só LLMs sendo bobos, como chamar minha ferramenta de "substituição" com strings idênticas para a correspondência e substituição. Mas muitas vezes, é um bug nas minhas coisas. Posso simplesmente rodar "$tool-failure-triage" no Codex quando quiser. É incrível.
quando faço isso acontecer, realmente parece um funcionário
20 minutos de trabalho, tão incrível
29