Passei a tarde testando o novo produto de automação do consumidor do ChatGPT - Agent. Onde funciona e onde fica aquém? E como ele se compara ao Operator (e produtos mais recentes como o Perplexity's Comet)? Minha avaliação 👇
Muitas vezes também "exagerava" em tarefas simples - mas não conseguia concluir as mais complexas. Ex. O agente levou um minuto inteiro para encontrar a data / hora de um 1:1 recente e não conseguiu agendar um novo (abaixo está a velocidade ⬇️ 4x) O Comet encontrou a mesma informação e enviou um novo convite em <10 segundos.
Os limites de privacidade e segurança do ChatGPT também atrapalham. O agente concordou em fazer um pôster de aniversário para @illscience, puxando a data do meu calendário e uma foto dele da Internet. Mas o resultado final (levou 13 minutos) redigiu seu nome e foto por "razões de privacidade" 🤦 ♀️
No que o Agent é realmente bom? Obter uma vantagem inicial em tarefas de pesquisa ou computação não sensíveis ao tempo. Ex. O agente criou um modelo DCF da NVIDIA (em formato Excel para download!) em 25 min. A formatação não é exatamente como eu teria feito, mas este é um grande passo à frente.
265,97K