Mi-am petrecut după-amiaza testând noul produs de automatizare a consumatorilor de la ChatGPT - Agent. Unde funcționează și unde nu reușește? Și cum se compară cu Operator (și produse mai noi, cum ar fi Comet de la Perplexity)? Recenzia 👇 mea
De asemenea, adesea a "exagerat" sarcinile simple - dar nu a putut finaliza cele mai complexe. Ex. Agentul a avut nevoie de un minut întreg pentru a găsi data / ora unui 1:1 recent și nu a putut programa unul nou (mai jos este viteza ⬇️ de 4x) Comet a găsit aceleași informații și a trimis o nouă invitație în <10 secunde.
Limitele de confidențialitate și siguranță ale ChatGPT stau și ele în cale. Agentul a fost de acord să facă un poster de ziua lui @illscience, scoțând data din calendarul meu și o fotografie cu el de pe internet. Dar rezultatul final (a durat 13 minute) i-a redactat numele și fotografia din "motive de confidențialitate" 🤦 ♀️
La ce este cu adevărat bun Agent? Obținerea unui avans în sarcinile de cercetare sau de calcul care nu sunt sensibile la timp. Ex. Agent a creat un model DCF de NVIDIA (în format Excel descărcabil!) în 25 de minute. Formatarea nu este exact așa cum aș fi făcut-o, dar acesta este un mare pas înainte.
266,74K