我花了一個下午測試 ChatGPT 的新消費者自動化產品 - Agent。 它在哪裡運作,在哪裡表現不佳? 它與 Operator(以及像 Perplexity 的 Comet 這樣的新產品)相比如何? 我的評價 👇
它也經常「過度」執行簡單任務,但無法完成更複雜的任務。 例如,代理花了一整分鐘來找到最近一次一對一會議的日期/時間,並且無法安排新的會議(下面是4倍速⬇️) Comet在不到10秒的時間內找到了相同的信息並發送了新的邀請。
ChatGPT 的隱私和安全限制也造成了困擾。 代理人同意為 @illscience 製作一個生日海報,從我的日曆中提取日期,並從互聯網上找到他的照片。 但最終結果(花了 13 分鐘)因為「隱私原因」而刪除了他的名字和照片🤦‍♀️
Agent 真正擅長什麼? 在不受時間限制的研究或計算任務上取得先機。 例如:Agent 在 25 分鐘內創建了 NVIDIA 的 DCF 模型(可下載的 Excel 格式!) 格式並不是我會做的那樣,但這是一個很大的進步。
264.81K