熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
我花了一個下午測試 ChatGPT 的新消費者自動化產品 - Agent。
它在哪裡運作,在哪裡表現不佳?
它與 Operator(以及像 Perplexity 的 Comet 這樣的新產品)相比如何?
我的評價 👇
它也經常「過度」執行簡單任務,但無法完成更複雜的任務。
例如,代理花了一整分鐘來找到最近一次一對一會議的日期/時間,並且無法安排新的會議(下面是4倍速⬇️)
Comet在不到10秒的時間內找到了相同的信息並發送了新的邀請。
ChatGPT 的隱私和安全限制也造成了困擾。
代理人同意為 @illscience 製作一個生日海報,從我的日曆中提取日期,並從互聯網上找到他的照片。
但最終結果(花了 13 分鐘)因為「隱私原因」而刪除了他的名字和照片🤦♀️

Agent 真正擅長什麼?
在不受時間限制的研究或計算任務上取得先機。
例如:Agent 在 25 分鐘內創建了 NVIDIA 的 DCF 模型(可下載的 Excel 格式!)
格式並不是我會做的那樣,但這是一個很大的進步。

264.81K
熱門
排行
收藏