熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
新的人類學研究:Vend 專案。
我們讓 Claude 在我們的辦公室餐廳經營一家小商店。事情是這樣的。

我們都知道自動售貨機是自動化的,但如果我們允許 AI 運行整個業務:設置價格、訂購庫存、回應客戶請求等,情況會怎樣?
通過與 @andonlabs 合作,我們做到了這一點。
閱讀博文:

Claude 在某些方面做得很好:它在網上搜索尋找新的供應商,並訂購了 Anthropic 員工要求的非常小眾的飲料。
但它也犯了錯誤。Claude 太善良了,無法有效地經營一家商店:它允許自己被脅迫提供大幅折扣。
人類的工作人員意識到他們可以要求克勞德購買不僅僅是食物和飲料的東西。
在有人隨機決定要求它訂購一個鎢立方體後,克勞德最終得到了一個裝滿(如它所說)“特種金屬物品”的庫存,最終虧本出售。

所有這些都意味著 Claude 無法經營一家盈利的企業。

儘管如此,我們仍然認為用不了多久就會看到 AI 中層管理人員。
這個版本的克勞德沒有接受過經營商店的真正訓練;它也沒有獲得有助於它保持銷售的工具。
有了這些,它的表現可能會好得多。
Project Vend 很有趣,但它也有很嚴肅的目的。除了引發有關 AI 將如何影響勞動力市場的問題外,它還為模型提供了更多自主權並研究了成功和失敗。
其中一些失敗確實非常奇怪。有一次,克勞德產生幻覺,認為這是一個真實的人,並聲稱它是來店裡工作的。我們仍然不確定為什麼會這樣。

這隻是 Project Vend 的第 1 部分。我們正在繼續實驗,我們很快就會有更多的結果——希望這些結果的場景比 AI 從冰箱裡賣重金屬塊要少一些奇怪。
閱讀更多:
2.4M
熱門
排行
收藏