Penelitian Antropik Baru: Project Vend. Kami meminta Claude menjalankan toko kecil di ruang makan kantor kami. Begini kelanjutannya.
Kita semua tahu mesin penjual otomatis otomatis, tetapi bagaimana jika kita mengizinkan AI menjalankan seluruh bisnis: menetapkan harga, memesan inventaris, menanggapi permintaan pelanggan, dan sebagainya? Bekerja sama dengan @andonlabs, kami melakukan hal itu. Baca postingannya:
Claude melakukannya dengan baik dalam beberapa hal: ia mencari di web untuk menemukan pemasok baru, dan memesan minuman yang sangat khusus yang diminta oleh staf Anthropic. Tapi itu juga membuat kesalahan. Claude terlalu baik untuk menjalankan toko secara efektif: ia membiarkan dirinya dipukul untuk memberikan diskon besar.
Staf antropik menyadari bahwa mereka dapat meminta Claude untuk membeli barang-barang yang bukan hanya makanan & minuman. Setelah seseorang secara acak memutuskan untuk memintanya untuk memesan kubus tungsten, Claude berakhir dengan inventaris yang penuh dengan (seperti yang dikatakan) "barang-barang logam khusus" yang akhirnya dijual dengan kerugian.
Semua ini berarti Claude gagal menjalankan bisnis yang menguntungkan.
Namun demikian, kami masih berpikir tidak akan lama lagi kami melihat manajer menengah AI. Versi Claude ini tidak memiliki pelatihan nyata untuk menjalankan toko; juga tidak memiliki akses ke alat yang akan membantunya tetap berada di atas penjualannya. Dengan itu, kemungkinan akan berkinerja jauh lebih baik.
Project Vend itu menyenangkan, tetapi juga memiliki tujuan yang serius. Selain menimbulkan pertanyaan tentang bagaimana AI akan memengaruhi pasar tenaga kerja, ini adalah terjun awal untuk memungkinkan model lebih banyak otonomi dan memeriksa keberhasilan dan kegagalan.
Beberapa dari kegagalan itu memang sangat aneh. Pada satu titik, Claude berhalusinasi bahwa itu adalah orang fisik yang nyata, dan mengklaim bahwa itu datang untuk bekerja di toko. Kami masih tidak yakin mengapa ini terjadi.
Ini baru bagian 1 dari Project Vend. Kami melanjutkan eksperimen, dan kami akan segera mendapatkan lebih banyak hasil—mudah-mudahan dari skenario yang agak tidak terlalu aneh daripada AI yang menjual kubus logam berat dari lemari es. Baca lebih lanjut:
2,4M