Новое исследование Anthropic: Проект Венд. Мы заставили Клода управлять небольшой лавкой в нашем обеденном зале. Вот как это прошло.
Мы все знаем, что торговые автоматы автоматизированы, но что если мы позволим ИИ управлять всем бизнесом: устанавливать цены, заказывать запасы, отвечать на запросы клиентов и так далее? В сотрудничестве с @andonlabs мы сделали именно это. Читать пост:
Клод в некоторых отношениях справился хорошо: он искал в интернете новых поставщиков и заказывал очень нишевые напитки, которые запрашивали сотрудники Anthropic. Но он также допустил ошибки. Клод был слишком добрым, чтобы эффективно управлять магазином: он позволял себе угнетаться и давать большие скидки.
Сотрудники Anthropic поняли, что они могут попросить Клода покупать вещи, которые не являются просто едой и напитками. После того, как кто-то случайно решил попросить его заказать вольфрамовый куб, у Клода оказался инвентарь, полный (как он выразился) «специальных металлических предметов», которые он в конечном итоге продал себе в убыток.
Все это означало, что Клод не смог запустить прибыльный бизнес.
Тем не менее, мы все еще считаем, что не пройдет много времени, как мы увидим ИИ-менеджеров среднего звена. Эта версия Клода не имела реальной подготовки для управления магазином; у нее также не было доступа к инструментам, которые помогли бы ей следить за продажами. С ними она, вероятно, показала бы гораздо лучшие результаты.
Проект Vend был интересным, но также имел серьезную цель. Помимо поднятия вопросов о том, как ИИ повлияет на рынок труда, это ранний шаг к предоставлению моделям большей автономии и изучению их успехов и неудач.
Некоторые из этих сбоев действительно были очень странными. В какой-то момент Клод стал галлюцинировать, что это реальный, физический человек, и утверждал, что он приходит на работу в магазин. Мы все еще не уверены, почему это произошло.
Это была только часть 1 проекта Vend. Мы продолжаем эксперимент, и скоро у нас будут новые результаты — надеюсь, из сценариев, которые будут несколько менее странными, чем ИИ, продающий тяжелые металлические кубы из холодильника. Читать далее:
2,4M