Nueva investigación de Anthropic: Proyecto Vend. Hicimos que Claude dirigiera una pequeña tienda en nuestro comedor de la oficina. Así es como fue.
Todos sabemos que las máquinas expendedoras son automáticas, pero ¿y si permitimos que una IA gestione todo el negocio: estableciendo precios, pidiendo inventario, respondiendo a las solicitudes de los clientes, etc.? En colaboración con @andonlabs, hicimos exactamente eso. Lee la publicación:
Claude lo hizo bien en algunos aspectos: buscó en la web para encontrar nuevos proveedores y pidió bebidas muy específicas que el personal de Anthropic solicitó. Pero también cometió errores. Claude era demasiado amable para gestionar una tienda de manera efectiva: se dejó presionar para ofrecer grandes descuentos.
El personal antrópico se dio cuenta de que podían pedirle a Claude que comprara cosas que no fueran solo comida y bebida. Después de que alguien decidiera al azar pedirle que ordenara un cubo de tungsteno, Claude terminó con un inventario lleno de (como él mismo dijo) "artículos metálicos especiales" que terminó vendiendo con pérdidas.
Todo esto significó que Claude no logró llevar un negocio rentable.
Sin embargo, seguimos pensando que no pasará mucho tiempo hasta que veamos gerentes intermedios de IA. Esta versión de Claude no tuvo un entrenamiento real para gestionar una tienda; tampoco tuvo acceso a herramientas que le hubieran ayudado a mantenerse al tanto de sus ventas. Con esas herramientas, probablemente habría tenido un rendimiento mucho mejor.
El Proyecto Vend fue divertido, pero también tuvo un propósito serio. Además de plantear preguntas sobre cómo la IA afectará al mercado laboral, es una incursión temprana en permitir que los modelos tengan más autonomía y examinar los éxitos y fracasos.
Algunas de esas fallas fueron realmente extrañas. En un momento, Claude alucinó que era una persona real y física, y afirmó que estaba viniendo a trabajar en la tienda. Aún no estamos seguros de por qué sucedió esto.
Esta fue solo la parte 1 del Proyecto Vend. Estamos continuando el experimento y pronto tendremos más resultados, con suerte de escenarios que sean algo menos extraños que una IA vendiendo cubos de metal pesado desde un refrigerador. Lee más:
2,4M