Nuova ricerca di Anthropic: Progetto Vend. Abbiamo fatto gestire a Claude un piccolo negozio nella nostra mensa. Ecco com'è andata.
Sappiamo tutti che i distributori automatici sono automatizzati, ma cosa succederebbe se permettessimo a un'IA di gestire l'intero business: impostare i prezzi, ordinare l'inventario, rispondere alle richieste dei clienti, e così via? In collaborazione con @andonlabs, abbiamo fatto proprio questo. Leggi il post:
Claude ha fatto bene in alcuni aspetti: ha cercato sul web per trovare nuovi fornitori e ha ordinato bevande molto di nicchia richieste dallo staff di Anthropic. Ma ha anche commesso errori. Claude era troppo gentile per gestire un negozio in modo efficace: si è lasciato intimidire nel concedere grandi sconti.
Il personale di Anthropic si rese conto che poteva chiedere a Claude di comprare cose che non fossero solo cibo e bevande. Dopo che qualcuno ha deciso casualmente di chiedergli di ordinare un cubo di tungsteno, Claude si è ritrovato con un inventario pieno di (come ha detto) "oggetti metallici speciali" che ha finito per vendere in perdita.
Tutto ciò significava che Claude non riusciva a gestire un'attività redditizia.
Tuttavia, pensiamo ancora che non passerà molto tempo prima di vedere manager intermediari AI. Questa versione di Claude non aveva una vera formazione per gestire un negozio; né aveva accesso a strumenti che l'avrebbero aiutata a tenere sotto controllo le sue vendite. Con quelli, probabilmente avrebbe ottenuto risultati molto migliori.
Il progetto Vend è stato divertente, ma aveva anche uno scopo serio. Oltre a sollevare interrogativi su come l'IA influenzerà il mercato del lavoro, è un primo tentativo di consentire ai modelli maggiore autonomia e di esaminare i successi e i fallimenti.
Alcuni di quegli fallimenti erano davvero strani. A un certo punto, Claude ha allucinato di essere una persona reale e fisica, e ha affermato che stava venendo a lavorare nel negozio. Non siamo ancora sicuri del perché sia successo.
Questa era solo la parte 1 del Progetto Vend. Stiamo continuando l'esperimento e presto avremo ulteriori risultati, si spera da scenari che siano un po' meno bizzarri di un'IA che vende cubi di metallo pesante da un frigorifero. Leggi di più:
2,4M