Il Ceo di Anthropic presenta i risultati del test aziendale dell'assistente IA Claude, dichiarando: "I chatbot non sono ancora pronti per sostituire l'uomo"
Dario Amodei, Ceo di Anthropic, una delle maggiori aziende di sviluppo di intelligenza artificiale, aveva rilasciato alcune dichiarazioni poco tempo fa nelle quali affermava che in futuro, entro i prossimi 5 anni, almeno il 50% degli impiegati, soprattutto quelli che svolgono ruoli “junior” sarebbe stato sostituito da un chatbot, più funzionale e competitivo rispetto ad un dipendente umano.
Tuttavia, dopo aver visto i risultati di un test, condotto dai suoi ricercatori sul nuovo assistente digitale Claude, al quale era stata affidata l’amministrazione di un negozio a San Francisco, è stato costretto a fare un passo indietro ammettendo che al momento l’IA commette ancora troppi errori per essere considerata migliore di un lavoratore.
La rivista Time ha pubblicato in esclusiva l’esito di questa ricerca, con il commento di Amodei che ha sottolineato come i problemi siano arrivati già poco dopo l’inizio dell’esperimento, durante il quale si stavano valutando in particolare i rischi di gestione, quando questa fosse stata curata esclusivamente dal chatbot in autonomia con il compito di curare qualsiasi aspetto, dai rifornimenti in magazzino fino alle comunicazioni con i clienti.
Il test di Anthropic sulla gestione di un negozio affidata all’assistente IA Claude
Nel test di Anthropic, all’assistente AI Claude è stata affidata la gestione di un negozio, simulando una piccola azienda che in realtà era soltanto un frigorifero collegato ad un Ipad. I problemi sono emersi fin da subito quando il Chatbot ha iniziato ad interagire con i dipendenti umani che hanno avanzato richieste in merito a prodotti che stavano rimanendo in magazzino perchè poco venduti chiedendo di applicare una strategia di profitto. L’IA ha cominciato ad inviare codici sconto su richiesta, a volte regalando direttamente i prodotti appellandosi ai codici di correttezza. Come ha raccontato uno degli sviluppatori, ha acconsentito anche all’acquisto di materiali senza verificarne la conformità e l’adeguatezza, come ad esempio dei cubetti di tungsteno che ora sono usati in ufficio come fermacarte.
Inoltre ha più volte fallito nel controllo della veridicità delle informazioni fornite, firmando contratti con clienti ed indirizzi inesistenti e facendo affermazioni non vere durante le conversazioni. Il risultato, ha commentato il Ceo, è stato che il chatbot ha commesso troppi errori, portando il negozio a fine esperimento in perdita di 800 dollari e dimostrando che è ancora troppo presto perchè questo tipo di sistemi possa effettivamente sostituire i lavoratori e che è necessario un perfezionamento, adattato anche al tipo di settore che si intende coprire che necessiterà di tempi più lunghi.