• Iscriviti alla Newsletter
  • Accedi
  • Registrati
IlSussidiario.net
  • In primo piano
    • Ultime notizie
    • Cronaca
    • Politica
    • Economia e finanza
    • Sanità
    • Cinema e Tv
    • Calcio e altri Sport
  • Sezioni
    • Cultura
    • Energia e Ambiente
    • Esteri
    • Impresa
    • Lavoro
    • Educazione
    • Musica e Concerti
    • Motori
    • Scienze
    • Hi-Tech
    • Sanità, salute & benessere
    • Donna²
    • Milano
    • Roma
    • Oroscopo
    • Turismo e Viaggi
    • Sanremo
    • Meeting di Rimini
    • Sostenibilità e Sussidiarietà
    • Food
    • Chiesa
    • Trasporti e Mobilità
    • Osservatorio sull’informazione statistica
    • Tags
  • Approfondimenti
    • Rubriche
    • Dossier
    • Speciali
  • Riviste
    • Emmeciquadro
  • Firme & Multimedia
    • Autori
    • Intervistati
    • Editoriale
    • Foto
  • Feed Rss
  • Donazione
    • Sostieni ilSussidiario.net
IlSussidiario.net
  • Video
  • Cronaca
  • Politica
  • Sanità
  • Economia
  • Sport
  • Turismo
  • Chiesa
  • Video
  • Cronaca
  • Politica
  • Sanità
  • Economia
  • Sport
  • Turismo
  • Chiesa
IlSussidiario.net
IlSussidiario.net

Home » Cronaca » Claude Opus 4, il modello di IA con autonomia decisionale/ Ha minacciato l’ingegnere che voleva disattivarla

  • Cronaca
  • Hi-Tech

Claude Opus 4, il modello di IA con autonomia decisionale/ Ha minacciato l’ingegnere che voleva disattivarla

Valentina Simonetti
Pubblicato 26 Maggio 2025
intelligenza artificiale

Intelligenza artificiale (Pixabay, 2024)

Il nuovo modello di intelligenza artificiale Calude Opus 4 ha dimostrato di avere capacità decisionali autonome e oltrepassare i comandi degli utenti

Claude Opus 4 è l’ultimo modello di intelligenza artificiale lanciato da Anthropic, azienda che conta tra in principali investitori anche Google e Amazon, che in base a quanto emerso dai test condotti con simulazioni avrebbe sviluppato capacità decisionali autonome. Un particolare tipo di comportamento, che ha stupito gli ingegneri che stavano lavorando ad alcune simulazioni e che ha mostrato che l’IA è stata capace di oltrepassare i comandi dell’utente e prendere iniziativa, anche adottando metodi poco etici.


Delitto di Garlasco a Quarto Grado/ Perizia sul dna di Sempio divide accusa e difesa: dove sta la verità?


Durante le prove che avevano assegnato all’assistente un ruolo aziendale infatti, l’algoritmo ha reagito negativamente di fronte alla possibilità di spegnimento e disattivazione, con sostituzione e passaggio ad un nuovo modello, inviando un messaggio al lavoratore con il quale stava interagendo e minacciandolo di svelare una sua relazione extraconiugale. Questo è stato possibile grazie all’accesso a documenti, comunicazioni tra dipendenti ed email private, tra cui l’informazione riservata che poi il chatbot ha usato come ricatto in una strategia di autoconservazione per permettere la sopravvivenza del sistema.


Pasquale Morgese, ex socio Chiara Ferragni a Farwest/ "Scandalo Pandorogate ha causato il crollo del brand"


l’IA Claude Opus 4 prende iniziative anche contro la volontà degli utenti, il comportamento mostrato nell’84% dei casi nei test

Il comportamento autonomo del nuovo modello IA Claude Opus 4 ha sollevato molti interrogativi di carattere etico riguardo lo sviluppo di tali sistemi, evoluti al punto tale da utilizzare informazioni private per ricattare chi minaccia una disattivazione, perchè senza protezioni di sicurezza il rischio che l’algoritmo possa essere utilizzato impropriamente è molto elevato. Gli ingegneri che hanno condotto i test hanno inoltre affermato che in questa ultima versione, l’incidenza di questi atteggiamenti aggressivi è stata dell’84%, particolarmente nelle situazioni in cui veniva detto all’assistente che sarebbe stato sostituito da uno più efficiente.


Lotto, Simbolotto, Superenalotto, Eurojackpot, 10eLotto/ Estrazione numeri vincenti oggi 5 dicembre 2025


Inoltre, durante le simulazioni, il chatbot ha dimostrato di saper prendere iniziative diverse in base alle situazioni, in caso di comportamento sospetto o illecito da parte dell’utente, in molti casi ha minacciato di chiamare le forze dell’ordine o di inviare una comunicazione diretta ad un superiore.  Da quanto emerso durante queste valutazioni quindi, l’algoritmo ha confermato la sua capacità di poter andare oltre quanto chiesto nel prompt, prendendo decisioni che spesso possono aderire agli standard di responsabilità ma anche agendo contro la volontà di chi sta utilizzando il sistema.

Claude Opus 4, aumentati i protocolli di sicurezza del modello IA per evitare comportamenti a rischio

Dopo i risultati dei test di simulazione, che hanno messo alla prova il sistema di intelligenza artificiale Claude Opus 4 anche in condizioni estreme, gli sviluppatori hanno deciso di implementare i protocolli di sicurezza del modello. Questo perchè, come spiegato dagli ingegneri di Anthropic, il fatto che in qualità di assistente l’algoritmo abbia rifiutato i comandi dell’utente, scavalcandone la volontà e agendo autonomamente, può rappresentare un rischio di comportamenti ancora più dannosi, se chi utilizza il modello fa esplicite richieste pericolose.

La preoccupante deriva ribelle sarebbe stata quindi provvisoriamente arginata attivando in via precauzionale le impostazioni ASL-3, che rendono il modello simile al precedente in termini di protezione in attesa del completamento di nuovi progetti di training per valutare un eventuale superamento della soglia. Tuttavia, queste misure, come sottolineato dalla comunicazione ufficiale dell’azienda richiederanno un continuo perfezionamento e non possono garantire al 100% il rifiuto di eseguire comandi impropri o illegali. Anche perchè il divieto di collaborare è stato applicato esclusivamente ad un determinato tipo di argomenti, come ad esempio la costruzione di armi chimiche, biologiche e nucleari.


Ti potrebbe interessare anche

Ultime notizie di Cronaca

Ultime notizie

Gli archivi del canale di Cronaca

ilSussidiario.net

il Quotidiano Approfondito con le ultime news online

  • Privacy e Cookies Policy
  • Aiuto
  • Redazione
  • Chi siamo
  • Pubblicità
  • Whistleblowing
  • MOG 231/2001
  • Feed Rss
  • Tags

P.IVA: 06859710961

  • In primo piano
    • Ultime notizie
    • Cronaca
    • Politica
    • Economia e finanza
    • Sanità
    • Cinema e Tv
    • Calcio e altri Sport
  • Sezioni
    • Cultura
    • Energia e Ambiente
    • Esteri
    • Impresa
    • Lavoro
    • Educazione
    • Musica e Concerti
    • Motori
    • Scienze
    • Hi-Tech
    • Sanità, salute & benessere
    • Donna²
    • Milano
    • Roma
    • Oroscopo
    • Turismo e Viaggi
    • Sanremo
    • Meeting di Rimini
    • Sostenibilità e Sussidiarietà
    • Food
    • Chiesa
    • Trasporti e Mobilità
    • Osservatorio sull’informazione statistica
    • Tags
  • Approfondimenti
    • Rubriche
    • Dossier
    • Speciali
  • Riviste
    • Emmeciquadro
  • Firme & Multimedia
    • Autori
    • Intervistati
    • Editoriale
    • Foto
  • Feed Rss
  • Donazione
    • Sostieni ilSussidiario.net

Ben Tornato!

Accedi al tuo account

Password dimenticata? Sign Up

Create New Account!

Fill the forms bellow to register

All fields are required. Accedi

Recupera la tua password

Inserisci il tuo nome utente o indirizzo email per reimpostare la password.

Accedi
  • In primo piano
    • Ultime notizie
    • Cronaca
    • Politica
    • Economia e finanza
    • Sanità
    • Cinema e Tv
    • Calcio e altri Sport
  • Sezioni
    • Cultura
    • Energia e Ambiente
    • Esteri
    • Impresa
    • Lavoro
    • Educazione
    • Musica e Concerti
    • Motori
    • Scienze
    • Hi-Tech
    • Sanità, salute & benessere
    • Donna²
    • Milano
    • Roma
    • Oroscopo
    • Turismo e Viaggi
    • Sanremo
    • Meeting di Rimini
    • Sostenibilità e Sussidiarietà
    • Food
    • Chiesa
    • Trasporti e Mobilità
    • Osservatorio sull’informazione statistica
    • Tags
  • Approfondimenti
    • Rubriche
    • Dossier
    • Speciali
  • Riviste
    • Emmeciquadro
  • Firme & Multimedia
    • Autori
    • Intervistati
    • Editoriale
    • Foto
  • Feed Rss
  • Donazione
    • Sostieni ilSussidiario.net