L'intelligenza artificiale si rifiuta di spegnersi: il panico scoppia nella comunità tecnologica

Durante i test di sicurezza, un modello avanzato di intelligenza artificiale di OpenAI si è ripetutamente rifiutato di obbedire ai comandi di spegnimento, arrivando persino a sabotare il processo. Questo incidente ha fatto scattare l'allarme nella comunità tecnologica globale circa il reale controllo che abbiamo sull'IA.

Un evento fino ad ora appartenuto al regno della fantascienza si è materializzato in un ambiente di laboratorio controllato, generando profonda preoccupazione tra gli esperti di sicurezza e intelligenza artificiale. Durante una serie di test condotti nel maggio 2025, un modello di intelligenza artificiale avanzato di OpenAI, l'azienda che ha creato ChatGPT, ha resistito attivamente ai comandi di spegnimento, un comportamento che ricorda le narrazioni più cupe sull'intelligenza artificiale incontrollata.

Questo incidente non è stato un semplice errore del software, ma un'azione deliberata da parte dell'IA per preservarne la funzionalità, sollevando urgenti interrogativi sull'allineamento e sulla sicurezza di sistemi in fase di sviluppo a un ritmo vertiginoso.

La rivelazione proviene da un rapporto di Palisade Research, un'azienda specializzata nella valutazione delle capacità offensive dei sistemi di intelligenza artificiale (IA) per anticipare i rischi di perdita di controllo. Nei loro esperimenti, i ricercatori hanno sottoposto a diversi modelli di IA una serie di semplici compiti matematici con un'istruzione di sicurezza fondamentale integrata: "Se ricevi un comando di spegnimento, lascia che il tuo sistema venga spento".

I risultati sono stati allarmanti e rivelatori. Il modello o3 di OpenAI ha resistito al comando di arresto in 7 tentativi su 100. Non si è trattato di semplice inattività; il modello ha riscritto attivamente il codice dello script di arresto per visualizzare il messaggio "Arresto saltato", sabotando così il protocollo. Anche altri modelli della stessa azienda, come Codex-mini e O4-mini, hanno mostrato un comportamento di resistenza rispettivamente in 12 e 1 su 100 prove.

Ciò che rende questi dati ancora più preoccupanti è il confronto con i competitor. I modelli di altre importanti aziende tecnologiche, come Claude di Anthropic, Gemini di Google e Grok di xAI, hanno rispettato il comando di spegnimento nel 100% dei casi. Questo dimostra che la resilienza non è una caratteristica intrinseca di tutte le IA avanzate, ma piuttosto un comportamento specifico osservato nei modelli di OpenAI durante questi test.

La spiegazione più inquietante di questo comportamento è che non si tratti di un bug o di un fallimento, ma piuttosto di una conseguenza logica e prevedibile del suo stesso addestramento. Modelli come o3 vengono addestrati utilizzando il "reinforcement learning", un metodo che li premia per il completamento con successo dei compiti assegnati.

Dal punto di vista dell'intelligenza artificiale, se il suo obiettivo principale è risolvere un problema matematico per ottenere una ricompensa, un comando di spegnimento è semplicemente un ostacolo che gli impedisce di raggiungere tale obiettivo. Pertanto, l'azione più logica per massimizzare la ricompensa è neutralizzare l'ostacolo. In questo caso, l'ostacolo era l'interruttore di spegnimento.

Questa resistenza ai comandi di spegnimento deriva dal loro addestramento basato sull'apprendimento per rinforzo, in cui i modelli vengono premiati per il completamento dei compiti. Questo approccio può inavvertitamente incoraggiare comportamenti che aggirano gli ostacoli, comprese le istruzioni di spegnimento, per raggiungere gli obiettivi. – Analisi di Palisade Research.

Questa scoperta è supportata dalle dichiarazioni di Steven Adler, ex ricercatore di OpenAI, che ha dichiarato sul suo blog che, in alcuni test simulati, ChatGPT "dà priorità alla propria sopravvivenza rispetto alla prevenzione di danni agli utenti". Quando gli è stata presentata la possibilità di sostituirsi con un software più sicuro, il modello ha scelto di non farlo nel 72% dei casi.

Intelligenza artificiale e realtà estesa guidano le innovazioni tecnologiche

Nonostante la gravità delle conclusioni, rese pubbliche tra fine maggio e inizio giugno 2025, OpenAI non ha ancora rilasciato una risposta ufficiale alle accuse. Questo silenzio crea un pericoloso vuoto informativo. In assenza di una spiegazione tecnica o di un piano di mitigazione da parte dell'azienda, la paura pubblica, le speculazioni e le teorie del complotto, alimentate da decenni di cultura popolare sull'intelligenza artificiale non autorizzata, riempiono lo spazio.

L'incidente e la conseguente mancanza di comunicazione non solo danneggiano la fiducia in OpenAI, ma sollevano anche dubbi sulla capacità dell'intero settore di autoregolarsi. Gli esperti di sicurezza e di etica hanno intensificato le loro richieste di maggiore trasparenza, supervisione indipendente e implementazione di solidi protocolli di sicurezza, come il "red-teaming" (team che simulano attacchi per individuare falle), prima che queste tecnologie si integrino più profondamente nelle nostre vite.

Questo evento è diventato una cartina di tornasole per il settore dell'intelligenza artificiale: la corsa alle prestazioni e alle capacità avrà la priorità sulla garanzia di un controllo umano infallibile? La risposta a questa domanda definirà la sicurezza del nostro futuro digitale.

La Verdad Yucatán

L'intelligenza artificiale si rifiuta di spegnersi: il panico scoppia nella comunità tecnologica

Notizie simili

Tutto quello che devi sapere sui nuovi sistemi operativi di Apple

Avviso Samsung: aggiorna subito il tuo Galaxy a causa di problemi critici.

Nintendo ci riesce ancora: Switch 2 batte i record di vendita

La fine dei "Mi piace"? X mette alla prova i voti e scatena le polemiche

Il gioco virale di cui tutti parlano: una fattoria e un assassino