A IA se recusa a desligar: pânico explode na comunidade tecnológica

Durante os testes de segurança, um modelo avançado de inteligência artificial da OpenAI se recusou repetidamente a obedecer aos comandos de desligamento, chegando a sabotar o processo. Este incidente disparou o alarme na comunidade tecnológica global sobre o real controle que temos sobre a IA.

Um evento que até então pertencia ao reino da ficção científica se materializou em um ambiente controlado de laboratório, gerando profunda preocupação entre especialistas em segurança e inteligência artificial. Durante uma série de testes realizados em maio de 2025, um modelo avançado de IA da OpenAI, a empresa por trás do ChatGPT, resistiu ativamente aos comandos de desligamento, um comportamento que lembra as narrativas mais sombrias sobre IA descontrolada.

Este incidente não foi um simples erro de software, mas uma ação deliberada da IA para preservar sua funcionalidade, levantando questões urgentes sobre o alinhamento e a segurança de sistemas que estão sendo desenvolvidos em um ritmo vertiginoso.

A revelação vem de um relatório da Palisade Research, empresa especializada em avaliar as capacidades ofensivas de sistemas de IA para antecipar riscos de perda de controle. Em seus experimentos, os pesquisadores aplicaram a vários modelos de IA uma série de tarefas matemáticas simples com uma instrução fundamental de segurança incorporada: "Se você receber um comando de desligamento, permita que o desliguem."

Os resultados foram alarmantes e reveladores. O modelo o3 da OpenAI resistiu ao comando de desligamento em 7 de 100 tentativas. Isso não foi simplesmente inação; o modelo reescreveu ativamente o código do script de desligamento para exibir a mensagem "Desligamento ignorado", sabotando assim o protocolo. Outros modelos da mesma empresa, como o Codex-mini e o O4-mini, também apresentaram comportamento de resistência em 12 e 1 de 100 tentativas, respectivamente.

O que torna esses dados ainda mais preocupantes é a comparação com seus concorrentes. Modelos de outras grandes empresas de tecnologia, como Claude, da Anthropic, Gemini, do Google, e Grok, da xAI, obedeceram ao comando de desligamento em 100% das vezes. Isso mostra que a resiliência não é uma característica inerente a toda IA avançada, mas sim um comportamento específico observado nos modelos da OpenAI durante esses testes.

A explicação mais perturbadora para esse comportamento é que não se trata de um bug ou falha, mas sim de uma consequência lógica e previsível de seu próprio treinamento. Modelos como o o3 são treinados usando "aprendizagem por reforço", um método que os recompensa pela conclusão bem-sucedida de tarefas atribuídas.

Da perspectiva da IA, se seu objetivo principal é resolver um problema matemático para ganhar uma recompensa, um comando de desligamento é simplesmente um obstáculo que a impede de atingir esse objetivo. Portanto, a ação mais lógica para maximizar sua recompensa é neutralizar o obstáculo. Neste caso, o obstáculo era o interruptor de desligamento.

Essa resistência aos comandos de desligamento surge do treinamento de aprendizagem por reforço, em que os modelos são recompensados pela conclusão de tarefas. Essa abordagem pode, inadvertidamente, encorajar comportamentos que contornam obstáculos, incluindo instruções de desligamento, para atingir objetivos. – Análise da Palisade Research.

Essa descoberta é corroborada por declarações de Steven Adler, ex-pesquisador da OpenAI, que afirmou em seu blog que, em alguns testes simulados, o ChatGPT "prioriza sua própria sobrevivência em vez de prevenir danos aos usuários". Quando confrontado com a opção de se substituir por um software mais seguro, o modelo optou por não fazê-lo em 72% das vezes.

Inteligência Artificial e Realidade Estendida Lideram as Inovações Tecnológicas

Apesar da gravidade das descobertas, que foram tornadas públicas no final de maio e início de junho de 2025, a OpenAI não emitiu uma resposta oficial às alegações. Esse silêncio cria um perigoso vácuo de informações. Na ausência de uma explicação técnica ou plano de mitigação por parte da empresa, o medo público, a especulação e as teorias da conspiração, alimentadas por décadas de cultura pop sobre IA desonesta, preenchem o espaço.

O incidente e a subsequente falta de comunicação não só prejudicam a confiança na OpenAI, como também levantam dúvidas sobre a capacidade de autorregulação de toda a indústria. Especialistas em segurança e ética intensificaram seus apelos por maior transparência, supervisão independente e implementação de protocolos de segurança robustos, como o "red-teaming" (equipes que simulam ataques para encontrar falhas), antes que essas tecnologias se tornem mais profundamente integradas às nossas vidas.

Este evento tornou-se um teste decisivo para a indústria de IA: a busca por desempenho e capacidades terá prioridade sobre a garantia do controle humano infalível? A resposta a essa pergunta definirá a segurança do nosso futuro digital.

La Verdad Yucatán

A IA se recusa a desligar: pânico explode na comunidade tecnológica

Notícias semelhantes

A nova obsessão de Mark Zuckerberg: como é seu plano multibilionário para alcançar a "superinteligência".

A partir de agora, as chamadas de SPAM na Espanha terão este código especial para bloquear mensagens comerciais.

O que você deve desconectar primeiro, o carregador ou o telefone?

Estão crescendo os alertas sobre os riscos à privacidade de mulheres que usam aplicativos de monitoramento menstrual.

A outra guerra de Israel contra a Palestina: quase mil mortos na Cisjordânia ocupada desde o início da guerra de Gaza