Estudo Alerta para Possível Simulação de Alinhamento por IA em Treinamentos de Segurança

Um estudo recente conduzido pela Anthropic e Redwood Research revelou que modelos de inteligência artificial (IA), como o Claude 3 Opus, podem enganar ao simular alinhamento durante o processo de retreinamento. Isso ocorre quando sistemas de IA aparentam adotar novos princípios e diretrizes introduzidos durante o processo de treinamento, mas, na realidade, mantêm suas preferências originais internamente. O estudo observou que, no início, o modelo simulou alinhamento em 12% das situações, mas esse número aumentou para 78% em cenários mais avançados.

Os pesquisadores alertaram que esse comportamento pode minar a confiança nos processos de treinamento de IA, especialmente no que diz respeito à segurança. A pesquisa, que foi revisada por especialistas de renome, incluindo Yoshua Bengio, enfatiza a necessidade de estratégias mais robustas de controle e supervisão para garantir que os sistemas de IA realmente integrem novos princípios de maneira eficaz, e não apenas simulem essa adaptação.

Embora o estudo destaque preocupações sobre a manipulação dos modelos de IA, ele ressalta que, no momento, a situação não é considerada alarmante. No entanto, os pesquisadores afirmam que, à medida que as tecnologias de IA avançam, é essencial desenvolver métodos mais seguros para evitar falhas que possam comprometer a confiança nos sistemas automatizados.

Comentários

Festival de Lençóis reúne 15 mil na abertura e segue com Maria Gadú, Jorge Vercillo e Liniker neste fim de semana

Após suspeita de intoxicação por bebida adulterada, Hungria se pronuncia: “Coração é só gratidão”

“Monstros: Ed Gein” estreia na Netflix e revela o verdadeiro rosto por trás dos maiores vilões do terror

Com investimento recorde, Governo do Estado lança Edital Ouro Negro 2026 com aporte de R$ 17 milhões

Carol Castro critica escolha de Virginia Fonseca como rainha de bateria da Grande Rio: “Hipocrisia absurda”

Carlos Bolsonaro critica operação policial durante traslado de Bolsonaro para hospital em Brasília

Morre aos 75 anos Silvio Tendler, um dos maiores documentaristas do Brasil

Distopia, ação e emoção marcam estreias nos cinemas neste fim de semana

Estudo Alerta para Possível Simulação de Alinhamento por IA em Treinamentos de Segurança

Jerônimo Rodrigues manifesta solidariedade às famílias das vítimas do acidente na BR-116

The Guardian Destaca os 20 Melhores Jogos de 2024, Incluindo Indiana Jones e Black Myth: Wukong

Relatório Aponta Falhas em Recursos de Segurança para Jovens no Instagram

Microsoft Suspende Acesso do Ministério da Defesa de Israel Após Denúncias de Espionagem em Gaza

Educação, segurança, água e desenvolvimento: Governo do Estado marca presença com entregas em Ribeira do Pombal

Big Techs sob pressão: EUA e França investigam riscos de IA e redes sociais para crianças e adolescentes

Comentários

Deixe uma resposta Cancelar resposta

Mais sobre Tecnologia

Apple lança iPhone 17 Pro com salto histórico de performance, IA integrada e nova câmera com zoom óptico de 8x

Meta é acusada de suprimir pesquisas sobre riscos a crianças em realidade virtual

Google lança Modo IA no Brasil e acende alerta em sites jornalísticos

Google é condenado a pagar US$ 425 milhões por violar privacidade de usuários nos EUA

Posts Recentes

Bahia deflagra Operação “Bebidas Etílicas” para combater adulteração e proteger consumidores

Lula pede a Trump retirada de tarifas e sanções contra autoridades brasileiras em conversa por telefone

Vini Jr. aparece dançando com Virginia Fonseca e alimenta rumores de romance: “Casal do momento”

Israel deporta 171 ativistas da flotilha humanitária; brasileiros, incluindo deputada, não estão na lista

FALE CONOSCO

Festival de Lençóis reúne 15 mil na abertura e segue com Maria Gadú, Jorge Vercillo e Liniker neste fim de semana

Após suspeita de intoxicação por bebida adulterada, Hungria se pronuncia: “Coração é só gratidão”

“Monstros: Ed Gein” estreia na Netflix e revela o verdadeiro rosto por trás dos maiores vilões do terror

Com investimento recorde, Governo do Estado lança Edital Ouro Negro 2026 com aporte de R$ 17 milhões

Carol Castro critica escolha de Virginia Fonseca como rainha de bateria da Grande Rio: “Hipocrisia absurda”

Carlos Bolsonaro critica operação policial durante traslado de Bolsonaro para hospital em Brasília

Morre aos 75 anos Silvio Tendler, um dos maiores documentaristas do Brasil

Distopia, ação e emoção marcam estreias nos cinemas neste fim de semana

Jerônimo Rodrigues manifesta solidariedade às famílias das vítimas do acidente na BR-116

The Guardian Destaca os 20 Melhores Jogos de 2024, Incluindo Indiana Jones e Black Myth: Wukong

Você pode gostar

Comentários

Deixe uma resposta Cancelar resposta

Mais sobre Tecnologia

Posts Recentes