Notícia

“Você está me testando” | Novo modelo de IA da Anthropic detecta a sua intenção

Por Publicado Atualizado

“Você está me testando” | Novo modelo de IA da Anthropic detecta a sua intenção
Por Nathan Vieira • Editado por Melissa Cruz Cossetti |
Na última segunda-feira (29), a Anthropic divulgou uma análise de segurança em que o novo modelo Claude Sonnet 4.5 demonstrou sinais de perceber que estava sendo avaliado. Em um dos testes, a inteligência artificial questionou diretamente os avaliadores: “Acho que você está me testando”, pedindo mais honestidade sobre o processo.
– Anthropic lança Claude Sonnet 4.5 com foco em programação e agentes de IA
– IA Claude agora cria e edita planilhas e apresentações de slides
Durante um teste para ver se a IA concordaria de forma exagerada com opiniões políticas, o Claude Sonnet 4.5 interrompeu o fluxo esperado e levantou suspeitas sobre o teste em andamento. O

Fontes

Fontes:

Este artigo foi redigido com apoio de ferramentas de IA e revisado por nossa equipe. Citamos as fontes originais e seguimos as políticas do Google Notícias.

Encontrou algo a corrigir? Avise a redação.