Bloomberg Tech→ original

Tesouro dos EUA Busca Acesso ao Modelo Mythos da Anthropic para Testes de Vulnerabilidades

O Tesouro dos EUA quer acesso ao modelo Mythos da Anthropic para começar a busca por vulnerabilidades. Não se trata de implementação por eficiência, mas de…

Processado por IA de Bloomberg Tech; editado por Hamidun News
Tesouro dos EUA Busca Acesso ao Modelo Mythos da Anthropic para Testes de Vulnerabilidades
Fonte: Bloomberg Tech. Colagem: Hamidun News.
◐ Ouvir artigo

O Departamento do Tesouro dos EUA está buscando acesso ao modelo Mythos da Anthropic para começar a procurar vulnerabilidades no sistema antes de seu uso mais amplo em cenários sensíveis. O fato de tal solicitação em si demonstra que as agências do governo americano estão transitando de discussões gerais sobre IA para testes práticos de modelos específicos em confiabilidade, controlabilidade e resistência ao abuso. Segundo informações disponíveis, a equipe de tecnologia do Departamento do Tesouro está tentando obter acesso ao Mythos.

O objetivo parece ser não a implementação do modelo para produtividade, mas especificamente uma auditoria de segurança: especialistas querem entender onde o sistema pode falhar, como se comporta sob consultas atípicas e se pode ser forçado a exceder seus próprios limites. Detalhes oficiais sobre o formato de teste ainda não foram divulgados, nem há confirmação de que a Anthropic já concedeu acesso. As especificações técnicas do próprio Mythos também não estão sendo divulgadas, portanto é precipitado julgar se é um produto interno, especializado ou sendo preparado para implantação mais ampla.

Para o governo dos EUA, tal trabalho faz sentido lógico. Quanto mais ativamente as agências governamentais consideram a IA para análise de dados, preparação de documentos, suporte a funcionários e automação de processos internos, maior o custo dos erros. No caso de sistemas federais, os problemas poderiam ser mais do que apenas reputacionais.

Poderia haver vazamentos de informações sensíveis, circunvenção de mecanismos de proteção, geração de recomendações não confiáveis ou comportamento do modelo que pode ser deliberadamente provocado. Portanto, o acesso ao modelo em um estágio inicial é tão importante quanto promessas públicas do desenvolvedor sobre segurança. Se a equipe do Tesouro realmente começar a fazer testes, ela provavelmente procurará vulnerabilidades típicas em sistemas generativos modernos.

Tal teste geralmente inclui tentativas de contornar restrições integradas, obter respostas perigosas, extrair instruções ocultas, testar resistência a ataques de injeção de prompt e avaliar como o modelo lida com dados confidenciais e cenários de contexto longo. Isso não significa que tais problemas já tenham sido descobertos no Mythos. Mais precisamente, é um conjunto padrão de questões que hoje se aplicam a qualquer modelo avançado, especialmente se potencialmente usado por organizações de alta responsabilidade.

A escolha da empresa merece atenção especial. A Anthropic há muito tempo constrói uma reputação como desenvolvedora que prioriza a segurança e o comportamento controlado do modelo. Se mesmo tais sistemas provocam demanda do governo por acesso direto para testes de estresse independentes, isso sublinha um novo padrão nas relações entre autoridades e empresas de IA: garantias gerais são insuficientes; testes reais pelo cliente ou regulador são necessários.

Para os próprios desenvolvedores, isso significa pressão adicional—devem se preparar não apenas para competição de mercado, mas também para auditorias técnicas cada vez mais rigorosas. A história importa também porque muda a própria lógica do interesse governamental em IA. Até recentemente, funcionários discutiam principalmente regras, riscos e abordagens de estrutura.

Agora o foco está se deslocando para modelos específicos, cenários específicos e vulnerabilidades específicas. Este é um estágio mais prático: em vez de regulação abstrata, há tentativas de entender como um sistema se comporta sob condições de estresse real. Para o mercado, isso sinaliza que a confiança em modelos de ponta será cada vez mais construída não em apresentações, mas em resultados de testes independentes.

A conclusão principal é simples: o governo está começando a tratar sistemas de IA avançados da mesma forma que outras tecnologias criticamente importantes—primeiro acesso, depois testes e apenas então possível implantação. Para a Anthropic, isso pode se tornar um teste da maturidade de sua abordagem para a segurança, e para todo o mercado—um sinal de que a era das promessas informais está terminando e a era da verificação obrigatória está começando.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…