Habr AI→ original

Anthropic testa Claude Mythos: vazamento revela modelo com 10 trilhões de parâmetros

Um grande vazamento na Anthropic revelou quase 3 mil documentos não publicados em um cache exposto, incluindo rascunhos sobre o novo modelo Claude Mythos. De…

Processado por IA de Habr AI; editado por Hamidun News
Anthropic testa Claude Mythos: vazamento revela modelo com 10 trilhões de parâmetros
Fonte: Habr AI. Colagem: Hamidun News.
◐ Ouvir artigo

A Anthropic pode ter acidentalmente revelado ao mercado o próximo nível de seus modelos mais cedo do que estava pronta. De um cache aberto da empresa, rascunhos de posts, documentos internos e milhares de materiais não publicados vazaram para a rede, dos quais segue: o novo modelo Claude Mythos é notavelmente mais forte que os atuais líderes e pode se mostrar muito arriscado para um lançamento público regular. Com base nesses dados, isso não é uma atualização cosmética da linha Claude, mas um sistema que a empresa internamente considera o IA mais poderoso de sua história e, portanto, lança com acesso antecipado extremamente limitado.

Pesquisadores em cibersegurança descobriram o vazamento, encontrando quase 3 mil arquivos relacionados ao CMS e rascunhos internos da Anthropic. Entre eles havia rascunhos de anúncios, imagens, documentos e materiais que a empresa ainda não havia publicado. A Anthropic confirmou o fato do vazamento e reconheceu que clientes com acesso antecipado já estão testando Mythos.

De acordo com um representante da empresa, o modelo fornece um salto qualitativo nas capacidades de IA. Este é um detalhe importante: não se trata apenas de rumores de redes sociais, mas de um conjunto de materiais cuja existência a empresa não negou realmente, embora não tenha revelado todas as características oficialmente. A escala da descoberta torna a história incomum: em vez de uma página aleatoriamente descoberta, o mercado viu um grande volume de preparativos internos para lançamento, e antes de qualquer anúncio público completo.

Se os rascunhos vazados forem confiáveis, Claude Mythos deve estar acima da hierarquia atual de Haiku, Sonnet e Opus. Nos documentos, aparece um novo nível Capybara — provavelmente uma designação para a configuração mais cara e performática com base em Mythos. Esse modelo, afirma-se, supera Claude Opus 4.

6 em três direções ao mesmo tempo: programação, raciocínio acadêmico e cibersegurança. A rede também circulou uma estimativa de 10 trilhões de parâmetros, mas é importante entender que este não é ainda um número confirmado de um lançamento oficial. Mesmo que a contagem de parâmetros seja menor, o significado geral do vazamento permanece o mesmo: Anthropic está preparando um modelo que considera substancialmente mais poderoso e notavelmente mais caro de operar.

Daí a cautela com o lançamento: tais sistemas requerem mais computação, custam mais em inferência e são mais difíceis de adaptar a um modelo de acesso em massa regular. A principal diferença de Mythos em relação aos lançamentos familiares é a ênfase nos riscos. Nos materiais vazados, o modelo é descrito como um sistema que significativamente supera outros IAs em capacidades ciber.

Para o mercado, isso soa como um aviso: o próximo salto em modelos generativos pode estar associado não apenas a codificação melhor, mas também a descoberta mais eficaz de vulnerabilidades, construção de exploits e automação de ataques. Anteriormente, Anthropic já tinha falado sobre casos em que suas ferramentas foram tentadas de serem usadas em campanhas maliciosas, e modelos no nível Opus aprenderam a encontrar vulnerabilidades previamente desconhecidas em código real. Portanto, a estratégia da Anthropic parece incomum: primeiro dar acesso a organizações associadas à defesa, e somente depois decidir sobre um lançamento mais amplo.

Esta abordagem se encaixa na lógica geral dos últimos meses, quando desenvolvedores de modelos de fronteira cada vez mais discutem não apenas benchmarks, mas também o limiar de perigo, após o qual as capacidades do modelo se tornam um problema em si. Para desenvolvedores e empresas, duas conclusões são importantes aqui. A primeira: a corrida pelos modelos está se deslocando de competição em "quem escreve texto melhor" para competição em "quem trabalha melhor com código, infraestrutura e segurança."

A segunda: o acesso aos sistemas mais poderosos será cada vez mais limitado não pelo marketing, mas por considerações reais de custo, controle e prevenção de abuso. Claude Mythos pode se mostrar outro vazamento exagerado, e alguns dos números e formulações certamente serão revisados. Mas a tendência em si já é óbvia: Anthropic está testando um novo nível de IA e fazendo isso com máxima cautela.

Se a empresa realmente vê no modelo uma ferramenta capaz de simultaneamente ajudar defensores e capacitar atacantes, o lançamento em massa de tais sistemas deixa de ser uma questão técnica e se torna uma questão de política de acesso.

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Quer parar de ler sobre IA e começar a usar?

AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.

O que você acha?
Carregando comentários…