Anthropic mudou o caráter do Claude Opus 4.7—e parte dos desenvolvedores viu uma regressão
A Anthropic lançou o Claude Opus 4.7 com o mesmo preço e benchmarks fortes, mas a reação da comunidade foi áspera. Desenvolvedores reclamam que o modelo…
Processado por IA de Habr AI; editado por Hamidun News
Em 16 de abril de 2026, a Anthropic lançou Claude Opus 4.7 mantendo o preço inalterado, mas em 24 horas alguns desenvolvedores chamaram a atualização de regressão. O problema não é uma falha isolada em um benchmark, mas uma mudança no comportamento do modelo: ficou mais seco, mais literal e notavelmente mais propenso a discutir com o usuário.
Por que a reação é tão marcante
No papel, o lançamento parecia muito forte. A Anthropic reivindicou vitórias em 12 de 14 benchmarks, ganhos em SWE-bench Verified, MCP-Atlas e vários outros testes, além de melhorias para visão e tarefas longas de agente. O preço permaneceu o mesmo.
Mas quase imediatamente após o lançamento, Reddit e X foram inundados de reclamações: usuários relataram que Claude Opus 4.7 mais frequentemente discute com as instruções, recusa ações simples e às vezes defende com confiança uma resposta incorreta em vez de simplesmente admitir um erro. O problema acabou por ser não tanto uma questão geral de qualidade quanto uma falta de correspondência entre o novo caráter do modelo e a forma familiar de trabalhar com ele.
Onde Claude era anteriormente muito acomodatício, agora é mais rigoroso e mais literal. Para algumas tarefas isto é um ponto positivo, mas para desenvolvimento de rotina resultou o oposto: o modelo começa a discutir sobre trivialidades, desacelera o fluxo de trabalho e adiciona ruído.
'O modelo discute ininterruptamente e alucina enquanto discute'.
Sete novos padrões
A conclusão principal do lançamento é esta: Anthropic mudou não apenas as métricas, mas as configurações comportamentais básicas do modelo. Se uma equipe passou muito tempo ajustando prompts para Opus 4.6, mudar para 4.7 pode quebrar um pipeline já funcionando mesmo sem mudanças na API. Este é um novo tipo de breaking change para LLM: a interface é a mesma, mas o modelo interpreta a tarefa de forma diferente.
- aderência mais literal às instruções em vez de ler nas entrelinhas
- o comprimento da resposta agora depende mais de como o próprio modelo avaliou a complexidade da tarefa
- por padrão há menos chamadas de ferramentas e menos delegação de subtarefas
- atualizações de progresso intermediárias agora são mais frequentemente fornecidas pelo próprio modelo, sem scaffolding adicional
- segurança cibernética e filtros foram fortalecidos, e o tom das respostas ficou mais seco e menos 'concordante'
Por causa disso, prompts antigos com formulações vagas como 'faça ficar bonito' funcionam pior. O que era previamente compensado pela intuição do modelo agora precisa ser descrito como uma especificação: formato de resposta, restrições, profundidade desejada, regras de ferramentas e limites de segurança. A própria Anthropic recomenda executar testes de regressão em tráfego real antes da migração, e no caso de 4.7 isso soa não como uma formalidade mas como uma etapa obrigatória.
Onde melhor, onde pior
A atualização tem forças óbvias. De acordo com a descrição da Anthropic e das primeiras análises, 4.7 mantém melhor os fios longos em cenários de agente, funciona mais confiante nos níveis de esforço alto e xhigh, é mais forte em refatoração multi-arquivo e notavelmente vence em visão: o limite de imagem de entrada cresceu para aproximadamente 3,75 megapixels versus os anteriores 1,15. Para tarefas em que autonomia, auto-verificação e horizontes de planejamento longo são importantes, esse modelo pode de fato ser mais útil que Opus 4.6.
As fraquezas apareceram no trabalho diário de um desenvolvedor. Edições simples como renomear variáveis, adicionar verificações nulas ou refatoração local mais frequentemente se transformam em argumentos com o assistente. Os usuários reclamam separadamente sobre o aumento do gasto de tokens, o que torna os mesmos cenários mais caros, e sobre a degradação na recuperação de contexto longo.
Diante disso, a compensação de segurança também é preocupante: a Anthropic afirmou abertamente que durante o treinamento enfraqueceu seletivamente certas capacidades cibernéticas e adicionou safeguards automáticos, deixando a versão mais forte para parceiros. Além disso, a empresa silenciosamente removeu Claude Code do plano Pro de $20 em 21 de abril de 2026, reforçando o sentimento de que as condições para usuários regulares pioraram.
O que isso significa
A história do Claude Opus 4.7 mostra que novas versões de LLM agora precisam ser avaliadas não apenas por benchmarks mas por mudanças no 'caráter' do modelo. Se anteriormente um prompt podia ser escrito como um pedido a um colega, agora cada vez mais é necessário um formato de especificação precisa. Para equipes, isto significa uma coisa: antes de atualizar um modelo, você precisa testar não a inteligência abstrata mas seu workflow real.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.