Anthropic lança Claude Opus 4.7 para programação de agentes, visão e tarefas autônomas
Anthropic lançou Claude Opus 4.7 — uma atualização direta do Opus 4.6 focada em programação de agentes, visão e tarefas autônomas longas. O modelo é…
Processado por IA de MarkTechPost; editado por Hamidun News
A Anthropic lançou o Claude Opus 4.7 em 16 de abril de 2026 — uma atualização pontual, mas extremamente significativa do seu modelo flagship, que ataca não os benchmarks abstratos, mas as dores práticas dos desenvolvedores: programação em agentes, trabalho com imagens detalhadas e tarefas autônomas longas, onde o modelo deve não apenas responder, mas planejar, verificar a si mesmo e levar o processo até o fim. A empresa posiciona o Opus 4.
7 como um upgrade direto do Opus 4.6, e não uma nova linha de produtos. Mas justamente em cenários de engenharia, a diferença se mostrou substancial.
De acordo com Anthropic, o modelo segue melhor as instruções, lida com mais cuidado com processos em múltiplas etapas e mais frequentemente encontra maneiras de verificar o resultado antes de devolvê-lo ao usuário. Isso é particularmente importante em ambientes onde a IA não escreve um simples trecho de código sob demanda, mas atua como um executor semi-autônomo: lê repositórios, executa ferramentas, corrige erros, continua o trabalho após falhas e mantém soluções intermediárias na memória. Nos benchmarks da Anthropic e parceiros, o ganho não parece cosmético.
No benchmark interno de 93 tarefas de programação, o Opus 4.7 melhorou a taxa de conclusão de tarefas em 13% em relação ao Opus 4.6, incluindo quatro tarefas que nem o Opus 4.
6 nem o Sonnet 4.6 conseguiram resolver. No CursorBench, o modelo alcançou 70% versus 58% na versão anterior.
Nos casos de teste da Notion para processos complexos em múltiplas etapas, a melhoria foi de 14% com menor consumo de tokens e três vezes menos erros ao chamar ferramentas. Rakuten afirma separadamente que no Rakuten-SWE-Bench, o novo modelo fecha três vezes mais tarefas de produção do que o Opus 4.6.
O segundo grande upgrade é a visão. O Claude Opus 4.7 pode processar imagens de até 2576 pixels no lado mais longo — aproximadamente 3,75 megapixels.
Isso é mais de três vezes maior do que o limite dos modelos Claude anteriores. Para o modo de chat normal, esse número pode parecer secundário, mas para cenários com agentes é crítico: o modelo pode analisar capturas de tela densas de interfaces, diagramas técnicos, esquemas, estruturas químicas e documentos onde detalhes finos importam. Anthropic fornece um exemplo da área de computer use: no benchmark visual XBOW, a nova versão alcançou 98,5% versus 54,5% para o Opus 4.
6. Na prática, isso move uma série de tarefas da categoria "às vezes funciona" para "pode ser integrado em produtos". Anthropic também reforçou as ferramentas para execução autônoma longa.
O Opus 4.7 introduz um novo nível de esforço de raciocínio — xhigh, posicionado entre high e max. Na API, a empresa lançou uma versão beta pública de task budgets, permitindo que desenvolvedores limitem o orçamento de tokens em execuções longas e gerenciem prioridades de etapas.
O Claude Code agora possui um modo ultrareview para exame mais profundo de alterações, e o modo auto agora permite menos interrupções para tarefas longas com solicitações de permissão. No entanto, a migração do Opus 4.6 não é totalmente gratuita: o tokenizador atualizado pode aumentar tokens de entrada em aproximadamente 1,0–1,35x dependendo do tipo de conteúdo, e raciocínio mais profundo nos estágios posteriores de tarefas com agentes aumenta o volume de tokens de saída.
Anthropic enfatiza separadamente o tema de segurança. O Opus 4.7 é lançado logo após o anúncio do Mythos Preview — um modelo mais poderoso cujo acesso a Anthropic decidiu restringir devido a riscos de segurança cibernética.
Portanto, o Opus 4.7 é o primeiro modelo público onde a Anthropic testa bloqueio automático para solicitações de cyber de alto risco. Para cenários legítimos, como pentesting, red teaming e pesquisa de vulnerabilidades, a empresa simultaneamente abriu um programa de verificação.
De acordo com avaliação própria da Anthropic, o perfil de segurança do Opus 4.7 é geralmente próximo ao 4.6: o modelo melhorou em honestidade e resistência a prompt injection, embora em certas categorias seja imperfeito e ainda fique atrás do Mythos Preview em consistência geral de comportamento.
A conclusão principal é simples: Claude Opus 4.7 não é uma nova geração por causa de um novo número, mas um lançamento pragmático para quem constrói fluxos de trabalho reais sobre o modelo. Se seu cenário é um assistente de IDE, um agente de revisão de código, análise de documentos, visão computacional para interfaces ou longas cadeias de ações orientadas por ferramentas, a atualização parece significativa agora.
Para o usuário médio, a diferença pode nem sempre ser óbvia, mas para desenvolvedores e equipes que medem a qualidade não por demos, mas pelo número de tarefas concluídas do início ao fim, o Opus 4.7 parece uma das atualizações mais úteis da Anthropic em tempos recentes.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.