Anthropic apresenta Claude Opus 4.8 com melhorias para codificação e tarefas de agentes
A Anthropic lançou Claude Opus 4.8 — uma atualização do Opus 4.7 com melhorias em codificação, tarefas de agentes e trabalho prolongado. O novo modelo supera…
Processado por IA de Anthropic Blog; editado por Hamidun News
A Anthropic apresentou Claude Opus 4.8 — uma atualização do modelo flagship com julgamento aprimorado para tarefas de agentes. O modelo está disponível pelo mesmo preço que o Opus 4.7 e funciona no sistema com novos recursos do claude.ai e Claude Code.
Três novos recursos junto com Opus 4.8
Além do modelo em si, a Anthropic lançou ferramentas para melhor controle:
- No claude.ai — um controle deslizante para controlar o esforço: do modo rápido à análise profunda
- Claude Code recebeu Dynamic Workflows para resolver tarefas muito grandes (trabalho de vários dias)
- Fast Mode para Opus 4.8 agora é 3 vezes mais barato e funciona 2,5× mais rápido que o normal
Nos benchmarks padrão de codificação, raciocínio e tarefas práticas, o Opus 4.8 supera o Opus 4.7 e compete com o GPT-5.5.
O que os testes mostraram
O Opus 4.8 é único em sua confiabilidade em tarefas prolongadas. No benchmark Super-Agent, é o único modelo que completou todas as tarefas end-to-end e superou o Opus 4.7 e o GPT-5.5.
No CursorBench (teste do editor de código), o modelo supera todos os níveis de complexidade, chamando ferramentas de forma mais eficiente.
No Legal Agent Benchmark, o Opus 4.8 é o primeiro modelo a ultrapassar a marca de 10% no padrão all-pass. Isso significa que um advogado agora pode confiar-lhe tarefas mais complexas.
No Online-Mind2Web (agentes de navegador), o modelo obteve 84% — um salto notável acima do Opus 4.7 e GPT-5.5.
O que os desenvolvedores dizem
Os engenheiros do Devin observaram que o Opus 4.8 funciona com ferramentas de forma mais limpa e segue instruções com a sequência necessária para trabalho autônomo. O modelo corrigiu problemas de verbosidade que existiam na versão 4.7.
«Opus 4.8 é uma atualização de qualidade: mais rápido, mais fácil de
colaborar e mantém melhor o contexto e o estilo durante uma sessão longa», — diz um dos primeiros testadores.
A equipe do CoCounsel vê que o Opus 4.8 fornece melhor raciocínio em análises complexas e completa o trabalho mais rapidamente com resultados mais densos.
No benchmark Super-Agent, o modelo provou que pode conduzir fluxos de trabalho prolongados sem erros e sem intervenção humana.
O que isso significa
Opus 4.8 não é apenas uma atualização de versão, mas um sinal de que os modelos base estão evoluindo muito rapidamente. Em um trimestre, a Anthropic o tornou praticamente mais útil para agentes comerciais: agentes Devin são mais confiáveis, advogados delegam mais, engenheiros economizam tempo em revisão de código. Para os negócios, isso significa que os investimentos em ferramentas de IA se tornam mais lucrativos.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.