Anthropic lançou Opus 4.7, e OpenAI transformou Codex em um agente de trabalho no computador
Anthropic posicionou Opus 4.7 como líder em tarefas agentes complexas e lançou Claude Design, enquanto OpenAI transformou Codex em um agente de computador…
Processado por IA de Habr AI; editado por Hamidun News
Esta semana mostrou que a corrida da IA mudou novamente, de chatbots para agentes de trabalho completos. Anthropic fortaleceu seu modelo Opus 4.7 e imediatamente criou um novo produto de design para ele, OpenAI ensinou Codex a ver a tela e controlar o computador, e Google e Baidu expandiram seu conjunto de ferramentas para voz e imagens.
Nesse contexto, é particularmente notável como a IA está saindo dos laboratórios e entrando no trabalho cotidiano, no mercado de software e até em especulações do mercado de ações. O principal lançamento da semana é Claude Opus 4.7.
Anthropic chama o modelo de seu lançamento público mais forte até agora para pipelines de código longos, raciocínio multietapas e tarefas agentivas. No SWE-bench Pro, o resultado aumentou de 53,4% para 64,3% em comparação com Opus 4.6.
O modelo funciona melhor com visão e lê capturas de tela e diagramas mais densos com resolução de até 3,75 megapixels. Para cenários complexos, um novo nível de raciocínio, xhigh, surgiu; no Claude Code agora está ativado por padrão. Além disso, a empresa introduziu Task Budgets em beta para limitar o gasto de tokens por tarefa e melhorou a memória em cenários longos multi-sessão.
O preço da API permaneceu inalterado, mas o novo tokenizador pode consumir até 35% mais tokens no mesmo texto. Em paralelo, Anthropic lançou Claude Design — uma ferramenta separada que transforma um briefing em várias variantes de interface, landing page e apresentação, então fornece exportação para Canva, PDF, PPTX e HTML. OpenAI respondeu não com um novo modelo, mas com um novo modo operacional para Codex.
Após a atualização, o agente ganhou computer use: ele vê a tela, move o cursor e executa ações através da interface gráfica. No lançamento, o recurso está disponível no macOS, com vários agentes capazes de trabalhar em paralelo sem interceptar o foco do usuário. Dentro do produto, um navegador integrado apareceu para trabalhar com localhost, geração de imagens diretamente no fluxo de tarefas, memória entre sessões e mais de 90 integrações com serviços populares como Jira, GitLab, Microsoft 365, Notion e Slack.
Também foram adicionadas automações agendadas, onde o agente levanta o contexto e prepara tarefas para o dia. Esta é uma mudança importante: a competição é cada vez menos sobre qualidade de resposta em chat e cada vez mais sobre quão profundamente um modelo pode se integrar no ambiente real de trabalho. Google e Baidu fortaleceram sua camada aplicada na mesma semana.
Gemini 3.1 Flash TTS suporta mais de 70 idiomas, 30 vozes prontas e mais de 200 tags de áudio que podem ser inseridos diretamente no texto para que o modelo possa sussurrar, tossir ou mudar a entonação de acordo com o roteiro. Google oferece visualização através de AI Studio e Vertex AI e marca automaticamente o resultado com uma marca d'água SynthID.
Baidu, por sua vez, abriu ERNIE Image — um gerador de imagens com 8 bilhões de parâmetros que pode executar em 24 GB de memória de vídeo. O ponto forte do modelo é renderizar texto dentro de imagens: de pôsteres a interfaces e storyboards. Mas quase simultaneamente, um pesquisador demonstrou reverse-SynthID — uma forma aberta de remover a marca d'água invisível do Google de imagens geradas com precisão alegada em torno de 91%.
Resulta em uma bifurcação ilustrativa: as empresas estão rapidamente tornando a geração mais acessível, mas os mecanismos de proteção em torno do conteúdo de IA permanecem frágeis. As histórias mais reveladoras da semana não vieram dos laboratórios. A marca de calçados Allbirds vendeu seus ativos e nome por aproximadamente US$ 39 milhões, então anunciou uma mudança para GPU-as-a-Service sob o novo nome NewBird AI, e em uma onda de frenesi viu suas ações subirem mais de seis vezes em um dia.
Simultaneamente, uma versão em IA de "Grey Night" com voz sintética de uma superestrela ocidental atingiu o topo da parada global do Shazam e imediatamente se transformou em uma disputa sobre direitos, autoria e royalties. Outro caso — a "bisonmania" fictícia inventada por uma pesquisadora sueca: um diagnóstico fabricado convenceu não apenas vários LLMs populares, mas também os autores de uma publicação científica real, que citaram o preprint falso como uma fonte genuína. Tais histórias atingem mais do que qualquer benchmark: mostram como a IA interfere na música, finanças, mídia e até mesmo na citação científica.
A conclusão da semana é simples: o mercado de IA está entrando em uma fase onde o valor é determinado não por reivindicações abstratas de que um modelo se tornou mais inteligente, mas pela sua capacidade de assumir um pedaço do trabalho real, agir dentro de interfaces e influenciar processos além do chat. Quanto mais confiantes os agentes transitam de texto para ação, mais importante se tornam o controle, a verificação de fatos, os direitos sobre a saída e a robustez dos mecanismos de proteção. E é precisamente aqui que os próximos meses serão tão importantes quanto a próxima corrida de benchmarks.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.