Anthropic e MCP: por que agentes de AI perdem o foco quando recebem ferramentas demais
MCP não morreu, mas o sonho de simplesmente dar a um agente todo o stack de ferramentas de uma vez esbarrou rapidamente nos limites de contexto. Quando o…
Processado por IA de Habr AI; editado por Hamidun News
O MCP não desapareceu e não fracassou como padrão. Mas a ideia de conectar todos os ferramentas, bancos de dados e APIs a um agente IA de uma vez se mostrou um beco sem saída: em vez de expandir as capacidades, o modelo perde o foco e desperdiça contexto com ruído.
Quando Mais É Pior
Um ano atrás, o MCP parecia ser uma resposta universal ao caos das integrações. Um único protocolo prometia conectar agentes IA ao GitHub, Slack, Jira, bancos de dados internos e qualquer outro sistema externo sem um zoológico de plugins customizados. A indústria rapidamente abraçou essa lógica: até o final de 2025, o MCP já era suportado por ChatGPT, Cursor, Gemini e VS Code, e o número de servidores ultrapassou 10 mil, segundo o autor. No papel, parecia um ecossistema maduro pronto para se tornar a camada base para uma nova geração de produtos com agentes.
O problema surgiu quando equipes começaram a dar o passo mais óbvio: conectar todos os ferramentas disponíveis ao agente de uma vez. Em vez de benefício, isso criou sobrecarga. Antes da primeira solicitação do usuário, esquemas de API, descrições de funções, parâmetros de chamadas e instruções de serviço para código, documentação, rastreamento de bugs e análises inundaram a janela do modelo. Em alguns casos, apenas a inicialização de ferramentas consumia até 55 mil tokens. Para um programa comum, isso não é problema, mas um LLM precisa ler todo esse volume, escolher a ferramenta certa e manter o resultado na memória sem perder o fio da meada.
"O contexto é limitado e não se torna mais útil simplesmente pelo volume."
Três Padrões Funcionais
Uma nova abordagem surgiu rapidamente disso: a padronização do acesso por si só não garante nada se o modelo vê muita informação irrelevante. Então o foco mudou da pergunta "o que pode ser conectado" para "o que exatamente o agente deveria ver neste momento."
Na prática, em 2026, três padrões se consolidaram que reduzem a carga cognitiva sem abandonar o MCP como camada de integração.
- Busca de ferramentas. O agente primeiro busca a ferramenta apropriada no catálogo, carregando o esquema apenas para o passo atual.
- Agent Skills. Em vez de acesso direto à API, o modelo recebe uma habilidade pronta com uma tarefa estreita, como criar um relatório de bug a partir de logs.
- Wrappers CLI. Em vez de analisar esquemas JSON volumosos, o agente chama um comando simples no terminal com parâmetros compreensíveis.
- Descarregamento após um passo. Ferramentas e instruções são mantidas no contexto apenas enquanto realmente necessárias, depois removidas.
Cada opção tem um compromisso. Buscar ferramentas adiciona uma chamada extra e latência, habilidades limitam a liberdade do modelo, enquanto a abordagem CLI sacrifica flexibilidade pela confiabilidade. Mas todos os três esquemas ganham da estratégia de "dar ao agente tudo de uma vez" porque economizam o recurso mais escasso — a atenção do modelo. Quanto menos ruído, melhor a chance de o agente escolher a ação certa e não sair do rumo no meio do caminho.
O Preço da Integração Conveniente
A principal conclusão do artigo é que o MCP resolve o problema de compatibilidade, mas não resolve o problema do pensamento. Quando um agente tem dezenas de ferramentas similares, ele não deve apenas saber da existência delas, mas comparar opções, entender o propósito de cada uma, selecionar parâmetros, corresponder a resposta à tarefa e não esquecer resultados intermediários. Quanto mais amplo o catálogo de possibilidades, maior o risco de falsos positivos, chamadas fracassadas e raciocínio sem sentido sobre contexto irrelevante.
Portanto, a degradação da qualidade aqui não está relacionada ao protocolo em si, mas à arquitetura construída sobre ele. Daí o interesse em Agent Skills, que Anthropic promove. Eles elevam o nível de abstração: em vez de operações de API de baixo nível, o agente recebe um fluxo de trabalho empacotado com lógica pré-definida.
Neste modo, o modelo não resolve novamente como se comunicar com Jira ou outro sistema, mas usa uma rota pronta para uma tarefa de negócios específica. Isso reduz o consumo de tokens, diminui a probabilidade de erro e torna o comportamento do agente mais previsível. Para equipes de produto, essa é uma mudança importante: universalidade não é mais considerada uma vantagem incondicional se quebra a estabilidade.
O Que Isso Significa
Para equipes construindo sistemas autônomos em 2026, a questão não é mais sobre o número de ferramentas conectadas. As apostas mudam para roteamento, higiene de contexto e fluxos de trabalho estreitos e confiáveis. O MCP continua sendo um padrão de integração útil, mas a vantagem vai para aqueles que mostram ao modelo o mínimo absoluto de dados e funções no momento certo, em vez de todo o catálogo de possibilidades de uma vez.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.