Agentes

Padrão ReAct

ReAct (Reasoning + Acting) é um framework de prompting para agentes de IA que intercala passos de raciocínio chain-of-thought com ações de uso de ferramenta discreta, permitindo que o modelo observe o resultado de cada ação e atualize seu raciocínio antes de prosseguir.

ReAct é uma arquitetura de agente que alterna entre dois tipos de operação: Reasoning (gerando um pensamento em linguagem natural sobre a situação atual e o que fazer em seguida) e Acting (executando uma operação concreta como uma busca web, consulta de banco de dados ou execução de código). O framework foi introduzido por Yao et al. em um paper de 2022, 'ReAct: Synergizing Reasoning and Acting in Language Models,' apresentado no ICLR 2023, e desde então se tornou um dos templates mais amplamente adotados para construir agentes de IA.

Em um loop ReAct, o modelo produz um 'Thought' — seu raciocínio interno sobre o estado da tarefa — seguido por uma 'Action' que invoca uma ferramenta externa. O ambiente retorna uma 'Observation,' que é anexada à janela de contexto. O modelo então gera o próximo pensamento, informado por essa observação, e o ciclo se repete até que o modelo julgue a tarefa completa. Esta estrutura intercalada permite que o agente corrija curso dinamicamente em vez de se comprometer antecipadamente com um plano estático que não pode incorporar novas informações.

O padrão aborda uma limitação central do prompting chain-of-thought estático: o modelo não pode adquirir novas informações externas mid-response. Ao acoplar raciocínio a chamadas de ferramenta reais, ReAct permite tarefas que requerem retrieval de dados ao vivo, computação interativa ou navegação multi-passo através de um ambiente externo. O traço pensamento-ação-observação também é legível por humano, tornando substancialmente mais fácil fazer debug de falhas de agente do que pipelines de chamadas de ferramenta opacos onde raciocínio interno fica oculto.

Por 2026, loops de estilo ReAct sustentam a maioria de frameworks de agente em produção, incluindo agentes LangChain e LangGraph, Claude tool-use API do Anthropic e Assistants API do OpenAI com code interpreter e file search. Extensões como Reflexion adicionam um passo de auto-crítica e atualização de memória após conclusão de tarefa. Variantes multi-agente permitem um agente ReAct spawnar sub-agentes especializados como suas 'Actions.' As principais limitações práticas são latência — cada ciclo de raciocínio-ação adiciona pelo menos uma rodada completa de trip de inferência — e crescimento de janela de contexto conforme traços acumulam sobre tarefas longas.

Exemplo

Um agente de suporte ao cliente recebe uma pergunta sobre status de pedido: ele gera um Thought ('Preciso recuperar ordem #5892 do banco de dados'), chama a ferramenta de lookup de ordem como sua Action, observa o resultado ('enviado 2026-06-30, entrega esperada 2026-07-03'), gera um novo Thought ('Tenho informação suficiente para responder') e responde ao cliente — tudo dentro de um único loop ReAct automatizado requerendo nenhuma intervenção humana.

Termos relacionados

← Glossário