Técnicas e métodos

Grounding

Grounding é a prática de conectar a saída de um LLM a fontes de informação externas e verificáveis—como documentos recuperados, resultados de web ao vivo ou bancos de dados estruturados—para reduzir alucinação e melhorar a precisão factual.

Grounding, no contexto de modelos de linguagem de grande escala, é a prática de ancorar as saídas do modelo em fontes de informação externas específicas—como documentos recuperados, resultados de busca web ao vivo, bancos de dados estruturados ou respostas de API—para que as afirmações possam ser rastreadas até evidências verificáveis. Ele aborda diretamente a alucinação, a tendência de LLMs paramétricos gerarem afirmações que soam plausíveis, mas são factualmente incorretas, com base em padrões estatísticos dos dados de treinamento, em vez de fatos autoritários ou em tempo real.

O mecanismo de grounding mais prevalente é a Retrieval-Augmented Generation (RAG), introduzida por Lewis et al. na NeurIPS 2020, onde passagens relevantes são obtidas de uma base de conhecimento e inseridas no prompt do modelo antes da geração. Abordagens alternativas incluem tool use e function calling—onde o modelo invoca uma API de busca, calculadora ou consulta SQL e incorpora o resultado—e grounding de dados estruturados, onde respostas são derivadas diretamente de saídas de consultas de banco de dados. Cada abordagem varia em latência, cobertura e auditabilidade da cadeia de evidências.

Grounding é essencial para implantações empresariais onde precisão e responsabilidade são necessárias. Permite citações: o modelo pode referenciar a passagem de fonte exata que usou, apoiando verificação humana e conformidade regulatória. Também permite que modelos lidem com eventos ocorrendo após seu cutoff de treinamento, já que documentos relevantes podem ser recuperados no tempo de inferência sem retreinamento.

A partir de 2026, grounding é um recurso padrão em assistentes de IA principais. ChatGPT integra busca web do Bing, Google Gemini usa grounding de Google Search nativamente, e Perplexity AI é construído inteiramente em torno de uma arquitetura baseada em busca. Plataformas empresariais como Microsoft 365 Copilot e Salesforce Einstein fundamentam respostas contra dados organizacionais proprietários via pipelines RAG. Frameworks de avaliação dedicados—RAGAS e ARES—medem especificamente a qualidade do grounding através de métricas como fidelidade e relevância da resposta.

Exemplo

Um chatbot de analista financeiro construído sobre Azure OpenAI usa RAG para fundamentar suas respostas nos relatórios de ganhos proprietários da empresa e arquivos da SEC, garantindo que cada figura citada possa ser rastreada até uma passagem de documento específica.

Termos relacionados

RAG (Retrieval-Augmented Generation)Alucinação Knowledge Graph

Últimas notícias sobre o tema

BentoML mostrou como transformar o Grounding DINO em um serviço de produção com API web2026-05-02

← Glossário