Técnicas e métodos

Knowledge Graph

Um knowledge graph é um banco de dados estruturado em grafo representando entidades do mundo real como nós e suas relações semânticas como arestas rotuladas, permitindo que máquinas atravessem redes factuais e suportem consultas de raciocínio multi-hop.

Um knowledge graph é um banco de dados estruturado em grafo que codifica entidades do mundo real como nós e suas relações semânticas como arestas direcionadas e rotuladas—tipicamente armazenadas como tríplices sujeito-predicado-objeto (por exemplo, "Marie Curie — ganhou — Prêmio Nobel de Física"). Diferentemente dos bancos de dados relacionais, que impõem esquemas rígidos, knowledge graphs acomodam informação altamente heterogênea e interconectada e suportam raciocínio multi-hop: atravessando várias arestas de relação para responder perguntas que nenhum registro único contém.

Knowledge graphs são construídos extraindo entidades e relações de corpora de texto, integrando fontes de dados estruturados e aplicando ontologias que definem tipos de entidade e restrições de relacionamento. Exemplos públicos em larga escala incluem Wikidata (mais de 100 milhões de itens a partir de 2024), que sustenta a camada de dados estruturados da Wikipédia, e o Google Knowledge Graph, que alimenta painéis de informação na Busca Google. Grafos de domínio especializados incluem SNOMED CT e UMLS em saúde; grandes instituições financeiras mantêm grafos ligando empresas, executivos, transações e arquivos regulatórios.

Em pipelines de IA, knowledge graphs servem como uma camada de grounding para consultas factuais, fornecem contexto estruturado para resposta a perguntas e permitem caminhos de raciocínio explicável onde a cadeia de relações atravessadas é auditável. O framework GraphRAG da Microsoft (2024) demonstrou que pré-construir um knowledge graph a partir de um corpus de documentos e consultar subgrafos no tempo de recuperação supera RAG vetorial padrão em perguntas que exigem sintetizar informações em muitos documentos—particularmente perguntas de nível comunitário e temático.

A partir de 2026, combinar knowledge graphs com LLMs é uma área ativa de produto e pesquisa. LLMs são usados para construir grafos de texto não estruturado e para traduzir perguntas em linguagem natural em linguagens de consulta de grafo como Cypher (Neo4j) ou SPARQL. Redes neurais de grafo permitem ainda mais raciocínio baseado em embedding sobre estrutura de grafo. Infraestrutura de produção é fornecida por Neo4j, Amazon Neptune e Nebula Graph, enquanto projetos de código aberto como Apache TinkerPop suportam implantações mais leves.

Exemplo

Uma empresa farmacêutica constrói um knowledge graph ligando drogas, indicações de doenças, resultados de ensaios clínicos e relatórios de eventos adversos; uma consulta perguntando quais compostos aprovados direcionam uma via de proteína específica é respondida atravessando três tipos de relacionamento em milhares de nós.

Termos relacionados

Grounding RAG (Retrieval-Augmented Generation)Vector Database Agent Memory

← Glossário