Técnicas y métodos

Knowledge Graph

Un knowledge graph es una base de datos estructurada que representa entidades del mundo real como nodos y sus relaciones semánticas como aristas etiquetadas, permitiendo a las máquinas recorrer redes de hechos y admitir consultas de razonamiento multi-salto.

Un knowledge graph es una base de datos estructurada en grafo que codifica entidades del mundo real como nodos y sus relaciones semánticas como aristas dirigidas y etiquetadas—típicamente almacenadas como triples sujeto-predicado-objeto (por ejemplo, "Marie Curie — ganó — Premio Nobel de Física"). A diferencia de las bases de datos relacionales, que imponen esquemas rígidos, los knowledge graphs acomodan información altamente heterogénea e interconectada y admiten razonamiento multi-salto: recorrer varias aristas de relación para responder preguntas que ningún registro único contiene.

Los knowledge graphs se construyen extrayendo entidades y relaciones de corpus de texto, integrando fuentes de datos estructurados y aplicando ontologías que definen tipos de entidades y restricciones de relación. Los ejemplos públicos a gran escala incluyen Wikidata (más de 100 millones de elementos a partir de 2024), que respalda la capa de datos estructurados de Wikipedia, y el Knowledge Graph de Google, que potencia paneles de información en Google Search. Los grafos de dominio especializados incluyen SNOMED CT y UMLS en atención médica; las grandes instituciones financieras mantienen grafos que vinculan empresas, ejecutivos, transacciones y documentos normativos.

En tuberías de IA, los knowledge graphs sirven como capa de anclaje para consultas de hechos, proporcionan contexto estructurado para respuesta de preguntas y permiten rutas de razonamiento explicables donde la cadena de relaciones recorridas es auditable. El marco GraphRAG de Microsoft (2024) demostró que pre-construir un knowledge graph a partir de un corpus de documentos y consultar subgrafos en tiempo de recuperación supera a RAG de vector estándar en preguntas que requieren sintetizar información en muchos documentos—particularmente preguntas de nivel comunitario y temáticas.

A partir de 2026, combinar knowledge graphs con LLMs es un área activa de producto e investigación. Los LLMs se utilizan para construir grafos a partir de texto no estructurado y para traducir preguntas en lenguaje natural a lenguajes de consulta de grafos como Cypher (Neo4j) o SPARQL. Las redes neuronales de grafos habilitan aún más el razonamiento basado en incrustaciones sobre la estructura del grafo. La infraestructura de producción es proporcionada por Neo4j, Amazon Neptune y Nebula Graph, mientras que proyectos de código abierto como Apache TinkerPop admiten despliegues más ligeros.

Ejemplo

Una empresa farmacéutica construye un knowledge graph que vincula fármacos, indicaciones de enfermedades, resultados de ensayos clínicos e informes de eventos adversos; una consulta preguntando qué compuestos aprobados se dirigen a una vía de proteína específica se responde recorriendo tres tipos de relación en miles de nodos.

Términos relacionados

Grounding RAG (Retrieval-Augmented Generation)Base de datos vectorial Memoria del Agente

← Glosario