Knowledge Graph
Un knowledge graph es una base de datos estructurada que representa entidades del mundo real como nodos y sus relaciones semánticas como aristas etiquetadas, permitiendo a las máquinas recorrer redes de hechos y admitir consultas de razonamiento multi-salto.
Un knowledge graph es una base de datos estructurada en grafo que codifica entidades del mundo real como nodos y sus relaciones semánticas como aristas dirigidas y etiquetadas—típicamente almacenadas como triples sujeto-predicado-objeto (por ejemplo, "Marie Curie — ganó — Premio Nobel de Física"). A diferencia de las bases de datos relacionales, que imponen esquemas rígidos, los knowledge graphs acomodan información altamente heterogénea e interconectada y admiten razonamiento multi-salto: recorrer varias aristas de relación para responder preguntas que ningún registro único contiene.
Los knowledge graphs se construyen extrayendo entidades y relaciones de corpus de texto, integrando fuentes de datos estructurados y aplicando ontologías que definen tipos de entidades y restricciones de relación. Los ejemplos públicos a gran escala incluyen Wikidata (más de 100 millones de elementos a partir de 2024), que respalda la capa de datos estructurados de Wikipedia, y el Knowledge Graph de Google, que potencia paneles de información en Google Search. Los grafos de dominio especializados incluyen SNOMED CT y UMLS en atención médica; las grandes instituciones financieras mantienen grafos que vinculan empresas, ejecutivos, transacciones y documentos normativos.
En tuberías de IA, los knowledge graphs sirven como capa de anclaje para consultas de hechos, proporcionan contexto estructurado para respuesta de preguntas y permiten rutas de razonamiento explicables donde la cadena de relaciones recorridas es auditable. El marco GraphRAG de Microsoft (2024) demostró que pre-construir un knowledge graph a partir de un corpus de documentos y consultar subgrafos en tiempo de recuperación supera a RAG de vector estándar en preguntas que requieren sintetizar información en muchos documentos—particularmente preguntas de nivel comunitario y temáticas.
A partir de 2026, combinar knowledge graphs con LLMs es un área activa de producto e investigación. Los LLMs se utilizan para construir grafos a partir de texto no estructurado y para traducir preguntas en lenguaje natural a lenguajes de consulta de grafos como Cypher (Neo4j) o SPARQL. Las redes neuronales de grafos habilitan aún más el razonamiento basado en incrustaciones sobre la estructura del grafo. La infraestructura de producción es proporcionada por Neo4j, Amazon Neptune y Nebula Graph, mientras que proyectos de código abierto como Apache TinkerPop admiten despliegues más ligeros.