Técnicas y métodos

Grounding

Grounding es la práctica de conectar la salida de un LLM a fuentes de información externas y verificables—como documentos recuperados, resultados web en directo o bases de datos estructuradas—para reducir las alucinaciones y mejorar la precisión factual.

Grounding, en el contexto de los modelos de lenguaje grandes, es la práctica de anclar las salidas del modelo a fuentes de información externas específicas—como documentos recuperados, resultados de búsqueda web en directo, bases de datos estructuradas o respuestas de API—para que las afirmaciones puedan rastrearse hasta evidencia verificable. Se dirige directamente a la alucinación, la tendencia de los LLMs paramétricos a generar afirmaciones que suenan plausibles pero factualmente incorrectas basadas en patrones estadísticos en los datos de entrenamiento en lugar de hechos autoritarios o en tiempo real.

El mecanismo de grounding más prevalente es la Generación Aumentada por Recuperación (RAG), introducida por Lewis et al. en NeurIPS 2020, donde pasajes relevantes se obtienen de una base de conocimiento y se insertan en el prompt del modelo antes de la generación. Los enfoques alternativos incluyen el uso de herramientas y function calling—donde el modelo invoca una API de búsqueda, una calculadora o una consulta SQL e incorpora el resultado—y el grounding de datos estructurados, donde las respuestas se derivan directamente de las salidas de consultas de base de datos. Cada enfoque varía en latencia, cobertura y auditabilidad de la cadena de evidencia.

Grounding es esencial para despliegues empresariales donde se requieren precisión y responsabilidad. Permite citas: el modelo puede referenciar el pasaje de origen exacto que utilizó, apoyando la verificación humana y el cumplimiento normativo. También permite que los modelos manejen eventos que ocurren después de su fecha de corte de entrenamiento, ya que los documentos relevantes pueden recuperarse en tiempo de inferencia sin reentrenamiento.

A partir de 2026, grounding es una característica predeterminada en los principales asistentes de IA. ChatGPT integra la búsqueda web de Bing, Google Gemini utiliza grounding de Google Search de forma nativa, y Perplexity AI está construido completamente alrededor de una arquitectura de búsqueda con grounding. Plataformas empresariales como Microsoft 365 Copilot y Salesforce Einstein anclan las respuestas contra datos organizacionales propietarios a través de tuberías RAG. Marcos de evaluación dedicados—RAGAS y ARES—miden específicamente la calidad del grounding a través de métricas como fidelidad y relevancia de respuesta.

Ejemplo

Un chatbot de analista financiero construido en Azure OpenAI usa RAG para anclar sus respuestas en los informes de ganancias propietarios de la empresa y los documentos de la SEC, asegurando que cada cifra citada pueda rastrearse hasta un pasaje de documento específico.

Términos relacionados

Últimas noticias sobre el tema

← Glosario