Seguridad

Alucinación

Una alucinación es una salida confiada y fluida de un modelo de lenguaje de IA que es factualmente incorrecta, fabricada o no fundamentada en su entrada o conocimiento, producida sin indicación alguna de incertidumbre.

En el contexto de los grandes modelos de lenguaje (LLMs), la alucinación se refiere a la generación de información que suena plausible pero es factualmente incorrecta, no respaldada por material fuente o completamente fabricada. A diferencia de un simple error, una alucinación normalmente se presenta con el mismo estilo confiado y fluido que la salida precisa, lo que dificulta a los usuarios identificarla sin verificación independiente. El término se toma prestado de la psicología pero describe un fenómeno computacional distinto enraizado en cómo se entrenan los modelos de lenguaje.

Las alucinaciones surgen porque los LLMs se optimizan para producir continuaciones de texto fluidas y coherentes en lugar de verificar la precisión factual. Cuando un modelo encuentra una consulta sobre un tema donde sus datos de entrenamiento son escasos, contradictorios o ausentes, genera una terminación que suena plausible y rellena los vacíos con detalles inventados. Los sistemas de generación aumentada por recuperación (RAG) reducen las alucinaciones al anclar las salidas a documentos recuperados pero no las eliminan. Las mitigaciones adicionales incluyen el uso de herramientas (permitiendo que los modelos verifiquen afirmaciones a través de búsqueda o APIs), entrenamiento de calibración y generación restringida por citas.

Las alucinaciones son una barrera práctica significativa para desplegar LLMs en dominios de alto riesgo. Los casos documentados incluyen citas legales fabricadas presentadas ante tribunales federales estadounidenses en 2023 (el caso Mata v. Avianca), referencias científicas inventadas en contextos académicos e información médica incorrecta entregada con aparente confianza. Estos fracasos llevaron a directrices formales de organismos profesionales legales y médicos aconsejando contra afirmaciones factuales generadas por IA no revisadas.

Para 2026, la alucinación sigue siendo un problema de investigación activo. Los puntos de referencia incluyendo TruthfulQA, HaluEval y FActScore cuantifican las tasas de alucinación entre modelos. Los modelos comerciales líderes han reducido sustancialmente la frecuencia de alucinaciones en comparación con las líneas de base de 2022-2023 a través de entrenamiento de alineación mejorado, integración de RAG y técnicas de generación fundamentada. Sin embargo, ningún modelo de producción ha logrado operaciones libres de alucinaciones, y las tasas varían significativamente por dominio, especificidad de consulta y si la recuperación externa está disponible.

Ejemplo

Cuando se le pregunta por los detalles de publicación de un artículo académico específico, un modelo de lenguaje podría confiadamente devolver un nombre de revista, número de volumen y rango de páginas que parecen creíbles pero están completamente fabricados—una alucinación que puede engañar a investigadores que no verifican la cita de forma independiente.

Términos relacionados

Últimas noticias sobre el tema

← Glosario