Agentes

Human-in-the-Loop (HITL)

Human-in-the-Loop (HITL) es un patrón de diseño de sistema en el que la supervisión humana se integra estructuralmente en uno o más puntos de decisión en una pipeline de IA automatizada, requiriendo que una persona apruebe, corrija o redirija el sistema antes de que continúe.

Human-in-the-Loop (HITL) se refiere a cualquier arquitectura en la que el juicio humano se integra estructuralmente en un flujo de trabajo automatizado en lugar de aplicarse solo después del hecho. En contextos de agentes de IA, HITL significa que el agente se detiene en puntos de control especificados y solicita confirmación humana antes de ejecutar acciones que son consecuentes, irreversibles, ambiguas o fuera de un umbral de confianza predefinido. El término precede a los modelos de lenguaje grandes — ha sido utilizado en aprendizaje activo y robótica al menos desde los 2000s — pero ganó renovada prominencia cuando los agentes de IA autónomos comenzaron a tomar acciones del mundo real.

Los puntos de control HITL se pueden configurar con granularidad variable. Una implementación mínima podría requerir aprobación humana solo para acciones de alto riesgo o destructivas — eliminar archivos, enviar correos electrónicos, iniciar transacciones financieras — mientras que una configuración más conservadora requiere aprobación en cada paso de planificación. Algunos sistemas implementan HITL asincrónico, encolando acciones propuestas para revisión humana sin bloquear el agente en pasos paralelos de menor riesgo. El humano puede aprobar, rechazar, modificar o redirigir la acción propuesta; el agente incorpora la respuesta y continúa. Los registros de auditoría de todas las aprobaciones proporcionan trazabilidad para propósitos de cumplimiento.

HITL importa porque los agentes de IA actuales no son confiablemente correctos: alucinan hechos, malinterpretan instrucciones ambiguas y ocasionalmente proponen acciones con grandes consecuencias no previstas. HITL proporciona un mecanismo de seguridad estructural, particularmente para dominios de alto riesgo incluyendo transacciones financieras, decisiones de atención médica, generación de documentos legales, despliegue de código en sistemas de producción y robótica del mundo físico. Los marcos regulatorios refuerzan este imperativo: la Ley de IA de la UE, que entró en fases de aplicación en 2024-2025, ordena supervisión humana significativa para categorías de sistemas de IA de alto riesgo como se define en su Anexo III.

A partir de 2026, HITL es una característica estándar configurable en plataformas de agentes de IA empresariales. LangGraph expone primitivos de interrupción que pausan la ejecución del grafo esperando entrada humana; Claude de Anthropic soporta modos de aprobación configurables para llamadas de herramientas sensibles; y los vendedores de automatización de procesos robóticos han añadido colas de aprobación de acciones de agente a sus plataformas existentes. La investigación activa explora reducir la sobrecarga de HITL mientras se preservan garantías de seguridad — incluyendo escalada basada en confianza que enruta solo decisiones de baja confianza a humanos, agrupación de acciones puntuadas por riesgo y modelos aprendidos que predicen cuándo la revisión humana añade más valor relativo al costo de latencia.

Ejemplo

Un agente de refactorización de código que se ejecuta autónomamente en un repositorio de producción está configurado para pausar y presentar un diff unificado al ingeniero de guardia antes de ejecutar cualquier script de migración de base de datos; el ingeniero revisa el cambio, lo aprueba con un comentario, y el agente continúa — previniendo que una modificación de esquema no revisada llegue al sistema vivo.

Términos relacionados

Agente autónomo Guardrails Alineación de IA

← Glosario