Agentes

Tool Use

Tool use es la capacidad de un modelo de lenguaje de IA de invocar funciones externas, APIs o servicios—como búsqueda web, ejecución de código o consultas a bases de datos—durante la inferencia, permitiéndole recuperar información y tomar acciones más allá de la generación de texto.

Tool use es la capacidad de un modelo de lenguaje de identificar, durante la generación de texto, que se necesita una capacidad externa específica y de producir una llamada estructurada que invoque esa capacidad. El modelo recibe la salida de la herramienta y la incorpora a su razonamiento y respuesta continuos. Las herramientas extienden lo que un modelo de lenguaje puede hacer, desde el puro recuerdo paramétrico hasta la recuperación activa de información y la acción en el mundo real.

Técnicamente, las herramientas se definen mediante un esquema—típicamente una descripción JSON o de firma de función—que especifica el nombre, propósito y parámetros de la herramienta. En tiempo de inferencia, cuando el modelo determina que invocar una herramienta es apropiado, produce una llamada estructurada en lugar de lenguaje natural. Un sistema circundante intercepta esa llamada, ejecuta la función correspondiente y devuelve el resultado al modelo como una nueva entrada. El modelo luego continúa la generación con ese resultado en contexto. Múltiples llamadas de herramienta pueden encadenarse o realizarse en paralelo dependiendo del framework.

Tool use es importante porque supera limitaciones fundamentales de los modelos de lenguaje estáticos: no pueden acceder a información publicada después de su fecha de corte de entrenamiento, no pueden realizar cálculos precisos de manera confiable y no pueden modificar directamente sistemas externos. Con herramientas, un modelo puede buscar en la web información actual, ejecutar código para calcular valores exactos, leer o escribir en bases de datos, enviar mensajes o llamar a APIs de terceros—todo dentro de un único turno conversacional o flujo de agente.

A partir de 2026, tool use es una capacidad estándar en todos los principales proveedores de modelos de frontera, incluyendo Anthropic (Claude), OpenAI (serie GPT), Google (Gemini) y Meta (Llama). Los agentes en producción comúnmente dependen de docenas de herramientas. El conjunto de herramientas canónico para un agente de investigación podría incluir búsqueda web, análisis de PDF, ejecución de Python y búsqueda en base de datos vectorial, todos invocados de manera adaptativa según sea necesario durante una única tarea.

Ejemplo

Un agente de Claude que responde a una pregunta sobre precios actuales de acciones invoca una herramienta de búsqueda web para recuperar datos en vivo, luego llama a una herramienta de ejecución de código para calcular cambios porcentuales y devuelve una respuesta en lenguaje natural fundamentada en esos resultados.

Términos relacionados

← Glosario