Google permite que Gemini API combine Search, Maps y funciones personalizadas en una sola solicitud
Google ha ampliado Gemini API y ahora permite combinar en una sola solicitud herramientas integradas como Search y Maps con funciones personalizadas. Esto…
Procesado por IA desde MarkTechPost; editado por Hamidun News
Google ha expandido la Gemini API: ahora las herramientas integradas como Google Search y Google Maps se pueden combinar con funciones personalizadas en una sola solicitud. Esto elimina parte de la orquestración manual en torno a escenarios de agente y acerca la API a un formato donde el modelo coordina la búsqueda, las llamadas de código y las transiciones entre pasos.
Qué cambió
La actualización anunciada por Google en marzo de 2026 añade un manejo de herramientas más coherente a la Gemini API. Anteriormente, los desarrolladores a menudo tenían que organizar la búsqueda por separado, trazar una ruta a mapas o datos externos por separado y luego pegar manualmente las respuestas en la aplicación. Ahora gran parte de esta lógica se puede montar en una sola llamada: el modelo gana acceso a los servicios integrados de Google e inmediatamente puede invocar funciones personalizadas si el escenario requiere acciones más allá del conjunto estándar.
Un tutorial práctico muestra cinco demostraciones que aumentan gradualmente la complejidad de la tarea. La lógica comienza con una combinación básica de herramientas, luego realiza la transición a cadenas de agente de varios pasos, donde la transferencia de contexto entre etapas, la identificación de llamadas paralelas y la continuación correcta del diálogo después de la respuesta de una función externa son críticas. Para los desarrolladores, este es un cambio significativo: la orquestración se distribuye menos en el backend y se mueve más hacia la propia sesión del modelo. Esto hace que el comportamiento de la cadena sea notablemente más transparente para la depuración y las pruebas.
Cómo funciona la llamada
La idea clave es que Gemini ahora puede decidir en un solo paso cuándo necesita búsqueda web, cuándo necesita datos geoespaciales de Maps y cuándo necesita una función de aplicación personalizada. Si una pregunta requiere múltiples acciones, el modelo puede mantener el contexto general, alinear resultados de diferentes herramientas y continuar la cadena sin un reinicio completo del escenario. Se hace especial énfasis en los ID de herramientas paralelas y la circulación de contexto: esto ayuda a evitar confundir las respuestas de las herramientas y transferir datos necesarios al siguiente paso.
- Google Search obtiene información actualizada sobre el tema de la consulta
- Google Maps agrega direcciones, contexto geográfico y datos de lugares
- Las funciones personalizadas conectan la lógica comercial interna de la aplicación
- Las cadenas de múltiples pasos permiten construir escenarios a partir de múltiples acciones secuenciales
Este enfoque es conveniente para escenarios donde la respuesta no se puede obtener de una sola fuente. Por ejemplo, un asistente puede encontrar primero información actualizada a través de Search, luego verificar un lugar en el mapa a través de Maps, luego llamar a una función interna de reserva, cálculo o verificación de disponibilidad. Anteriormente, tal secuencia a menudo tenía que dividirse en múltiples solicitudes y el estado entre ellas mantenerse manualmente. Para servicios con acciones del mundo real, esto simplifica significativamente la arquitectura.
Por qué importa a los desarrolladores
El principal beneficio es menos pegamento entre el modelo y la lógica del producto. En lugar de escribir un orquestrador separado para cada combinación de herramientas, un equipo puede describir funciones, dar al modelo acceso a los servicios necesarios y construir escenarios de agente más naturales. Esto es especialmente útil para asistentes que no deben solo responder con texto, sino realmente realizar tareas: buscar datos, seleccionar un lugar en un mapa, verificar parámetros, pasar el resultado a un servicio interno y solo entonces formular la respuesta final para el usuario.
Otra ventaja es el escalado más predecible de cadenas complejas. Cuando las herramientas integradas de Google y las funciones propias de una empresa se conectan en un proceso, disminuye el número de capas intermedias donde normalmente se pierde el contexto o se rompe la lógica de las llamadas. Para los equipos, esto significa prototipos más rápidos y menos código estándar a su alrededor. Y para los productos, una oportunidad de pasar más rápidamente de un chatbot con sugerencias a un agente que realmente sabe cómo llevar una tarea a su conclusión.
Qué significa esto
Google está moviendo la Gemini API hacia interfaces de agente completas, donde el modelo no solo genera texto sino que gestiona un conjunto de herramientas en una sola sesión. Si este enfoque resulta ser estable en escenarios de producción real, los desarrolladores podrán ensamblar asistentes de IA útiles con menos orquestación manual y llevarlos al mercado más rápido.
¿Quieres dejar de leer sobre IA y empezar a usarla?
AI News es un feed curado de noticias de IA. Hamidun Academy te enseña a usar la IA en tu trabajo.
Lo esencial de la IA — una vez por semana
Siete historias que de verdad importaron, elegidas a mano. Sin ruido ni notas de prensa.
¡Listo! Revisa tu correo para la confirmación.