Google permite que a Gemini API combine Search, Maps e funções personalizadas em uma única solicitação
O Google expandiu a Gemini API e agora permite combinar, em uma única solicitação, ferramentas nativas como Search e Maps com funções personalizadas. Isso…
Processado por IA de MarkTechPost; editado por Hamidun News
Google expandiu a Gemini API: agora ferramentas integradas como Google Search e Google Maps podem ser combinadas com funções personalizadas em uma única solicitação. Isso remove parte da orquestração manual em torno de cenários de agente e aproxima a API de um formato onde o modelo coordena a busca, as chamadas de código e as transições entre etapas.
O que mudou
A atualização anunciada pelo Google em março de 2026 adiciona um gerenciamento de ferramentas mais coeso à Gemini API. Anteriormente, os desenvolvedores frequentemente precisavam organizar a busca separadamente, planejar uma rota para mapas ou dados externos separadamente e depois colar manualmente as respostas no aplicativo. Agora grande parte dessa lógica pode ser montada em uma única chamada: o modelo ganha acesso aos serviços integrados do Google e simultaneamente pode invocar funções personalizadas se o cenário exigir ações além do conjunto padrão.
Um passo a passo prático mostra cinco demonstrações que aumentam gradualmente a complexidade da tarefa. A lógica começa com uma combinação básica de ferramentas e depois faz a transição para cadeias de agente com várias etapas, onde a transferência de contexto entre estágios, a identificação de chamadas paralelas e a continuação correta do diálogo após a resposta de uma função externa são críticas. Para desenvolvedores, essa é uma mudança significativa: a orquestração se espalha menos pelo backend e se move mais para a própria sessão do modelo. Isso torna o comportamento da cadeia notavelmente mais transparente para depuração e teste.
Como a chamada funciona
A ideia-chave é que a Gemini agora pode decidir em uma única passagem quando precisa de busca na web, quando precisa de dados geoespaciais do Maps e quando precisa de uma função de aplicativo personalizado. Se uma pergunta exigir várias ações, o modelo pode manter o contexto geral, alinhar resultados de diferentes ferramentas e continuar a cadeia sem uma reinicialização completa do cenário. Ênfase especial é colocada em IDs de ferramentas paralelas e circulação de contexto: isso ajuda a evitar confundir respostas de ferramentas e transferir dados necessários para a próxima etapa.
- Google Search obtém informações atualizadas sobre o tópico da consulta
- Google Maps adiciona endereços, contexto geográfico e dados de locais
- Funções personalizadas conectam a lógica de negócio interna do aplicativo
- Cadeias multi-etapa permitem construir cenários a partir de várias ações sequenciais
Essa abordagem é conveniente para cenários em que a resposta não pode ser obtida de uma única fonte. Por exemplo, um assistente pode primeiro encontrar informações atualizadas por meio do Search, depois verificar um local no mapa por meio do Maps, depois chamar uma função interna de reserva, cálculo ou verificação de disponibilidade. Anteriormente, tal sequência frequentemente tinha de ser dividida em várias solicitações e o estado entre elas mantido manualmente. Para serviços com ações do mundo real, isso simplifica significativamente a arquitetura.
Por que isso importa para os desenvolvedores
O principal benefício é menos cola entre o modelo e a lógica do produto. Em vez de escrever um orquestrador separado para cada combinação de ferramentas, uma equipe pode descrever funções, dar ao modelo acesso aos serviços necessários e criar cenários de agente mais naturais. Isso é especialmente útil para assistentes que não devem apenas responder com texto, mas realmente executar tarefas: buscar dados, selecionar um local em um mapa, verificar parâmetros, passar o resultado para um serviço interno e só então formular a resposta final para o usuário.
Outra vantagem é o dimensionamento mais previsível de cadeias complexas. Quando ferramentas integradas do Google e funções próprias de uma empresa são conectadas em um processo, o número de camadas intermediárias onde o contexto geralmente se perde ou a lógica de chamada quebra diminui. Para equipes, isso significa protótipos mais rápidos e menos código boilerplate em torno deles. E para produtos, uma chance de avançar mais rápido de um chatbot com sugestões para um agente que realmente sabe como entregar uma tarefa até a conclusão.
O que isso significa
Google está movendo a Gemini API em direção a interfaces de agente com recursos completos, onde o modelo não apenas gera texto, mas gerencia um conjunto de ferramentas em uma única sessão. Se essa abordagem se mostrar estável em cenários de produção real, os desenvolvedores poderão montar assistentes de IA úteis com menos orquestração manual e colocá-los no mercado mais rapidamente.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.
O essencial da IA — uma vez por semana
Sete histórias que realmente importaram, escolhidas a dedo. Sem ruído nem releases.
Pronto! Verifique seu e-mail para a confirmação.