3DNews AI→ original

Google Gemini 3.5 Flash passa a operar o computador no lugar do usuário

O Google adicionou ao Gemini 3.5 Flash a função Computer Use — agora o modelo opera o computador no lugar do usuário: clica na tela, preenche formulários e…

Processado por IA de 3DNews AI; editado por Hamidun News
Google Gemini 3.5 Flash passa a operar o computador no lugar do usuário
Fonte: 3DNews AI. Colagem: Hamidun News.
◐ Ouvir artigo

Google Gemini 3.5 Flash recebeu a funcionalidade Computer Use — a capacidade de controlar autonomamente um computador: pressionar botões, preencher formulários, alternar entre aplicativos e executar tarefas em várias etapas sem envolvimento humano. Google a posiciona como uma ferramenta corporativa para automatizar processos operacionais, acessível através da plataforma de nuvem Vertex AI.

Como Funciona o Controle do Computador

O princípio é semelhante ao trabalho de um operador em uma tela: o modelo recebe uma captura de tela, analisa a interface, determina a próxima ação—um clique, entrada de texto, rolagem de página—e repete o ciclo até que a tarefa seja concluída. Gemini 3.5 Flash vê a tela da mesma forma que um humano, mas age mais rápido e sem fadiga.

A escolha da versão Flash é deliberada: é o modelo mais rápido da linha Gemini 3.5. Para tarefas de agentes com longas cadeias de ações sequenciais, a velocidade de resposta é crítica—um agente lento acumula atrasos a cada passo, e cenários como automatizar dezenas de formulários se transformam em processos de várias horas.

Flash resolve esse problema através de latência baixa.

Entre as capacidades declaradas:

  • Navegação no navegador e interação com formulários da web
  • Controle de aplicativos de desktop através de GUI
  • Execução de tarefas em várias etapas sem intervenção do usuário
  • Funcionamento através de Vertex AI com controle de acesso corporativo
  • Registro de ações para auditoria e conformidade de segurança

Para Quem É e Como Obter Acesso

Google divide o desenvolvimento do Gemini em duas direções. A primeira é integração profunda com Workspace: um assistente inteligente em Gmail, Docs, Sheets e Slides que ajuda um público amplo sem conhecimento técnico especial. A segunda são capacidades de agente para o setor corporativo, ao qual Computer Use pertence. O recurso está disponível através de Vertex AI—a plataforma de nuvem corporativa do Google. As empresas poderão incorporar agentes em seus próprios processos: automatizar trabalho com sistemas legados sem APIs, delegar operações rotineiras de navegador para equipes de finanças ou RH e construir ferramentas internas baseadas em Gemini com gerenciamento e registro centralizados.

É importante entender que Computer Use não é simplesmente um "clicador automático". Estamos falando de um cenário de agente completo onde o modelo planeja independentemente uma cadeia de passos e se adapta aos resultados: se uma página carregar com atraso ou um pop-up inesperado aparecer—o agente vê isso e reage.

Competição pelo Controle da Tela

O mercado de agentes de IA que trabalham com interfaces de computador se tornou significativamente mais competitivo no ano passado. Anthropic lançou Claude Computer Use em outubro de 2024, OpenAI lançou Operator no início de 2025, e Microsoft integrou cenários de agentes em Copilot Studio para Azure. Agora Google se junta a eles com sua implementação baseada em um dos modelos mais rápidos. A competição se desenrola em vários eixos: precisão de reconhecimento de interface, velocidade de execução de cadeias de ações, segurança e capacidades de auditoria corporativa.

Google tem uma vantagem estrutural que os concorrentes não têm: Gemini funciona em um ecossistema onde Gmail, Drive e Calendar já estão implantados. Um agente que simultaneamente vê a tela e tem acesso nativo aos dados corporativos através de API obtém um nível fundamentalmente diferente de contexto—sem carregamento adicional de prompt.

"Estamos construindo IA que não apenas responde a perguntas, mas realiza trabalho", — essa é a posição geral do

Google em relação à estratégia do Gemini como uma plataforma de agentes.

O Que Isso Significa

O controle do computador está transitando de recursos experimentais para uma funcionalidade de produto padrão em todos os principais provedores de IA. Para os negócios, isso significa automação real de tarefas operacionais agora—sem reescrever sistemas legados, sem desenvolver integrações de API para cada cenário e sem envolver desenvolvedores para automação básica. A pergunta não é mais "isso vai funcionar", mas sim "quem implementará mais rápido".

ZK
Hamidun News
Notícias de AI sem ruído. Seleção editorial diária de mais de 400 fontes. Produto de Zhemal Khamidun, Head of AI na Alpina Digital.

Precisa de IA funcionando dentro da sua empresa — não só no feed de notícias?

Eu construo IA em produção para empresas — CRM sob medida, ferramentas internas, agentes autônomos, automação de processos. Pertence a você, moldada ao seu processo, sem taxa por usuário. Feito por Zhemal Khamidun, CPO da AlpinaGPT (plataforma de IA, 6.000+ usuários).

O que você acha?
Carregando comentários…