
À medida que a corrida da inteligência artificial caminha para uma nova etapa de competição, o Google está pronto para apresentar as suas armas. Com os agentes ganhando destaque nesse novo cenário, o Google Cloud quer convencer empresas do mundo inteiro de que o Gemini não é mais um coadjuvante, e sim a a infraestrutura central da chamada “empresa agêntica”.
Isso pelo menos é o que afirma o CEO do Google Cloud, Thomas Kurian, em uma coletiva pré-Next, o maior evento anual da divisão, que começa nesta quarta (22), em Las Vegas. Segundo o executivo, o Gemini entrou “firmemente” na sua era agêntica.
“O Gemini Enterprise é agora o sistema de ponta a ponta para a era agêntica, o tecido conectivo entre os dados, as pessoas e todos os aplicativos e agentes que transforma os processos num fluxo inteligente único.”, destaca Thomas.
O evento, que há alguns anos já superou o espaço do Moscone Center em São Francisco e migrou para o massivo centro de convenções do Mandalay Bay em Las Vegas, cresce no ritmo dos próprios números da divisão: no quarto trimestre de 2025, a receita do Google Cloud aumentou 48%, chegando a US$ 17,7 bilhões. O backlog de receita mais do que dobrou ao longo do ano, encerrando 2025 em US$ 240 bilhões.
Contudo, esse crescimento ainda não fez o Google Cloud superar os dois maiores nomes em nuvem B2B – AWS e Microsoft Azure. Até pouco tempo atrás, a divisão era vista apenas como uma divisão de negócios de uma empresa que simplesmente não tinha o DNA de vendas enterprise que a Amazon e a Microsoft construíram ao longo de décadas.
Entretanto, essa percepção foi mudando na medida em que a corrida pela IA reconfigurou o jogo, e o Google, que sempre teve os modelos, quer demonstrar que possui também a infraestrutura e o ecossistema.
Segundo Thomas, com o Gemini, essa competitividade começa a ficar ainda mais acentuada. Segundo ele, quase 75% dos clientes do Google Cloud já utilizam os produtos de IA da empresa. Nos últimos 12 meses, 330 clientes processaram mais de um trilhão de tokens cada. Os modelos do Google processam hoje mais de 16 bilhões de tokens por minuto via API, ante os 10 bilhões registrados no trimestre anterior. E um dado que o Google faz questão de sublinhar: clientes de IA usam, em média, 1,8 vez mais produtos do Google Cloud do que clientes que não adotaram IA. A fidelização está acontecendo.
No Gemini Enterprise especificamente, o crescimento de usuários ativos pagantes foi de 40% no primeiro trimestre de 2025 em relação ao anterior. “Vimos como cada funcionário, em cada organização, pode se tornar um construtor. É uma mudança incrível, mas que traz complexidade”, diz Thomas.
Plataforma e hardware
Um dos principais anúncios para o Next é a Gemini Enterprise Agent Platform, uma plataforma unificada para construir, escalar, governar e otimizar agentes. Segundo o CEO, ela é uma uma evolução do Vertex AI e integra seleção de modelos, criação de agentes, DevOps, orquestração e segurança num único lugar, com acesso a mais de 200 modelos, incluindo os próprios modelos do Google, como o Gemini 3.1 Pro, além de modelos recentes de terceiros como o Claude Opus 4.7, da Anthropic.
“A conversa passou de ‘conseguimos construir um agente?’ para ‘como gerenciamos milhares deles?’ É para isso que a plataforma foi criada, para ser um centro de controle para a empresa agêntica”. Segundo o executivo, a lógica é clara: o mercado já passou da fase de experimentação, e as empresas não estão mais testando se a IA funciona. Elas já estão tentando escalar o que já funciona, e descobrindo que escalar agentes é um problema de uma ordem de magnitude diferente de escalar software tradicional.
“Não se trata de oferecer serviços individuais isolados”, reforça o CEO. “A empresa oferece um stack otimizado verticalmente, onde tudo é desenvolvido em conjunto para entregar a escala e a eficiência exigidas por esta nova era da IA em produção”, pontua.
Junto com a plataforma de agentes, o Google anunciou a oitava geração de suas TPUs proprietárias, com dois chips distintos, atendendo a propósitos diferentes. O TPU 8t é otimizado para treinamento de modelos de fronteira, com foco em maximizar throughput computacional e largura de banda entre chips, com o objetivo de comprimir o desenvolvimento de modelos de meses para semanas.
O TPU 8i, por sua vez, foi projetado para inferência e raciocínio agêntico em tempo real. Segundo Thomas, ele é capaz de entregar a experiência de fazer uma pergunta a um agente e obter uma resposta imediata. O chip combina 288 GB de memória de alta largura de banda com 384 MB de SRAM no chip, três vezes mais do que a geração anterior.
Segurança, Workspace e concorrência
Em seus anúncios para o Google Next, a divisão de cloud da gigantes da buscas também se preocupou em endereçar os desafios de segurança dessa tal “nova era”, com três anúncios específicos: o Dark Web Intelligence, que cria perfis detalhados de organizações a partir de monitoramento de dark web; o Threat Hunting Agent, que busca proativamente padrões de ataque que escapam das defesas tradicionais; e o Detection Engineering Agent, que automatiza a criação de regras de detecção de ameaças.
Para o seu Workspace, o Google anunciou o Workspace Intelligence, descrito como uma camada que quebra silos de informação entre ferramentas e entrega contexto tanto para usuários quanto para agentes. As novidades incluem o AI Inbox no Gmail, o Ask Gemini no Google Chat, capacidades de criação de conteúdo com base na voz e no estilo do usuário no Docs e no Slides.
O contexto competitivo que dá peso extra a todos esses anúncios é a pressão crescente que o Google enfrenta na frente de codificação agêntica. Com o avanço do Claude Code, da Anthropic, e do Codex, da OpenAI, o Google precisou reagir, e segundo reportagens recentes, chegou a montar um time específico para acelerar seus modelos de coding com IA.
No fim das contas, os anúncios de IA do Google Cloud para o Next 26 estão menos focados em trazer discursos “messiânicos” sobre a IA e sim endereçam os gargalos das empresas. Inclusive, uma das sessões previstas para o evento aborda diretamente este tema. A cofundadora da World Labs, Fei-Fei Li, aborda diretamente o que o mercado de IA chama de “capability overhang”, apontando que a capacidade dos modelos já superou em muito a capacidade das empresas de implementá-los.
Na visão de Thomas, o Google está interessado em ajudar os clientes a cruzar esse abismo, indo além de vender capacidade computacional. Segundo ele, isso é o que vai definir quem lidera a próxima fase da guerra das nuvens. “A transformação para uma empresa agêntica é o futuro de todas as organizações. O AI Hypercomputer fornece a base escalável, a Data Cloud fornece o contexto, a Defesa Agêntica fornece a proteção e a Plataforma de Agentes fornece a orquestração. A tecnologia está aqui, e agora é hora de construir os motores de crescimento”, conclui o executivo.
O post Para o Google, a era agêntica do Gemini finalmente começou apareceu primeiro em Startups.

