Skip to main content

Logótipos das empresas Red Hat e Google Cloud sobre um fundo cinzento escuro. À esquerda, está o logótipo da Red Hat com o ícone de um chapéu vermelho inclinado e o nome "Red Hat" em branco. Ao centro, uma linha vertical separa os dois logótipos. À direita, aparece o logótipo colorido da Google Cloud, seguido do texto "Google Cloud" em branco.

A Red Hat e o Google Cloud anunciaram nesta quinta-feira (22), a ampliação de sua parceria, visando o impulsionamento da inteligência artificial (IA). A união irá ampliar o rol de aplicações empresariais para IA, integrando tecnologias de código aberto da empresa de open source com a infraestrutura especializada da Google e sua linha de modelos, o Gemma.

Após o comunicado, a Red Hat também declarou que, a partir de agora, será uma das primeiras testadoras da Gemma, começando pelo Gemma 3, com suporte imediato ao vLLM – servidor de inferência open source que acelera a execução de aplicações de IA generativa. Por outro lado, os TPUs do Google Cloud – aceleradores de IA de alto desempenho – são agora compatíveis com o vLLM. A integração pretende permitir que os desenvolvedores maximizem os recursos enquanto obtêm desempenho e a eficiência para uma inferência veloz.

Além disso, a companhia opens source lançou o projeto llm-d, com a big tech como colaboradora. A iniciativa visa permitir maior escalabilidade em recursos heterogêneos, otimizar os custos e aumentar a eficiência das cargas de trabalho a partir da IA generativa.

Leia mais: EUA e China voltam a se enfrentar, agora por causa dos chips de IA da Huawei

A Red Hat também estará disponível dentro do ambiente empresarial por meio do Red Hat AI Inference Server, presente agora no Google Cloud. A plataforma foi criada para ajudar as empresas a otimizar a inferência de modelos em todo o seu ambiente de nuvem híbrida. Utilizando a infraestrutura do Google Cloud, as organizações podem implantar modelos de IA generativa prontos para produção.

Por fim, a parceria inclui a Red Hat no protocolo Agent2Agent (A2A) do Google — um protocolo em nível de aplicação que facilita a comunicação entre agentes e usuários finais em plataformas e nuvens diversas. Ao participar ativamente do A2A ecossistema, a empresa busca garantir que os fluxos de trabalho de IA permaneçam dinâmicos e eficazes com o poder da IA agentica.

Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!