Skip to main content
Notícias

Alibaba lança modelo de IA que afirma superar o DeepSeek

By 29 de janeiro de 2025No Comments

Logo da Alibaba exibida na tela de um smartphone, com um fundo alaranjado e o nome da empresa em destaque.

A gigante chinesa de tecnologia Alibaba lançou nesta quarta-feira (29) uma nova versão de seu modelo de inteligência artificial (IA), o Qwen 2.5, afirmando que ele supera o amplamente elogiado DeepSeek-V3.

O momento incomum do lançamento do Qwen 2.5-Max, no primeiro dia do Ano Novo Lunar, quando a maioria dos chineses está de folga com suas famílias, aponta para a pressão gerada pelo crescimento meteórico da startup chinesa DeepSeek nas últimas três semanas. Esse crescimento impactou não apenas concorrentes internacionais, mas também rivais domésticos.

Leia também: Pesquisa indica que 49% das empresas estão reduzindo investimentos em IA, no Brasil

Alibaba desafia gigantes da IA

“O Qwen 2.5-Max supera… quase em todos os aspectos os modelos GPT-4o, DeepSeek-V3 e Llama-3.1-405B”, afirmou a unidade de computação em nuvem da Alibaba em um anúncio publicado em sua conta oficial no WeChat. A declaração faz referência aos modelos de IA mais avançados da OpenAI e da Meta.

Segundo informações da Reuters, o lançamento do assistente de IA da DeepSeek em 10 de janeiro, alimentado pelo modelo DeepSeek-V3, seguido pelo lançamento do modelo R1 em 20 de janeiro, surpreendeu o Vale do Silício e causou queda nas ações de empresas de tecnologia. Os baixos custos de desenvolvimento e uso do DeepSeek levaram investidores a questionar os altos gastos planejados pelas principais empresas de IA dos Estados Unidos.

No entanto, o sucesso da DeepSeek também desencadeou uma corrida entre seus concorrentes domésticos para aprimorar seus próprios modelos de IA.

Dois dias após o lançamento do DeepSeek-R1, a ByteDance (dona do TikTok) lançou uma atualização de seu modelo de IA principal, afirmando que ele superava o modelo o1, da OpenAI, em AIME, um teste de referência que avalia a capacidade dos modelos de IA de compreender e responder a instruções complexas.

Isso ecoou a declaração da DeepSeek de que seu modelo R1 rivalizava com o o1 da OpenAI em vários benchmarks de desempenho.

DeepSeek versus concorrência na China

O modelo DeepSeek-V2, antecessor do V3, já havia desencadeado uma guerra de preços de modelos de IA na China quando foi lançado em maio do ano passado.

O fato de o DeepSeek-V2 ser de código aberto e incrivelmente barato – custando apenas 1 yuan (US$ 0,14) por 1 milhão de tokens (unidades de dados processadas pelo modelo de IA) – levou a Alibaba Cloud a anunciar reduções de preços de até 97% em uma variedade de seus modelos.

Outras gigantes chinesas de tecnologia seguiram o mesmo caminho, incluindo a Baidu (9888.HK), que lançou o primeiro equivalente chinês ao ChatGPT em março de 2023, e a Tencent, a empresa de internet mais valiosa do país.

O enigmático fundador da DeepSeek, Liang Wenfeng, disse em uma rara entrevista ao portal chinês Waves, em julho, que a startup “não se importava” com guerras de preços e que seu principal objetivo era alcançar a Inteligência Artificial Geral (AGI).

A OpenAI define a AGI como sistemas autônomos que superam os humanos na maioria das tarefas economicamente valiosas.

Enquanto as grandes empresas chinesas de tecnologia, como a Alibaba, contam com centenas de milhares de funcionários, a DeepSeek opera como um laboratório de pesquisa, formado principalmente por jovens graduados e doutorandos das melhores universidades da China.

Na entrevista de julho, Liang afirmou que as maiores empresas de tecnologia da China podem não estar preparadas para o futuro da indústria de IA, contrastando seus altos custos e estruturas hierárquicas rígidas com a operação enxuta e a gestão flexível da DeepSeek.

“Os modelos de IA de base exigem inovação contínua, e as capacidades das gigantes da tecnologia têm seus limites”, disse ele.

Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!