A gigante chinesa de tecnologia Alibaba lançou nesta quarta-feira (29) uma nova versão de seu modelo de inteligência artificial (IA), o Qwen 2.5, afirmando que ele supera o amplamente elogiado DeepSeek-V3.
O momento incomum do lançamento do Qwen 2.5-Max, no primeiro dia do Ano Novo Lunar, quando a maioria dos chineses está de folga com suas famílias, aponta para a pressão gerada pelo crescimento meteórico da startup chinesa DeepSeek nas últimas três semanas. Esse crescimento impactou não apenas concorrentes internacionais, mas também rivais domésticos.
Leia também: Pesquisa indica que 49% das empresas estão reduzindo investimentos em IA, no Brasil
Alibaba desafia gigantes da IA
“O Qwen 2.5-Max supera… quase em todos os aspectos os modelos GPT-4o, DeepSeek-V3 e Llama-3.1-405B”, afirmou a unidade de computação em nuvem da Alibaba em um anúncio publicado em sua conta oficial no WeChat. A declaração faz referência aos modelos de IA mais avançados da OpenAI e da Meta.
Segundo informações da Reuters, o lançamento do assistente de IA da DeepSeek em 10 de janeiro, alimentado pelo modelo DeepSeek-V3, seguido pelo lançamento do modelo R1 em 20 de janeiro, surpreendeu o Vale do Silício e causou queda nas ações de empresas de tecnologia. Os baixos custos de desenvolvimento e uso do DeepSeek levaram investidores a questionar os altos gastos planejados pelas principais empresas de IA dos Estados Unidos.
No entanto, o sucesso da DeepSeek também desencadeou uma corrida entre seus concorrentes domésticos para aprimorar seus próprios modelos de IA.
Dois dias após o lançamento do DeepSeek-R1, a ByteDance (dona do TikTok) lançou uma atualização de seu modelo de IA principal, afirmando que ele superava o modelo o1, da OpenAI, em AIME, um teste de referência que avalia a capacidade dos modelos de IA de compreender e responder a instruções complexas.
Isso ecoou a declaração da DeepSeek de que seu modelo R1 rivalizava com o o1 da OpenAI em vários benchmarks de desempenho.
DeepSeek versus concorrência na China
O modelo DeepSeek-V2, antecessor do V3, já havia desencadeado uma guerra de preços de modelos de IA na China quando foi lançado em maio do ano passado.
O fato de o DeepSeek-V2 ser de código aberto e incrivelmente barato – custando apenas 1 yuan (US$ 0,14) por 1 milhão de tokens (unidades de dados processadas pelo modelo de IA) – levou a Alibaba Cloud a anunciar reduções de preços de até 97% em uma variedade de seus modelos.
Outras gigantes chinesas de tecnologia seguiram o mesmo caminho, incluindo a Baidu (9888.HK), que lançou o primeiro equivalente chinês ao ChatGPT em março de 2023, e a Tencent, a empresa de internet mais valiosa do país.
O enigmático fundador da DeepSeek, Liang Wenfeng, disse em uma rara entrevista ao portal chinês Waves, em julho, que a startup “não se importava” com guerras de preços e que seu principal objetivo era alcançar a Inteligência Artificial Geral (AGI).
A OpenAI define a AGI como sistemas autônomos que superam os humanos na maioria das tarefas economicamente valiosas.
Enquanto as grandes empresas chinesas de tecnologia, como a Alibaba, contam com centenas de milhares de funcionários, a DeepSeek opera como um laboratório de pesquisa, formado principalmente por jovens graduados e doutorandos das melhores universidades da China.
Na entrevista de julho, Liang afirmou que as maiores empresas de tecnologia da China podem não estar preparadas para o futuro da indústria de IA, contrastando seus altos custos e estruturas hierárquicas rígidas com a operação enxuta e a gestão flexível da DeepSeek.
“Os modelos de IA de base exigem inovação contínua, e as capacidades das gigantes da tecnologia têm seus limites”, disse ele.
Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!