Cloudflare acusa Perplexity de burlar bloqueios e rastrear sites de forma disfarçada

perplexity

A Cloudflare, uma das maiores fornecedoras de infraestrutura da internet no mundo, acusou a startup de busca com inteligência artificial (IA) Perplexity de ignorar propositadamente bloqueios e restrições impostas por sites, recorrendo a práticas de “rastreamento furtivo” para continuar acessando conteúdos que deveriam estar protegidos.

Segundo relatório divulgado pela Cloudflare, e divulgado pelo The Verge, mesmo quando websites especificam, via arquivos robots.txt ou regras de firewall, que não desejam ser acessados por bots da Perplexity, a startup supostamente muda sua identidade digital para driblar os bloqueios. “A Perplexity se disfarça para ignorar preferências dos sites”, diz o relatório.

Estratégias para burlar restrições

A Cloudflare diz ter realizado testes com domínios próprios, configurando restrições explícitas para impedir o acesso dos bots da Perplexity. Inicialmente, a startup tentaria acessar os sites identificando-se como “PerplexityBot” ou “Perplexity-User”. No entanto, diante dos bloqueios, mudaria sua user agente, o identificador que informa ao site qual navegador ou dispositivo está sendo usado, para simular ser o navegador Google Chrome em um computador com macOS.

A empresa também teria usado endereços de IP rotativos que não constam na lista oficial de IPs dos seus bots, além de alterar os sistemas autônomos (ASNs), que identificam blocos de IPs controlados por uma mesma entidade. Essas ações permitiriam à Perplexity evitar bloqueios automatizados, segundo a Cloudflare. O comportamento teria sido detectado em “dezenas de milhares de domínios e milhões de requisições por dia”.

Histórico de polêmicas

Essa não é a primeira vez que a Perplexity é criticada por capturar conteúdo da web sem consentimento. Em 2024, a empresa foi acusada de ultrapassar paywalls e ignorar diretrizes do robots.txt, o que gerou debate sobre ética no uso de IA. Na ocasião, o CEO, Aravind Srinivas, atribuiu a prática a rastreadores terceirizados usados pela plataforma.

A nova denúncia reacende as preocupações sobre como empresas de inteligência artificial estão coletando dados para treinar seus modelos, especialmente quando isso envolve o uso não autorizado de conteúdos protegidos ou pagos.

Reações e medidas da Cloudflare

Após os testes, a Cloudflare removeu a Perplexity da sua lista de bots verificados e anunciou a implementação de novos mecanismos para bloquear o rastreamento disfarçado. A empresa também começou a permitir que sites solicitem pagamento para que empresas de IA possam acessar seu conteúdo, e agora bloqueia bots de IA por padrão.

O CEO da Cloudflare, Matthew Prince, tem sido vocal sobre os riscos que a IA representa para a sustentabilidade financeira de sites e publicações. Ele vem defendendo que ferramentas baseadas em IA só acessem conteúdo mediante compensação ou autorização explícita.

Perplexity nega acusações

Procurada pelo site The Verge, a Perplexity afirmou, por meio do porta-voz Jesse Dwyer, que o relatório da Cloudflare se trata de uma “ação publicitária”, e que o conteúdo apresenta “muitos mal-entendidos”. A empresa não entrou em detalhes sobre as acusações técnicas feitas no relatório.

Apesar da resposta, o episódio coloca mais uma vez em evidência a tensão crescente entre startups de IA e empresas que desejam proteger seus ativos digitais, embate que deve se intensificar à medida que o uso da inteligência artificial se expande na internet.

Siga o IT Forum no LinkedIn e fique por dentro de todas as notícias!

Cloudflare acusa Perplexity de burlar bloqueios e rastrear sites de forma disfarçada

Estratégias para burlar restrições

Histórico de polêmicas

Reações e medidas da Cloudflare

Perplexity nega acusações

IA atraiu 60% do capital em late stage nos EUA, aponta J.P. Morgan

Agentes de IA podem responder por 30% da receita global de software até 2035

Quem venceu (e perdeu) na venda da Brex para o Capital One?