Skip to main content
Encyclopedia Britannica | Foto: Shutterstock
Encyclopedia Britannica | Foto: Shutterstock

Há muitos anos atrás, antes do Google existir, nós usávamos livros chamados enciclopédias para estudar e fazer trabalhos da escola. Esses livros prometiam conter todo – ou quase todo – o conhecimento do mundo. Mas, na realidade, eles apenas ofereciam explicações resumidas sobre os mais variados assuntos. Com o avanço da internet e a popularização dos computadores pessoais (daí a sigla PCs), as enciclopédias praticamente caíram em desuso e nós percebemos que havia muito mais conhecimento disponível nos sites de busca e na hoje pré-histórica Wikipedia.

Atualmente, com a IA, quem está caindo em desuso é o Google e os sites de busca. Mas parece que alguém voltou a usar enciclopédias para estudar. E não são os alunos.

A Encyclopedia Britannica entrou com uma ação judicial contra a OpenAI, alegando que a empresa utilizou conteúdos da enciclopédia e de sua subsidiária Merriam-Webster para treinar modelos de inteligência artificial sem autorização. A informação foi divulgada nesta segunda-feira (16) pela Reuters.

Segundo o processo, movido em um tribunal federal em Manhattan, em Nova York (EUA), a Britannica afirma que cerca de 100 mil artigos de seu acervo podem ter sido usados no treinamento de modelos de linguagem da OpenAI. A empresa diz que esse material foi incorporado aos sistemas sem licença, o que configuraria violação de direitos autorais.

Além da questão do uso do conteúdo, a Britannica também argumenta que chatbots estariam reduzindo o tráfego de leitores do site da enciclopédia. Ao responder diretamente às perguntas dos usuários, as ferramentas de IA muitas vezes entregam explicações semelhantes às publicadas pela enciclopédia, diminuindo a necessidade de acessar a fonte original.

A ação também cita exemplos em que o ChatGPT teria produzido respostas com trechos muito próximos de verbetes da enciclopédia ou definições do dicionário Merriam-Webster. Para a empresa, isso indica que o conteúdo teria sido utilizado de forma direta no treinamento dos modelos.

Como compensação, a Britannica pede indenização – cujo valor não foi divulgado – e uma ordem judicial que impeça a OpenAI de continuar utilizando seus materiais protegidos por direitos autorais.

A OpenAI, por sua vez, já afirmou em outros processos semelhantes que seus modelos são treinados com dados disponíveis publicamente na internet, argumentando que esse uso se enquadra no princípio de “fair use” (uso justo) da legislação americana.

O post IA usou enciclopédia para estudar, mas a Britannica não gostou nada disso apareceu primeiro em Startups.