Britannica e Merriam-Webster processam a OpenAI por quase 100 mil artigos
Britannica e Merriam-Webster entraram com uma ação contra a OpenAI em Nova York. As editoras afirmam que a empresa usou seus materiais de referência para…
Processado por IA de TNW; editado por Hamidun News
A Enciclopédia Britannica e o Merriam-Webster abriram um processo judicial contra a OpenAI em Nova York, alegando que a empresa usou seus materiais para treinar o ChatGPT sem permissão. De acordo com os editores, o bot não apenas se baseia em seus textos de referência, mas também é capaz de reproduzir fragmentos de quase 100 mil artigos muito próximos ao original.
Quais São as Alegações
O processo foi apresentado em 13 de março de 2026, em Nova York. Britannica e Merriam-Webster acusam OpenAI em duas frentes: violação de direitos autorais e uso de suas marcas em um contexto que, segundo seu entendimento, induz usuários em erro. Não se trata de alguns poucos respostas questionáveis, mas de um conjunto de materiais que os editores passaram décadas coletando, editando e monetizando como um produto de referência. Agora, conforme os autores da ação, essa base de conhecimento ajuda a treinar uma interface concorrente sem licença e sem compensação.
Uma parte fundamental das alegações diz respeito não apenas ao treinamento da modelo em si, mas também ao que acontece no resultado final. Os editores argumentam que o ChatGPT é capaz de produzir respostas que, segundo eles, às vezes reproduzem seus artigos quase literalmente. Para marcas de referência, isso é particularmente problemático: se um usuário obtém uma definição pronta, explicação ou referência histórica direto no chat, tem menos motivos para visitar o site, adquirir uma assinatura ou interagir com o editor original.
No Que os Editores Apontam
No centro da disputa está um conflito típico de IA generativa: a tese de que "um modelo aprende com dados gerais" versus a acusação de que o produto acaba substituindo a fonte original. No caso de Britannica e Merriam-Webster, os autores da ação tentam demonstrar precisamente a segunda lógica: o valor é criado por eles, mas o usuário final recebe um resultado de referência quase pronto já dentro do ChatGPT. Portanto, a reclamação se constrói em torno de vários temas recorrentes:
- uso de seus materiais de referência para treinar a modelo sem permissão;
- respostas do ChatGPT que, segundo eles, às vezes repetem artigos quase literalmente;
- a escala das alegações — quase 100 mil artigos e materiais;
- o risco de que um usuário obtenha valor dentro do chat e nunca chegue ao recurso original;
- alegações de marca registrada, se a marca do editor ajuda a legitimar uma resposta criada por outro.
Editores de referência ocupam uma posição especial nessa disputa. Seu conteúdo é curto, estruturado, factual e projetado para fornecer uma resposta direta a uma pergunta — precisamente esse formato é particularmente conveniente para grandes modelos de linguagem. Portanto, o conflito aqui parece mais severo do que no caso de longas colunas ou textos literários: um artigo de enciclopédia ou entrada de dicionário corresponde quase perfeitamente ao que um usuário espera de um chatbot em um clique.
Por Que a Disputa Está se Intensificando
A nova ação não surgiu do nada. Aproximadamente seis meses antes disso, as mesmas empresas já tinham aberto um processo semelhante contra Perplexity. Isso mostra que não se trata de um conflito isolado com uma plataforma específica, mas de uma estratégia mais ampla: os editores querem desafiar a própria abordagem pela qual serviços de IA constroem uma interface de resposta sobre os arquivos de outras pessoas e depois mantêm a audiência. Se essa lógica se estabelecer nos tribunais, a pressão afetará não apenas chatbots, mas também respostas de mecanismo de busca de próxima geração. Este é um teste importante dos limites aceitáveis para o mercado.
Uma coisa é quando uma modelo aprende estatisticamente de um grande corpus de textos e formula uma nova resposta com suas próprias palavras. Outra é quando reproduz fragmentos reconhecíveis ou efetivamente substitui um produto de referência pago. O tribunal provavelmente terá que lidar com várias dimensões simultaneamente: onde termina o aprendizado e começa a cópia, quão apropriadas são as referências a uma marca bem conhecida, e se essas respostas podem ser consideradas uma substituição direta do conteúdo original.
OpenAI, como outros desenvolvedores de modelos, já está operando em um ambiente onde a pressão dos detentores de direitos só aumenta. Para a empresa, esse processo é particularmente incômodo porque é levado não simplesmente por mídia ou autores individuais, mas por duas marcas de referência clássicas cujo valor se baseia em precisão, edição e confiança em suas formulações. Se os autores conseguirem demonstrar convincentemente a reprodução sistemática de conteúdo, isso fortalecerá a posição dos que exigem que as empresas de IA licenciem dados em vez de usá-los por padrão.
O Que Isso Significa
O caso de Britannica e Merriam-Webster mostra que a principal questão legal em torno de IA generativa está mudando da abstrata "pode-se aprender com textos de outras pessoas" para a mais prática "pode-se depois substituir o produto de outro com isso." Se o tribunal vir ChatGPT não apenas como uma ferramenta de síntese, mas como um concorrente direto das publicações de referência, a pressão no mercado por licenças, parcerias e restrições ao resultado de respostas aumentará drasticamente.
Quer parar de ler sobre IA e começar a usar?
AI News é um feed curado de notícias de IA. A Hamidun Academy ensina você a usar IA no trabalho.