Enquanto os Estados Unidos investigam o Brasil por supostamente não coibir a pirataria, entre outros motivos, as empresas de inteligência artificial americanas já são alvo de mais de 40 processos de violação de direitos autorais. E não só por usarem conteúdo protegido no treinamento de chatbots mas também por usar cópias pirateadas de livros com esse fim.
Esse cenário já levou a um desdobramento inédito até aqui: na noite desta quinta-feira (17), um juiz da Califórnia decidiu transformar uma das ações que envolve o uso de cópias ilegais em uma ação coletiva. O processo tem como alvo a Anthropic, que é acusada de usar uma base com 7 milhões de livros piratas para treinar o Claude, seu chatbot.
Agora, os autores que tiverem obras nessa lista podem ter direito a uma reparação financeira ao fim do processo. O caso ameaça a própria existência da Anthropic: analistas já mostram que a indenização poderia, ao menos em tese, ultrapassar os US$ 100 bilhões (R$ 554 bilhões), que é o valor de mercado da companhia.
O desenvolvimento da IA diante do avanço chinês tem sido uma das prioridades do presidente americano Donald Trump, que respondeu às demandas dessas empresas por menos regulação, revogando regras do governo Joe Biden. As empresas têm feito lobby na Casa Branca em busca de proteção contra regras estaduais e de apoio para que possam usar conteúdo protegido por direitos autorais.
Enquanto isso, as ações pelo país partem de escritores, estúdios de cinema e veículos de imprensa, entre outros. Empresas como Meta, Anthropic e OpenAI argumentam, em geral, que usar obras protegidas para treinar modelos de IA se enquadra no chamado "uso justo".
Agora cabe aos tribunais americanos determinar se é mesmo o caso. Duas decisões do fim de junho, em cortes da Califórnia, deram uma vitória parcial às big techs contra grupos de autores; em ambos os casos, os juízes decidiram que não há violação no uso dos livros para treinar os robôs.
Mas a questão vai além só do treinamento dos chatbots. Em diversos casos, as empresas apelaram a conhecidos sites de livros piratas —e o fizeram conscientemente, como mostram relatórios técnicos e mensagens internas que constam nos processos.
É o caso da Anthropic, que agora virou a ação coletiva. Apesar de ter acatado a tese do uso justo no treinamento, o juiz concluiu que o emprego das cópias ilegais representa sim uma infração.
Já no caso contra a Meta, os autores alegam que a empresa também violou seus direitos ao usar livros piratas. Mas o juiz não avaliou esse ponto, que segue sem solução.
"Acho que são decisões que dava para prever", diz Sérgio Branco, diretor do Instituto de Tecnologia e Sociedade. "Imagina se, a essa altura do campeonato, a Justiça decidisse que não é uso justo. Você teria que indenizar todo mundo, ‘destreinar’ os robôs e treiná-los novamente com acesso lícito. É uma questão técnica, econômica e geopolítica para os Estados Unidos."
Em ambos os processos, documentos mostram que a decisão de baixar cópias ilegais foi tomada com o aval de altos executivos das empresas. No caso da Meta, o próprio CEO, Mark Zuckerberg, foi informado.
Dos mais de 40 processos desde 2023 nos Estados Unidos, cerca de 15 mencionam o uso de uma base de dados pirata batizada de Books3, com cerca de 200 mil títulos; seis dessas ações são contra a OpenAI.
E esses são só os processos que envolvem o treinamento dos robôs. No campo de violações em "outputs" —ou seja, o conteúdo produzido pelas máquinas— há outro rastro de controvérsias.
O jornal The New York Times, por exemplo, é autor de uma ação contra a OpenAI, a quem acusa de usar seus textos para treinar seu chatbot. No processo, a empresa de mídia mostra cem exemplos em que o ChatGPT reproduziu textos do jornal; a OpenAI disse que os comandos usados pelo veículo feriam os termos de uso da plataforma.
Testes feitos pela Folha no ano passado mostraram que o chatbot é capaz de fornecer resumos de reportagens do jornal exclusivas para assinantes, e faz o mesmo com material de outros veículos brasileiros. A plataforma só se recusa a transcrever a íntegra dos textos: "Obter ou reproduzir a íntegra sem autorização viola as políticas de uso justo", diz o ChatGPT nesses casos.
Lá fora ou aqui, para Sérgio Branco as decisões da Justiça americana terão impactos todos os detentores de propriedade intelectual.
"A Convenção de Berna diz que, se você acha que sua obra está sendo usada de forma ilegal em um país, você tem que propor uma ação nesse país. Se os Estados Unidos entenderem que é justo o uso de obras protegidas no treinamento dos robôs, eles vão poder usar obras do mundo inteiro."