O que a lei de direitos autorais tem a dizer sobre a proteção da criatividade em um mundo que em breve dependerá da IA em uma ampla gama de setores? As regras existentes são robustas o suficiente para proteger os direitos dos empreendedores individuais e, ao mesmo tempo, apoiar a inovação em larga escala?
Como alguém que orienta empresas sobre financiamento em estágio inicial, questões de propriedade intelectual e regulamentação de tecnologia financeira, vi o aprendizado de máquina e as plataformas de IA começarem a reconfigurar o cenário tecnológico. A grande quantidade de novo conteúdo e valor gerado pela IA vai rivalizar e potencialmente eclipsar o grau de disrupção que vimos quando a internet amadureceu. Uma explosão cambriana de conteúdo gerado por IA está sobre nós, e muito desse conteúdo ameaçará a capacidade da classe criativa de ganhar a vida.
Quando penso na avalanche de inovação que a IA representa, tenho duas preocupações sobre se a lei e a política de direitos autorais evoluirão com rapidez suficiente.
A primeira é que a ingestão de dados em escala – necessária para treinar modelos de IA – será vista como uma forma de violação de direitos autorais altamente automatizada. A segunda é que novos conteúdos produzidos por plataformas de IA serão considerados como infringindo os direitos autorais associados aos dados previamente ingeridos durante a fase de treinamento.
Em ambos os casos, a lei de direitos autorais pode não fornecer aos criadores humanos a proteção que eles desejam ou precisam.
A IA está nos forçando a enfrentar uma limitação crítica da lei de direitos autorais dos EUA
A lei de direitos autorais dos Estados Unidos permite que uma entidade ou um indivíduo proteja obras tangíveis e originais – tudo, desde música a filme, de pintura a escultura, de fotografias a obras de literatura, de código de software a sites.
Os direitos autorais não concedem proteção a ideias ou leis da natureza; ele apenas fornece proteção para o em que as idéias são expressas. Por exemplo, você não pode registrar a ideia abstrata ou o costume de dizer “eu te amo”, mas pode proteger um poema cuja mensagem geral para o leitor ou público seja “eu te amo”.
Em geral, terceiros não podem reproduzir, distribuir, executar ou exibir trabalhos protegidos por direitos autorais sem autorização prévia do detentor dos direitos autorais — esses são os “direitos exclusivos” concedidos aos detentores dos direitos autorais pela Lei de Direitos Autorais dos Estados Unidos.
E é isso que torna os direitos autorais tão valiosos economicamente: os detentores dos direitos autorais decidem quanto cobrar de terceiros que desejam reproduzir, distribuir, executar ou exibir seu trabalho protegido. No entanto, os detentores de direitos autorais não têm o direito de impedir que outros aprendam com um trabalho protegido por direitos autorais, uma vez que o proprietário desse trabalho decidiu exibi-lo, distribuí-lo ou compartilhá-lo com o público.
É exatamente por isso que os modelos de treinamento de IA representam um desafio difícil. Embora saibamos que os proprietários de direitos autorais não podem processar pessoas por meramente consumir ou aprender com seu trabalho, eles têm ferramentas poderosas para impedir que terceiros distribuam seus trabalhos sem sua autorização. Se plataformas de IA como o GPT-3 da OpenAI, a espinha dorsal do ChatGPT, copiassem e distribuíssem diretamente obras protegidas por direitos autorais, elas seriam responsabilizadas por violação de direitos autorais.
Mas não é exatamente isso que essas plataformas de IA estão fazendo. Essas plataformas estão aprendendo rapidamente com grandes quantidades de dados publicamente acessíveis e, em seguida, gerando novos conteúdos. Esse conteúdo recém-gerado pode um dia substituir os criadores humanos existentes no mercado.
Mas os principais atores do ecossistema de IA veem isso como um aprendizado rápido e altamente eficaz, não a mera cópia e regurgitação de trabalhos protegidos por direitos autorais. Na opinião deles, um computador superinteligente (ou seja, um modelo de IA) deve ser capaz de ler e aprender legalmente com uma quantidade ilimitada de material valioso protegido por direitos autorais sem desencadear uma ação judicial.
A lei de direitos autorais, é claro, não vê as coisas dessa maneira. Posso não ser capaz de impedir que uma única pessoa aprenda com um livro que escrevi, mas se um modelo de IA for treinado em grandes quantidades de dados protegidos por direitos autorais, os proprietários dos direitos autorais subjacentes podem – e irão – contestar o uso de seus dados com base no fato de que o modelo de IA teve que primeiro copiar os dados para aprender com eles.
Além disso, sempre que uma plataforma de IA cria produtos que competem com sucesso com obras protegidas por direitos autorais, levando à diminuição das vendas dessas obras protegidas, haverá ações judiciais por um simples motivo: a lei de direitos autorais abomina o carona.
'Aprendizagem justa' pode ser o caminho a seguir
A lei de direitos autorais americana enfrenta um duro desafio.
Por um lado, ninguém sabe ao certo qual será o impacto econômico das plataformas de IA nos vários mercados de obras individuais protegidas por direitos autorais. Alguns desses mercados podem ser dizimados, enquanto outros não sofrerão nenhum impacto.
Por outro lado, o Congresso tem a obrigação de garantir que as empresas de IA nos EUA sejam competitivas com suas contrapartes internacionais, e isso exige fornecer a essas empresas uma imagem clara de como a lei de direitos autorais tratará suas plataformas de IA de ponta.
Uma proposta é o aprendizado justo, apresentado por Mark Lemley e Bryan Casey, que permitiria que as empresas de IA ingerissem e analisassem grandes conjuntos de dados, mesmo que o conteúdo fosse protegido por direitos autorais. De acordo com Lemley e Casey, esta é a abordagem política correta porque expande um princípio central da lei de direitos autorais: ideias, fatos e funções em um trabalho protegido não são eles próprios protegidos por direitos autorais. Dado que a maior parte do treinamento de dados de IA é feito com o objetivo de aprender com os elementos não protegidos de obras protegidas por direitos autorais, segue-se que a maioria das plataformas de IA deve ser capaz de se envolver em treinamento de modelos em larga escala.
Como Lemley e Casey apontam, um “sistema ML quer fotos de sinais de parada para que possa aprender a reconhecer sinais de parada, não por causa das escolhas artísticas que você fez na iluminação ou na composição de sua foto”.
Se adotada pelos legisladores, a doutrina da aprendizagem justa ajudaria bastante a proteger empresas inovadoras de IA. Ainda assim, o aprendizado justo por si só provavelmente não resolverá todos os conflitos entre detentores de direitos autorais e plataformas generativas de IA. Nem todos os casos são tão diretos quanto o caso do sinal de pare, e nem todos os detentores de direitos autorais ficarão satisfeitos com um aviso de isenção de responsabilidade que basicamente diz “copiamos suas coisas, mas o fizemos por motivos com os quais você não deveria se preocupar”.
O principal problema agora é a falta de informação
Um problema-chave que precisa ser resolvido é que os detentores de direitos autorais não têm informações completas sobre como seus trabalhos protegidos são usados especificamente por plataformas generativas de IA – então eles assumem o pior.
A solução natural, então, é obter mais informações aos detentores de direitos autorais.
Uma maneira de garantir que eles recebam isso seria exigir que as empresas de IA adotem e publiquem uma política de uso de dados. Essa política (a) identificaria os conjuntos de dados que eles usam para treinar seus modelos de IA e (b) descreveria se e como sua plataforma de IA retém dados dos conjuntos de dados que eles empregam. Ao compartilhar essa política de uso de dados, os detentores de direitos autorais teriam uma janela para saber como as empresas de IA ingerem dados e produzem novos conteúdos. Como resultado, qualquer empresa de IA que publicasse uma política de uso de dados teria direito à presunção de aprendizado justo; as empresas que optaram por não publicar tal política seriam obrigadas a confiar na defesa de uso justo padrão atualmente disponível para réus em casos de direitos autorais.
Este novo requisito realizaria duas coisas. Primeiro, dissuadiria os proprietários de direitos autorais de entrar com ações judiciais que provavelmente não serão bem-sucedidas nos casos em que elementos protegidos por direitos autorais não são reproduzidos em trabalhos gerados por IA. Em segundo lugar, um diálogo seria iniciado entre as empresas de IA e a classe criativa. A longo prazo, esse diálogo ajudaria todos os participantes do ecossistema a perceber que as máquinas aprendem com as obras de direitos autorais em grande parte da mesma maneira que os humanos, experimentando repetidamente e remixando ideias diferentes para criar coisas novas.
Posts Relacionados
A SpaceX recentemente compartilhou algumas imagens impressionantes capturadas do segundo estágio de seu foguete Falcon 9. O clipe (abaixo) mostra a Terra a milhares de quilômetros de distância, com oceano, terra e nuvens claramente visíveis. O mais impressionante, no entanto, é a aparência de mármore do planeta que lembra a icônica foto de “bola de
VR, ou Realidade Virtual, é uma tecnologia desenvolvida para fazer você se sentir imerso em um mundo virtual. É uma sensação distintamente diferente de jogar ou navegar em um ambiente 3D em um monitor 2D estático, dando uma sensação real de presença no espaço virtual. Isso normalmente é obtido com um fone de ouvido VR
Há duas maneiras de usar o Bing Image Creator. O mais simples é ir para bing.com/create, que exibe o Image Creator em visualização diretamente no seu navegador. Ele está disponível para todos e é um bom lugar para experimentá-lo, mesmo no celular. A versão mais completa dele, no entanto, pode ser encontrada no Bing Chat