Name: | Description: | Size: | Format: | |
---|---|---|---|---|
758.49 KB | Adobe PDF |
Authors
Advisor(s)
Abstract(s)
Este trabalho aborda um desafio significativo enfrentado no desenvolvimento da inteligência artificial: a utilização de dados protegidos por direitos de autor para treinar sistemas de inteligência artificial. Este problema é normalmente descrito como uma lacuna nas exceções e limites da lei de direitos de autor, o que reflete a ausência de regras claras que fomentam situações de incerteza legal, afetando assim os processos de desenvolvimento de IA. Esta situação resulta não só da falta de formalidades e do critério simples para a obra protegida, que apenas exige que a obra tenha alguma criatividade mínima, mas também de um contexto tecnológico que transforma atividades comuns em atos de criação. O acesso a ferramentas digitais avançadas permite que praticamente qualquer pessoa crie conteúdo protegido por direitos de autor, gerando assim uma proliferação de obras de criação pouco complexa e original. No decorrer do trabalho, classificamos as aplicações de aprendizagem automática de acordo com a natureza dos dados de treino utilizados, identificando as principais categorias. Atualmente, os direitos de autor regulam a realização de cópias privadas ou as utilizações que competem no mercado, mas estas constituem apenas uma fração das aplicações de IA, deixando de fora muitas utilizações socialmente nocivas de materiais protegidos. As medidas punitivas típicas do direito de autor mostram-se inadequadas para lidar com estas utilizações, sendo mais apropriadas para as situações que excedem o âmbito normativo. Discutimos várias soluções para esses desafios, destacando a necessidade de usar obras para treinar a IA, ao mesmo tempo que garantimos uma compensação justa para os criadores, promovendo assim a evolução tecnológica e a competitividade no mercado. Concluímos que a exceção de Mineração de Texto e Dados presente na Diretiva da União Europeia sobre os Direitos de Autor no Mercado Único Digital é um avanço significativo. Esta disposição, embora formulada como uma exceção, pode ser vista como uma formalidade que obriga os detentores de direitos a agir para excluir os seus materiais dos conjuntos de dados de treino, atacando diretamente uma das causas fundamentais do dilema da IA. Embora o trabalho analise a questão do ponto de vista jurídico em Portugal, refletindo a regulação da União Europeia, também se propõe a comparar diferentes ordenamentos jurídicos, identificando os locais mais favoráveis para o investimento nesta tecnologia devido à maior facilidade e abertura ao seu desenvolvimento. Dada a atualidade do tema, a análise de casos concretos que envolvem grandes empresas de tecnologia e titulares de direitos de autor cujas obras são utilizadas nos treinos de software é essencial para responder à questão central do trabalho, concluindo quanto às situações e localizações em que é lícita a utilização de obras.
This work addresses the significant challenge faced in the development of artificial intelligence: the use of copyrighted data to train AI systems. This issue is often described as a gap in the exceptions and limitations of copyright law, reflecting the lack of clear rules that foster legal uncertainty, thus affecting AI development processes. This situation arises not only from the lack of formalities and the simple criterion for protected originality, which only requires the work to have some minimal creativity, but also from a technological context that transforms common activities into acts of creation. Access to advanced digital tools allows almost anyone to create content protected by copyright, thus generating a proliferation of less complex and original creative works. In the course of this work, we classify machine learning applications according to the nature of the training data used, identifying the main categories. Currently, copyright law regulates the making of private copies or uses that compete in the market, but these constitute only a fraction of AI applications, leaving out many socially harmful uses of protected materials. The typical punitive measures of copyright law prove inadequate to deal with these uses, being more appropriate for situations that exceed the normative scope. We discuss various solutions to these challenges, highlighting the need to use works to train AI, while ensuring fair compensation for creators, thus promoting technological evolution and market competitiveness. We conclude that the Text and Data Mining exception present in the European Union Directive on Copyright in the Digital Single Market is a significant advance. This provision, although formulated as an exception, can be seen as a formality that obliges rights holders to act to exclude their materials from training datasets, directly addressing one of the fundamental causes of the AI dilemma. Although the work analyzes the issue from a legal perspective in Portugal, reflecting European Union regulation, it also aims to compare different legal systems, identifying the most favorable locations for investment in this technology due to greater ease and openness to its development. Given the current relevance of the topic, the analysis of concrete cases involving large technology companies and copyright holders whose works are used in software training is essential to address the central question of the work, concluding on the situations and locations where the use of works is lawful.
This work addresses the significant challenge faced in the development of artificial intelligence: the use of copyrighted data to train AI systems. This issue is often described as a gap in the exceptions and limitations of copyright law, reflecting the lack of clear rules that foster legal uncertainty, thus affecting AI development processes. This situation arises not only from the lack of formalities and the simple criterion for protected originality, which only requires the work to have some minimal creativity, but also from a technological context that transforms common activities into acts of creation. Access to advanced digital tools allows almost anyone to create content protected by copyright, thus generating a proliferation of less complex and original creative works. In the course of this work, we classify machine learning applications according to the nature of the training data used, identifying the main categories. Currently, copyright law regulates the making of private copies or uses that compete in the market, but these constitute only a fraction of AI applications, leaving out many socially harmful uses of protected materials. The typical punitive measures of copyright law prove inadequate to deal with these uses, being more appropriate for situations that exceed the normative scope. We discuss various solutions to these challenges, highlighting the need to use works to train AI, while ensuring fair compensation for creators, thus promoting technological evolution and market competitiveness. We conclude that the Text and Data Mining exception present in the European Union Directive on Copyright in the Digital Single Market is a significant advance. This provision, although formulated as an exception, can be seen as a formality that obliges rights holders to act to exclude their materials from training datasets, directly addressing one of the fundamental causes of the AI dilemma. Although the work analyzes the issue from a legal perspective in Portugal, reflecting European Union regulation, it also aims to compare different legal systems, identifying the most favorable locations for investment in this technology due to greater ease and openness to its development. Given the current relevance of the topic, the analysis of concrete cases involving large technology companies and copyright holders whose works are used in software training is essential to address the central question of the work, concluding on the situations and locations where the use of works is lawful.
Description
Keywords
Inteligência artificial (IA) Direitos de autor Mineração de texto e dados (TDM) Aprendizagem automática (machine learning) Aprendizagem profunda (deep learning) Modelos de treino Legislação europeia Exceção de direitos de autor Fair use Propriedade intelectual Regulação jurídica IA generativa Cópias temporárias Diretiva do mercado único digital Bases de dados Artificial intelligence (AI) Copyright Text and data mining (TDM) Machine learning Deep learning Training models European legislation Copyright exception Fair use Intellectual property Legal regulation Generative AI Temporary copies Digital single market directive Databases