IA e obras: uma parceria ilícita? : a ilicitude da utilização de dados no treino de IA

Ferreira, Miguel Amorim

Publicação

IA e obras: uma parceria ilícita? : a ilicitude da utilização de dados no treino de IA

2024-09-23Dissertação de mestrado

datacite.subject.fos	Ciências Sociais::Direito	pt_PT
dc.contributor.advisor	Silva, Nuno de Araújo Sousa e
dc.contributor.author	Ferreira, Miguel Amorim
dc.date.accessioned	2024-12-03T14:00:19Z
dc.date.available	2024-12-03T14:00:19Z
dc.date.issued	2024-09-23
dc.date.submitted	2024
dc.description.abstract	Este trabalho aborda um desafio significativo enfrentado no desenvolvimento da inteligência artificial: a utilização de dados protegidos por direitos de autor para treinar sistemas de inteligência artificial. Este problema é normalmente descrito como uma lacuna nas exceções e limites da lei de direitos de autor, o que reflete a ausência de regras claras que fomentam situações de incerteza legal, afetando assim os processos de desenvolvimento de IA. Esta situação resulta não só da falta de formalidades e do critério simples para a obra protegida, que apenas exige que a obra tenha alguma criatividade mínima, mas também de um contexto tecnológico que transforma atividades comuns em atos de criação. O acesso a ferramentas digitais avançadas permite que praticamente qualquer pessoa crie conteúdo protegido por direitos de autor, gerando assim uma proliferação de obras de criação pouco complexa e original. No decorrer do trabalho, classificamos as aplicações de aprendizagem automática de acordo com a natureza dos dados de treino utilizados, identificando as principais categorias. Atualmente, os direitos de autor regulam a realização de cópias privadas ou as utilizações que competem no mercado, mas estas constituem apenas uma fração das aplicações de IA, deixando de fora muitas utilizações socialmente nocivas de materiais protegidos. As medidas punitivas típicas do direito de autor mostram-se inadequadas para lidar com estas utilizações, sendo mais apropriadas para as situações que excedem o âmbito normativo. Discutimos várias soluções para esses desafios, destacando a necessidade de usar obras para treinar a IA, ao mesmo tempo que garantimos uma compensação justa para os criadores, promovendo assim a evolução tecnológica e a competitividade no mercado. Concluímos que a exceção de Mineração de Texto e Dados presente na Diretiva da União Europeia sobre os Direitos de Autor no Mercado Único Digital é um avanço significativo. Esta disposição, embora formulada como uma exceção, pode ser vista como uma formalidade que obriga os detentores de direitos a agir para excluir os seus materiais dos conjuntos de dados de treino, atacando diretamente uma das causas fundamentais do dilema da IA. Embora o trabalho analise a questão do ponto de vista jurídico em Portugal, refletindo a regulação da União Europeia, também se propõe a comparar diferentes ordenamentos jurídicos, identificando os locais mais favoráveis para o investimento nesta tecnologia devido à maior facilidade e abertura ao seu desenvolvimento. Dada a atualidade do tema, a análise de casos concretos que envolvem grandes empresas de tecnologia e titulares de direitos de autor cujas obras são utilizadas nos treinos de software é essencial para responder à questão central do trabalho, concluindo quanto às situações e localizações em que é lícita a utilização de obras.	pt_PT
dc.description.abstract	This work addresses the significant challenge faced in the development of artificial intelligence: the use of copyrighted data to train AI systems. This issue is often described as a gap in the exceptions and limitations of copyright law, reflecting the lack of clear rules that foster legal uncertainty, thus affecting AI development processes. This situation arises not only from the lack of formalities and the simple criterion for protected originality, which only requires the work to have some minimal creativity, but also from a technological context that transforms common activities into acts of creation. Access to advanced digital tools allows almost anyone to create content protected by copyright, thus generating a proliferation of less complex and original creative works. In the course of this work, we classify machine learning applications according to the nature of the training data used, identifying the main categories. Currently, copyright law regulates the making of private copies or uses that compete in the market, but these constitute only a fraction of AI applications, leaving out many socially harmful uses of protected materials. The typical punitive measures of copyright law prove inadequate to deal with these uses, being more appropriate for situations that exceed the normative scope. We discuss various solutions to these challenges, highlighting the need to use works to train AI, while ensuring fair compensation for creators, thus promoting technological evolution and market competitiveness. We conclude that the Text and Data Mining exception present in the European Union Directive on Copyright in the Digital Single Market is a significant advance. This provision, although formulated as an exception, can be seen as a formality that obliges rights holders to act to exclude their materials from training datasets, directly addressing one of the fundamental causes of the AI dilemma. Although the work analyzes the issue from a legal perspective in Portugal, reflecting European Union regulation, it also aims to compare different legal systems, identifying the most favorable locations for investment in this technology due to greater ease and openness to its development. Given the current relevance of the topic, the analysis of concrete cases involving large technology companies and copyright holders whose works are used in software training is essential to address the central question of the work, concluding on the situations and locations where the use of works is lawful.	pt_PT
dc.identifier.tid	203726545	pt_PT
dc.identifier.uri	http://hdl.handle.net/10400.14/47404
dc.language.iso	por	pt_PT
dc.subject	Inteligência artificial (IA)	pt_PT
dc.subject	Direitos de autor	pt_PT
dc.subject	Mineração de texto e dados (TDM)	pt_PT
dc.subject	Aprendizagem automática (machine learning)	pt_PT
dc.subject	Aprendizagem profunda (deep learning)	pt_PT
dc.subject	Modelos de treino	pt_PT
dc.subject	Legislação europeia	pt_PT
dc.subject	Exceção de direitos de autor	pt_PT
dc.subject	Fair use	pt_PT
dc.subject	Propriedade intelectual	pt_PT
dc.subject	Regulação jurídica	pt_PT
dc.subject	IA generativa	pt_PT
dc.subject	Cópias temporárias	pt_PT
dc.subject	Diretiva do mercado único digital	pt_PT
dc.subject	Bases de dados	pt_PT
dc.subject	Artificial intelligence (AI)	pt_PT
dc.subject	Copyright	pt_PT
dc.subject	Text and data mining (TDM)	pt_PT
dc.subject	Machine learning	pt_PT
dc.subject	Deep learning	pt_PT
dc.subject	Training models	pt_PT
dc.subject	European legislation	pt_PT
dc.subject	Copyright exception	pt_PT
dc.subject	Fair use	pt_PT
dc.subject	Intellectual property	pt_PT
dc.subject	Legal regulation	pt_PT
dc.subject	Generative AI	pt_PT
dc.subject	Temporary copies	pt_PT
dc.subject	Digital single market directive	pt_PT
dc.subject	Databases	pt_PT
dc.title	IA e obras: uma parceria ilícita? : a ilicitude da utilização de dados no treino de IA	pt_PT
dc.type	master thesis
dspace.entity.type	Publication
rcaap.rights	openAccess	pt_PT
rcaap.type	masterThesis	pt_PT
thesis.degree.name	Mestrado em Direito e Gestão	pt_PT

Ficheiros

Principais

A mostrar 1 - 1 de 1

Nome:: 203726545.pdf
Tamanho:: 758.49 KB
Formato:: Adobe Portable Document Format

Ver/Abrir

Licença

A mostrar 1 - 1 de 1

Nome:: license.txt
Tamanho:: 3.44 KB
Formato:: Item-specific license agreed upon to submission
Descrição:

Ver/Abrir

Coleções

R - Dissertações de Mestrado / Master Dissertations
FD - Dissertações de Mestrado / Master Dissertations