Repository logo
 
Publication

IA e obras: uma parceria ilícita? : a ilicitude da utilização de dados no treino de IA

datacite.subject.fosCiências Sociais::Direitopt_PT
dc.contributor.advisorSilva, Nuno de Araújo Sousa e
dc.contributor.authorFerreira, Miguel Amorim
dc.date.accessioned2024-12-03T14:00:19Z
dc.date.available2024-12-03T14:00:19Z
dc.date.issued2024-09-23
dc.date.submitted2024
dc.description.abstractEste trabalho aborda um desafio significativo enfrentado no desenvolvimento da inteligência artificial: a utilização de dados protegidos por direitos de autor para treinar sistemas de inteligência artificial. Este problema é normalmente descrito como uma lacuna nas exceções e limites da lei de direitos de autor, o que reflete a ausência de regras claras que fomentam situações de incerteza legal, afetando assim os processos de desenvolvimento de IA. Esta situação resulta não só da falta de formalidades e do critério simples para a obra protegida, que apenas exige que a obra tenha alguma criatividade mínima, mas também de um contexto tecnológico que transforma atividades comuns em atos de criação. O acesso a ferramentas digitais avançadas permite que praticamente qualquer pessoa crie conteúdo protegido por direitos de autor, gerando assim uma proliferação de obras de criação pouco complexa e original. No decorrer do trabalho, classificamos as aplicações de aprendizagem automática de acordo com a natureza dos dados de treino utilizados, identificando as principais categorias. Atualmente, os direitos de autor regulam a realização de cópias privadas ou as utilizações que competem no mercado, mas estas constituem apenas uma fração das aplicações de IA, deixando de fora muitas utilizações socialmente nocivas de materiais protegidos. As medidas punitivas típicas do direito de autor mostram-se inadequadas para lidar com estas utilizações, sendo mais apropriadas para as situações que excedem o âmbito normativo. Discutimos várias soluções para esses desafios, destacando a necessidade de usar obras para treinar a IA, ao mesmo tempo que garantimos uma compensação justa para os criadores, promovendo assim a evolução tecnológica e a competitividade no mercado. Concluímos que a exceção de Mineração de Texto e Dados presente na Diretiva da União Europeia sobre os Direitos de Autor no Mercado Único Digital é um avanço significativo. Esta disposição, embora formulada como uma exceção, pode ser vista como uma formalidade que obriga os detentores de direitos a agir para excluir os seus materiais dos conjuntos de dados de treino, atacando diretamente uma das causas fundamentais do dilema da IA. Embora o trabalho analise a questão do ponto de vista jurídico em Portugal, refletindo a regulação da União Europeia, também se propõe a comparar diferentes ordenamentos jurídicos, identificando os locais mais favoráveis para o investimento nesta tecnologia devido à maior facilidade e abertura ao seu desenvolvimento. Dada a atualidade do tema, a análise de casos concretos que envolvem grandes empresas de tecnologia e titulares de direitos de autor cujas obras são utilizadas nos treinos de software é essencial para responder à questão central do trabalho, concluindo quanto às situações e localizações em que é lícita a utilização de obras.pt_PT
dc.description.abstractThis work addresses the significant challenge faced in the development of artificial intelligence: the use of copyrighted data to train AI systems. This issue is often described as a gap in the exceptions and limitations of copyright law, reflecting the lack of clear rules that foster legal uncertainty, thus affecting AI development processes. This situation arises not only from the lack of formalities and the simple criterion for protected originality, which only requires the work to have some minimal creativity, but also from a technological context that transforms common activities into acts of creation. Access to advanced digital tools allows almost anyone to create content protected by copyright, thus generating a proliferation of less complex and original creative works. In the course of this work, we classify machine learning applications according to the nature of the training data used, identifying the main categories. Currently, copyright law regulates the making of private copies or uses that compete in the market, but these constitute only a fraction of AI applications, leaving out many socially harmful uses of protected materials. The typical punitive measures of copyright law prove inadequate to deal with these uses, being more appropriate for situations that exceed the normative scope. We discuss various solutions to these challenges, highlighting the need to use works to train AI, while ensuring fair compensation for creators, thus promoting technological evolution and market competitiveness. We conclude that the Text and Data Mining exception present in the European Union Directive on Copyright in the Digital Single Market is a significant advance. This provision, although formulated as an exception, can be seen as a formality that obliges rights holders to act to exclude their materials from training datasets, directly addressing one of the fundamental causes of the AI dilemma. Although the work analyzes the issue from a legal perspective in Portugal, reflecting European Union regulation, it also aims to compare different legal systems, identifying the most favorable locations for investment in this technology due to greater ease and openness to its development. Given the current relevance of the topic, the analysis of concrete cases involving large technology companies and copyright holders whose works are used in software training is essential to address the central question of the work, concluding on the situations and locations where the use of works is lawful.pt_PT
dc.identifier.tid203726545pt_PT
dc.identifier.urihttp://hdl.handle.net/10400.14/47404
dc.language.isoporpt_PT
dc.subjectInteligência artificial (IA)pt_PT
dc.subjectDireitos de autorpt_PT
dc.subjectMineração de texto e dados (TDM)pt_PT
dc.subjectAprendizagem automática (machine learning)pt_PT
dc.subjectAprendizagem profunda (deep learning)pt_PT
dc.subjectModelos de treinopt_PT
dc.subjectLegislação europeiapt_PT
dc.subjectExceção de direitos de autorpt_PT
dc.subjectFair usept_PT
dc.subjectPropriedade intelectualpt_PT
dc.subjectRegulação jurídicapt_PT
dc.subjectIA generativapt_PT
dc.subjectCópias temporáriaspt_PT
dc.subjectDiretiva do mercado único digitalpt_PT
dc.subjectBases de dadospt_PT
dc.subjectArtificial intelligence (AI)pt_PT
dc.subjectCopyrightpt_PT
dc.subjectText and data mining (TDM)pt_PT
dc.subjectMachine learningpt_PT
dc.subjectDeep learningpt_PT
dc.subjectTraining modelspt_PT
dc.subjectEuropean legislationpt_PT
dc.subjectCopyright exceptionpt_PT
dc.subjectFair usept_PT
dc.subjectIntellectual propertypt_PT
dc.subjectLegal regulationpt_PT
dc.subjectGenerative AIpt_PT
dc.subjectTemporary copiespt_PT
dc.subjectDigital single market directivept_PT
dc.subjectDatabasespt_PT
dc.titleIA e obras: uma parceria ilícita? : a ilicitude da utilização de dados no treino de IApt_PT
dc.typemaster thesis
dspace.entity.typePublication
rcaap.rightsopenAccesspt_PT
rcaap.typemasterThesispt_PT
thesis.degree.nameMestrado em Direito e Gestãopt_PT

Files

Original bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
203726545.pdf
Size:
758.49 KB
Format:
Adobe Portable Document Format
License bundle
Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
3.44 KB
Format:
Item-specific license agreed upon to submission
Description: