Skip to main content

LUP Student Papers

LUND UNIVERSITY LIBRARIES

Den upphovsrättsliga apokalypsen - En studie om användningen av skyddade verk som träningsdata för att generera nya alster genom kreativ artificiell intelligens

Cronberg, Sara LU (2023) JURM02 20231
Department of Law
Faculty of Law
Abstract (Swedish)
En fortskridande teknisk utveckling har inneburit större möjligheter att exploatera upphovsrättsligt skyddat material i den digitala miljön. En teknik som särskilt har uppmärksammats är kreativ artificiell intelligens, som kan användas för att generera nya litterära eller konstnärliga verk. Förfogandet innebär emellertid att många upphovsrättsligt skyddade verk utnyttjas under inlärningsprocessen i egenskap av träningsdata för AI-systemet. Denna uppsats syftar till att utreda om förfogandet utgör intrång i upphovsmannens ensamrätt samt om användandet av befintligt skyddade verk som träningsdata innebär att det nya producerade alstret är att anse som en bearbetning eller ett nytt och självständigt verk. Med hänsyn till att uppsatsen... (More)
En fortskridande teknisk utveckling har inneburit större möjligheter att exploatera upphovsrättsligt skyddat material i den digitala miljön. En teknik som särskilt har uppmärksammats är kreativ artificiell intelligens, som kan användas för att generera nya litterära eller konstnärliga verk. Förfogandet innebär emellertid att många upphovsrättsligt skyddade verk utnyttjas under inlärningsprocessen i egenskap av träningsdata för AI-systemet. Denna uppsats syftar till att utreda om förfogandet utgör intrång i upphovsmannens ensamrätt samt om användandet av befintligt skyddade verk som träningsdata innebär att det nya producerade alstret är att anse som en bearbetning eller ett nytt och självständigt verk. Med hänsyn till att uppsatsen behandlar förhållandet mellan teknikens utveckling och upphovsrätten anläggs såväl en rättsdogmatisk som en rättsanalytisk metod.

Upphovsmannen har en exklusiv rätt till exemplarframställning enligt 2 § första stycket URL. När befintligt skyddade verk inmatas och analyseras under inlärningsprocessen för kreativa AI-system skapas automatiskt ett flertal digitala kopior som kan lagras under en viss tid i systemet. Dessa kopior är ofta av mer permanent karaktär och kan komma att återspeglas vid AI-systemets slutresultat, varför kopiorna torde utgöra ett intrång i upphovsmannens ensamrätt till exemplarframställning. Vidare konstateras det i framställningen att det är högst osannolikt att de digitala kopior som uppstår i kreativa AI-system uppfyller förutsättningarna för att omfattas av inskränkningen för tillfällig exemplarframställning i 11 a § URL. Förfogandet måste således tillåtas av upphovsmannen eller omfattas av någon annan upphovsrättslig inskränkning för att vara godkänt.

Om de befintligt skyddade verk som använts som träningsdata i viss mån återspeglas i det nya AI-genererade alstret kan detta innebära en bearbetning av ett ursprungsverk, vilket även omfattas av ensamrätten i 2 § första stycket URL. Enbart det faktum att ett befintligt verk har tjänat som inspiration, medvetet eller omedvetet, till ett nytt och självständigt verk leder emellertid inte per automatik till att det utgör en otillåten bearbetning. Situationen ska bedömas i varje enskilt fall utifrån bland annat syftet, urvalet av material och ändamålet med skapandet. Det föreligger större risk för att bearbetningsskyddet ska bli aktuellt om materialet som används är homogent och enbart avspeglar en specifik konstnär.

De nya inskränkningarna för text- och datautvinning som återfinns i 15 a-c §§ URL, motsvarande artikel 3 och 4 i DSM-direktivet, öppnar upp för en viss möjlighet att använda text- och datautvinning för kreativa AI-system i syfte att producera nya alster, om förutsättningarna i lagtexten uppfylls. Rättighetsinnehavare har emellertid en möjlighet att på lämpligt sätt förbehålla sig sådant användande, något som forskare anser begränsar den praktiska effekten med bestämmelsen. Detta aktualiserar en svår balansgång mellan upphovsmannens intresse av skydd och kontroll, respektive samhällets intresse av att främja innovation och teknisk utveckling. I framställningen konstateras det avslutningsvis att de nuvarande inskränkningarna för text- och datautvinning i DSM-direktivet inte utgör tillräcklig ledning i en värld där tekniken utvecklas i rasande takt, men att direktivet ändock utgör ett betydande steg för bedömningen av hur befintligt skyddade verk får användas som träningsdata. (Less)
Abstract
The technology is evolving in a rapid pace and there are endless possibilities to exploit copyright-protected material in the digital environment. As artificial intelligence develops to be more autonomous, the phenomenon is one of the hot topics in copyright law today. Creative AI can be described as “creative” machines that can be used to generate new literary or artistic outputs. This thesis aims to examine and investigate whether the use of copyrighted or protected works as training data for AI machines constitutes an infringement of the author's exclusive right to reproduction, and whether the use of existing protected works as training data means that the generated work is a derivative work or a new and independent work. Since this... (More)
The technology is evolving in a rapid pace and there are endless possibilities to exploit copyright-protected material in the digital environment. As artificial intelligence develops to be more autonomous, the phenomenon is one of the hot topics in copyright law today. Creative AI can be described as “creative” machines that can be used to generate new literary or artistic outputs. This thesis aims to examine and investigate whether the use of copyrighted or protected works as training data for AI machines constitutes an infringement of the author's exclusive right to reproduction, and whether the use of existing protected works as training data means that the generated work is a derivative work or a new and independent work. Since this thesis examines the relationship between the development of technology, computer generated work and copyright, a legal dogmatic method and an legal analytical method is applied.

The author has an exclusive right to make copies according to 2 § first paragraph in the Swedish Act on Copyright in literary and artistic works. When copyright protected works are used as training data for creative AI systems, multiple digital copies are automatically created and can be stored for a certain time in the system. These copies usually have a more permanent nature and may be reflected in output of the AI system. Thus, the thesis concludes that the digital copies in most cases constitute an infringement of the author's exclusive right to make copies. Furthermore, the thesis concludes that it is unlikely that the digital copies that arise in creative AI systems meet the conditions for being covered by the restriction for temporary copying in 11 a § in the Swedish Act on Copyright. Hence, the act must either be permitted by the author or be covered by another copyright restriction.

If the existing protected works that were used as training data to some extent would be reflected in the new AI-output, the output may constitute as a derivative work. Derivative works are covered by the exclusive rights in 2 § first paragraph in the Swedish Act on Copyright. However, the mere fact that an existing work has served as inspiration, consciously or unconsciously, for a new and independent work does not automatically constitute a derivative work. The situation must be assessed in each individual case based on, for instance, the purpose of the creation and the selection of material. There is a greater risk if the protected material is homogeneous and only reflects a specific artist in the output.

The new restrictions for text and data mining are regulated in 15 a-c § in the Swedish Act on Copyright, corresponding to articles 3 and 4 of the Directive (2019/790) on copyright and related rights in the Digital Single Market (DSM Directive). The restrictions can to some extent justify the use of text and data mining for creative AI systems to produce new outputs. However, rightsholders have an opportunity to appropriately reserve such use by the opt-out-mechanism in article 4, which many researchers believe limits the practical effect of the provision. Hence, the use of protected works as training data for creative AI systems by text and data mining actualizes a difficult balance test between the author's interest in protection and control, and society's interest in promoting innovation and technological development. The thesis concludes that the current restrictions for text and data mining cannot be considered as sufficient guidance in a world where technology is developing in a rapid pace. Although, the DSM-directive constitutes a significant step for the assessment of how existing protected works may be used as training data for AI machines. (Less)
Please use this url to cite or link to this publication:
author
Cronberg, Sara LU
supervisor
organization
alternative title
The copyright apocalypse - A study on the use of copyright protected works as training data for generative artificial intelligence tools
course
JURM02 20231
year
type
H3 - Professional qualifications (4 Years - )
subject
keywords
Upphovsrätt, IT-rätt, Rättsinformatik, TDM, AI
language
Swedish
id
9116545
date added to LUP
2023-06-19 09:21:42
date last changed
2023-06-19 09:21:42
@misc{9116545,
  abstract     = {{The technology is evolving in a rapid pace and there are endless possibilities to exploit copyright-protected material in the digital environment. As artificial intelligence develops to be more autonomous, the phenomenon is one of the hot topics in copyright law today. Creative AI can be described as “creative” machines that can be used to generate new literary or artistic outputs. This thesis aims to examine and investigate whether the use of copyrighted or protected works as training data for AI machines constitutes an infringement of the author's exclusive right to reproduction, and whether the use of existing protected works as training data means that the generated work is a derivative work or a new and independent work. Since this thesis examines the relationship between the development of technology, computer generated work and copyright, a legal dogmatic method and an legal analytical method is applied. 

The author has an exclusive right to make copies according to 2 § first paragraph in the Swedish Act on Copyright in literary and artistic works. When copyright protected works are used as training data for creative AI systems, multiple digital copies are automatically created and can be stored for a certain time in the system. These copies usually have a more permanent nature and may be reflected in output of the AI system. Thus, the thesis concludes that the digital copies in most cases constitute an infringement of the author's exclusive right to make copies. Furthermore, the thesis concludes that it is unlikely that the digital copies that arise in creative AI systems meet the conditions for being covered by the restriction for temporary copying in 11 a § in the Swedish Act on Copyright. Hence, the act must either be permitted by the author or be covered by another copyright restriction. 

If the existing protected works that were used as training data to some extent would be reflected in the new AI-output, the output may constitute as a derivative work. Derivative works are covered by the exclusive rights in 2 § first paragraph in the Swedish Act on Copyright. However, the mere fact that an existing work has served as inspiration, consciously or unconsciously, for a new and independent work does not automatically constitute a derivative work. The situation must be assessed in each individual case based on, for instance, the purpose of the creation and the selection of material. There is a greater risk if the protected material is homogeneous and only reflects a specific artist in the output. 

The new restrictions for text and data mining are regulated in 15 a-c § in the Swedish Act on Copyright, corresponding to articles 3 and 4 of the Directive (2019/790) on copyright and related rights in the Digital Single Market (DSM Directive). The restrictions can to some extent justify the use of text and data mining for creative AI systems to produce new outputs. However, rightsholders have an opportunity to appropriately reserve such use by the opt-out-mechanism in article 4, which many researchers believe limits the practical effect of the provision. Hence, the use of protected works as training data for creative AI systems by text and data mining actualizes a difficult balance test between the author's interest in protection and control, and society's interest in promoting innovation and technological development. The thesis concludes that the current restrictions for text and data mining cannot be considered as sufficient guidance in a world where technology is developing in a rapid pace. Although, the DSM-directive constitutes a significant step for the assessment of how existing protected works may be used as training data for AI machines.}},
  author       = {{Cronberg, Sara}},
  language     = {{swe}},
  note         = {{Student Paper}},
  title        = {{Den upphovsrättsliga apokalypsen - En studie om användningen av skyddade verk som träningsdata för att generera nya alster genom kreativ artificiell intelligens}},
  year         = {{2023}},
}