Tekoälytaide ja tekijänoikeus – haastava yhtälö?

1/2023 27.1.2023

Tekoälyteknologia kehittyy kiihtyvällä vauhdilla, ja vuonna 2022 useat tekoälykehittäjät avasivat tehokkaat kuvageneraattorinsa suuren yleisön käyttöön. Nyt kuka tahansa voi hyödyntää tekoälyä kuvituksen ja kuvataiteen luomisessa. Suureen suosioon nousseeseen ja toisaalta kiivasta keskustelua herättäneeseen tekoälytaiteeseen liittyy haastavia tekijänoikeudellisia kysymyksiä, joista yksi on tekijänoikeusloukkausten riski tekoälyn opetusvaiheessa.

Taidetta luovan tekoälyn kehittäminen vaatii suuren määrän kuvia

Tekoälyn avulla on taiteen kentällä esimerkiksi sävelletty musiikkia, kirjoitettu romaaneja ja luotu kokonaisia musikaalinäytelmiä. Viimeisen vuoden aikana erityisesti kuvituksen ja kuvataiteen luominen tekoälyn avulla on ollut otsikoissa, kun pitkälle kehittyneet tekoälypohjaiset kuvageneraattorit kuten DALL-E, Midjourney ja Stable Diffusion julkaistiin verkossa vapaaseen käyttöön.

Nämä tekoälyohjelmat tuottavat hetkessä kuvia käyttäjän antamien tekstikomentojen perusteella. Käyttäjä voi komennoissaan määritellä haluamiensa kuvien sisällön ja tyylin. Kuvageneraattoreiden suosio on kasvanut nopeasti niiden nopeuden ja helppokäyttöisyyden ansiosta. Tekoäly noudattaa käyttäjän toiveita usein hämmästyttävän hyvin ja imitoi vakuuttavasti vaikkapa kuvataiteen eri tyylisuuntauksia tai yksittäisen taiteilijan tyyliä.

Tekoälyä hyödyntävät ohjelmat kykenevät taitavasti tuottamaan uusia kuvia muun muassa sen ansiosta, että tekoälyä on opetettu valtavan kuva-aineiston avulla. Yksinkertaistettuna tekoälyn opettaminen tapahtuu syöttämällä tekoälylle kuvia ja niitä kuvailevia kuvatekstejä. Toiston ja lukemattomien kuva-tekstiparien opettelun kautta tekoäly kehittyy ja tuottaa yhä paremmin tekstikomentoja vastaavia kuvia.

Tekijänoikeuden kannalta kuvageneraattoreiden toiminnassa syntyy haasteita etenkin siinä, että tekoälylle syötetyn suuren opetusdatamassan seassa on todennäköisesti tekijänoikeuden alaista aineistoa. Opetusdatana käytetty kuva-aineisto on usein kerätty verkosta ilman oikeudenhaltijoiden suostumusta kyseiseen käyttötarkoitukseen. Kaikkien kuvageneraattoreiden hyödyntämistä aineistoista ei ole julkaistu tarkempia tietoja, mutta ainakin Stable Diffusion -kuvageneraattorin avoimesta lähdekoodista on ilmennyt, että tekoälyohjelman opettamiseen käytetty tietokanta sisältää suuren määrän tekijänoikeudella suojattua aineistoa.

Siinä missä kuvageneraattorit ovat herättäneet innostusta, tekoälytaiteeseen liittyvät oikeudelliset epäselvyydet ja eettiset kysymykset ovat toisaalta kuohuttaneet maailmalla. Tammikuussa 2023 on nostettu ensimmäiset kuvageneraattoreita koskevat tekijänoikeuskanteet. Yhdysvalloissa kolme taiteilijaa nosti joukkokanteen Stable Diffusionin ja Midjourneyn taustayhtiöitä eli Stability AI:ta ja Midjourneyta sekä oman kuvageneraattorinsa kehittänyttä taidesivusto DeviantArtia vastaan. Stability AI haastettiin oikeuteen myös Iso-Britanniassa, jossa kuvapankkipalvelu Getty Images nosti yhtiötä vastaan kanteen väitetystä tekijänoikeudella suojatun aineiston käyttämisestä ilman lupaa.

Tekoälyn opetusdataa koskeva oikeustila on Suomessa tällä hetkellä epäselvä

Loukkaavatko kuvia generoivat tekoälyohjelmat siis tekijänoikeutta? Tekoälytaidetta koskevassa tekijänoikeudellisessa keskustelussa on huomioitava eri valtioiden tekijänoikeuslainsäädännön kansalliset erityispiirteet. Esimerkiksi Yhdysvaltojen tekijänoikeuden keskiössä on usein fair use -periaatteen tulkinta. Fair use -periaatteen nojalla on mahdollista käyttää tekijänoikeuden muuten suojaamaa materiaalia tietyissä tilanteissa, ja yhdysvaltalaiset tekoälykehittäjät voivat vedota kyseiseen periaatteeseen käyttäessään suojattua aineistoa.

Vastaavaa yleisluontoista kohtuullisen käytön periaatetta ei tunneta mannereurooppalaisessa tekijänoikeusperinteessä, vaan suomalaisessa tekijänoikeuslaissa säädetään erillisistä ja tarkkarajaisemmista tekijän yksinoikeuteen kohdistuvista rajoituksista.

Suomalaisesta näkökulmasta olennaista on ensinnäkin se, onko tekoälyn opetusvaiheessa kyse sellaisesta toiminnasta, joka loukkaa tekijänoikeuslain 2 §:n nojalla tekijän yksinoikeutta määrätä teoksensa käytöstä. Tekijälle kuuluviin taloudellisiin oikeuksiin sisältyy esimerkiksi teoskappaleiden valmistaminen eli teoksen kopiointi. Toisaalta on myös arvioitava, sisältääkö tekijänoikeuslaki sellaisen tekijänoikeuden rajoituksen, jonka nojalla toiminta olisi sallittua.

Tekoälyohjelmien toiminta ja kehittäminen perustuu tavallisesti koneoppimiseen ja tiedonlouhintaan. Tiedonlouhinta tarkoittaa tiedon, kuten tekstin, kuvien tai datan automaattista laskennallista analyysiä, jonka avulla suurista tietomääristä voidaan löytää oleellisia tietoja ja tehdä uudenlaisia havaintoja. Opetusdatan analysointi ja sen pohjalta uusien kuvien tuottaminen koneoppimisen ja tiedonlouhinnan avulla voi edellyttää, että tekoälyn opettamista varten luotuun tietokantaan on valmistettu kopioita teoksista. Tällöin toiminnassa on tekijänoikeuden loukkauksen riski.

Yksittäiset tekoälyohjelmat on tosin kehitetty eri tavoin ja ne hyödyntävät erilaisia algoritmeja, eikä koneoppiminen tai tiedonlouhinta vaadi aina teosten kopiointia. Tekijänoikeuden loukkauksen mahdollisuutta tuleekin arvioida tapauskohtaisesti tekoälyohjelman tarkemman toiminnan ja teknisten erityispiirteiden perusteella.

Jos teoksista valmistetaan tekoälyn opetusvaiheessa vain väliaikaisia kappaleita, on mahdollista, että tilanteeseen voidaan soveltaa tekijänoikeuslain 11 a §:n rajoitussäännöstä. Rajoituksen soveltamisedellytykset ovat varsin tarkat. Säännöksen nojalla tilapäinen kappaleen valmistaminen on sallittua ilman tekijän lupaa silloin, kun se on väliaikaista ja satunnaista sekä erottamaton ja välttämätön osa teknistä prosessia, eikä valmistamisella ole itsenäistä taloudellista merkitystä. Lisäksi edellytyksenä on, että kappaleiden valmistamisen ainoa tarkoitus on mahdollistaa välittäjän tekemä teoksen siirto kolmansien osapuolten välillä tai teoksen laillinen käyttö.

Joka tapauksessa voidaan todeta, että tällä hetkellä voimassa olevassa tekijänoikeuslaissa ei ole sellaista tekijänoikeuden rajoitusta, joka selvästi sallisi teosten kopioinnin tekoälyn opettamista varten ja jonka nojalla tekijänoikeudella suojattua aineistoa voisi varmasti käyttää tekoälyn opetusdatana ilman tekijänoikeuden loukkauksen mahdollisuutta.

DSM-direktiivi lähtökohtaisesti sallii tiedonlouhinnan

Suomessa on huomioitava kansallisen tekijänoikeuden lisäksi EU-tason harmonisoiva sääntely. Vuonna 2019 voimaan tulleen tekijänoikeudesta ja lähioikeuksista digitaalisilla sisämarkkinoilla annetun direktiivin (EU) 2019/790 eli ns. DSM-direktiivin on katsottu jossain määrin selkeyttävän tekoälyn opettamiseen liittyvää oikeustilaa Euroopan unionin alueella ainakin tiedonlouhinnan osalta.

DSM-direktiivin 3 ja 4 artiklat koskevat tekstin- ja tiedonlouhintaa. Direktiivin 3 artiklassa velvoitetaan jäsenvaltiot säätämään tekijänoikeuden poikkeuksesta tai rajoituksesta tieteellisessä tutkimuksessa. Kyseisen artiklan mukaan kappaleen valmistaminen ja kopiointi on tutkimusorganisaatioille ja kulttuuriperintölaitoksille sallittua silloin, kun tekstin- ja tiedonlouhinta tapahtuu tieteellistä tutkimusta varten ja toimijoilla on suojattuun aineistoon laillinen pääsy.

DSM-direktiivin 4 artikla liittyy muihin tilanteisiin eli esimerkiksi kaupalliseen tarkoitukseen tapahtuvaa tiedonlouhintaan. Direktiivin 4 artiklan nojalla kappaleen valmistaminen ja kopiointi tekstin- ja tiedonlouhintaa varten on sallittua, kun kyse on teoksista ja muusta suojatusta aineistosta, joihin on laillinen pääsy. Edellytyksenä poikkeuksen tai rajoituksen soveltamiselle on se, että oikeudenhaltija ei ole nimenomaisesti pidättänyt oikeuksiaan suojatun aineistoon käyttöön asianmukaisella tavalla.

Direktiivin johdanto-osan 18 kappaleessa tarkennetaan sitä, millä tavoin oikeudenhaltija voi pidättää oikeutensa: ”Kun sisältö on saatettu yleisön saataviin verkossa, asianmukaiseksi olisi katsottava kyseisten oikeuksien pidättäminen ainoastaan koneluettavilla keinoilla, mukaan lukien metatiedot ja verkkosivuston tai palvelun ehdot.”

Kotimaisen tekijänoikeuslain uudistus DSM-direktiivin toimeenpanon takia on toistaiseksi kesken, joten tiedonlouhintaa koskeva rajoitus ei ole Suomessa vielä voimassa. Täydentävässä hallituksen esityksessä HE 313/2022 ehdotetaan säädettäväksi tekijänoikeuslakiin uusi rajoitussäännös 13 b §, jolla on tarkoitus implementoida DSM-direktiivin 3 ja 4 artiklat. Pykäläehdotuksen 1 momentin mukaan se, jolla on laillinen pääsy teokseen, saa valmistaa siitä kappaleita käytettäväksi tekstin- ja tiedonlouhintaa varten ja säilyttää kappaleita yksinomaan kyseistä tarkoitusta varten, jollei tekijä ole nimenomaisesti ja asianmukaisella tavalla pidättänyt tätä oikeutta.

DSM-direktiivin myötä tekijänoikeuslakiin sisällytettävää tiedonlouhintaa koskevaa rajoitusta voidaan sinänsä pitää tekoälykehittäjien kannalta myönteisenä, sillä tiedonlouhinta on jatkossa lähtökohtaisesti sallittua, kunhan louhinnan kohteena oleva aineisto on laillisesti saatavissa. Oikeudenhaltijoiden kannalta taas helpotusta tuo se, että tiedonlouhinnan voi halutessaan kieltää, jos kyse on tiedonlouhinnasta kaupallisiin tarkoituksiin.

Direktiivissä omaksuttuja ratkaisuja on myös kritisoitu. Oikeuskirjallisuudessa esimerkiksi Eleonora Rosati on esittänyt, että teoksen tekijän mahdollisuus pidättää oikeutensa suojattuun aineistoon voi hidastaa ja vaikeuttaa tekoälyteknologian kehitystä EU:ssa (Rosati 2020, s. 23). Kysymyksessä on nähtävissä teosten käyttäjien ja oikeudenhaltijoiden oikeuksien välisen tasapainon haasteellisuus.

Lopuksi: Tekoälytaiteen tulevaisuus

DSM-direktiivi tuo jonkinlaista selvyyttä tiedonlouhinnan pelisääntöihin Euroopan unionin alueella. Kiinnostavaa tulee olemaan se, millä tavoin eri jäsenvaltiot saattavat tiedonlouhintaa koskevat rajoitukset osaksi kansallisia tekijänoikeusjärjestelmiään ja miten tiedonlouhintaa koskevien oikeuksien pidättäminen tulee tosiasiassa toteutumaan.

Esimerkiksi joillakin kansainvälisillä taiteilijoiden käyttämillä portfolioalustoilla on jo hiljattain otettu käyttöön metadatatunniste ”NoAI”, jonka taiteilijat voivat lisätä alustoilla julkaisemiensa teosten metatietoihin. Oikeudenhaltijoiden voi kuitenkin olla käytännössä vaikea valvoa koneluettavan kiellon noudattamista, ja vastuu sen noudattamisesta jää tekoälykehittäjille. Tulevaisuudessa tullaankin mahdollisesti näkemään tehokkaampia teknisiä ratkaisuja, joilla oikeudenhaltijat voivat estää teosten keräämisen tekoälyn opettamiseen.

DSM-direktiivi jättää useita tekoälysovelluksiin liittyviä tekijänoikeudellisia kysymyksiä vielä avoimeksi. Lisäksi mahdolliset aiemmin tapahtuneet tekijänoikeuden loukkaukset ovat toistaiseksi ratkaisematon kysymys. Tiedonlouhinnan kieltäminen esimerkiksi metatietojen avulla ei välttämättä enää vaikuta jo opetettuihin tekoälyohjelmiin. Suurilla toimijoilla kuten kuvapankeilla voi olla resursseja puuttua oikeudenloukkauksiin, mutta yksittäiselle taiteilijalle omien tekijänoikeuksien valvonta ja puolustaminen on haastavaa.

Maailmalla monet toimijat ovat tunnistaneet vähintään eettisen ongelman siinä, että tekoälyn opettamiseen on kerätty aineistoa verkosta ilman tekijöiden lupaa, ja ongelmaan on yritetty kehittää erilaisia ratkaisuehdotuksia. Yksi mahdollisuus on lisensoida opetusdata eli hankkia tarvittavat luvat aineiston käyttöön ja maksaa teosten käytöstä tekijöille korvaus. Tarvittavan opetusdatan valtavan määrän vuoksi tekoälykehittäjät eivät kuitenkaan ole pitäneet lisensointia realistisena vaihtoehtona, sillä käytännössä olisi vaikeaa paitsi identifioida jokainen oikeudenomistaja, myös sopia teosten lisensoinnista erikseen äärimmillään jopa miljoonien oikeudenomistajien kanssa.

Toisaalta suuryritysten kohdalla lisensointi on hyvinkin mahdollista, ja muun muassa tekoäly-yhtiö OpenAI on tehnyt yhteistyötä kuvapankkipalvelu Shutterstockin kanssa. Täysin lisensoituja tietokantoja on lisäksi jo olemassa: esimerkiksi The Stack on varta vasten tekoälyn opettamiseen tarkoitettu tietokanta, jonka sisältämä aineisto on lisensoitu asianmukaisesti. Sinänsä olisi myös mahdollista luoda tietokantoja, jotka koostuisivat pelkästään tekoälyn opettamista varten tehdystä aineistosta, jolloin tekijänoikeuksiin liittyviä ongelmia ei olisi käsillä.

Tekoälytaide jakaa mielipiteitä, ja osa taiteilijoista on kokenut tekoälyn uhkana ammatilleen. Tekoälyohjelmat ovat kuitenkin jo alkaneet vakiintua yhtenä taiteilijan työvälineistä, ja tekoälyohjelmilla nähdään potentiaalia sekä taiteellisten prosessien kehittäjinä että uudenlaisen taiteen mahdollistajina. Keskustelu niin tekoälyn vaikutuksista kuvitukseen ja kuvataiteeseen kuin tekoälytaiteeseen liittyvistä tekijänoikeudellisista kysymyksistä on vasta alussa ja tulee varmasti jatkumaan vilkkaana.

Kuva: iStock/Vadim Sazhniev

Aiheet: Tekijänoikeus

Kirjoittajat

Share: