AI och träningsdata

Vill du ladda ner artikeln? Klicka här AI och träningsdata – Magnusson 2023 .

AI OCH HANTERING AV TRÄNINGSDATA

För att kunna utveckla tillförlitliga AI-system krävs en stor mängd högkvalitativa data. Det finns även en mängd olika regler som utvecklare av AI-system måste ta hänsyn till.
Den 9 december presenterade EU en politisk överenskommelse om AI-förordningen. I väntan på att AI-förordningen ska träda i kraft har flera nya regelverk, särskilt avseende data, redan implementerats inom EU. Syftet är att möjliggöra delning samt främja åtkomst till data i linje med EU:s datastrategi. Parallellt pågår dock rättsprocesser i Europa och USA avseende det immateriella skyddet av material som används som träningsdata.
I den här artikeln presenteras olika aspekter avseende AI och träningsdata, bland annat det immaterialrättsliga skyddet, kvalitetskrav enligt AI-förordningen samt tillgång till data enligt EU:s nya regelverk.

IMMATERIALRÄTTSLIGT SKYDDAT MATERIAL SOM TRÄNINGSDATA?

En aspekt som blivit särskild uppmärksammad i samband med AI är användningen av immaterialrättsligt skyddat material som träningsdata. Frågan är särskilt relevant avseende generativ AI som tränats på befintliga verk.

Utgångspunkten i den immaterialrättsliga lagstiftningen är att användning av skyddade verk utan tillstånd utgör immaterialrättsintrång. Detsamma gäller AI-genererat material som har framträdande likheter med ett immaterialrättsligt skyddat verk. Det är inte bara fotografier och texter som är immaterialrättsligt skyddade utan det kan även vara datorprogram, ritningar m.m. Till och med sammanställningar av data kan vara immaterialrättsligt skyddade som databaser.

Rättsprocesser pågår redan i USA och Europa. I USA har flertalet författare nyligen gått samman och lämnat in en gemensam stämningsansökan mot OpenAI, företaget bakom ChatGPT. I stämningsansökan anklagas företaget för att ha begått intrång i immateriella rättigheter genom att låta chattverktyget träna på immaterialrättsligt skyddat material, utan tillåtelse från rättighetsinnehavarna. Frågan vad som gäller vid användning av immaterialrättsligt skyddat material för att träna algoritmer, särskilt generativ AI, är lika aktuell i EU. I Tyskland har organisationen LAION (Large-scale Artificial Intelligence Open Network), som tillhandahåller data, kod och maskininlärningsmodeller i syfte att utveckla storskaliga maskininlärningssystem, blivit stämda av en fotograf för att ha använt upphovsrättsskyddade fotografier i datasamlingen. Varken det amerikanska eller tyska fallet har avgjorts, men utfallen kommer med stor sannolikhet att påverka vilken data som i fortsättningen kan användas av företag inom hela EU för att utveckla och träna AI-system.

AI-förordningen som kommer att gälla inom EU innehåller transparenskrav avseende generativ AI. Kravet innebär bland annat att allt upphovsrättsligt skyddat material som används för att träna AI-system måste sammanfattas och offentliggöras. Dessutom måste AI-systemen vara utformade på ett säkert sätt för att förhindra att de genererar olagligt innehåll, vilket bland annat inkluderar material som gör immaterialrättsligt intrång.

KVALITETSKRAV PÅ DATA ENLIGT AI-FÖRORDNINGEN

I AI-förordningen uppställs krav på den data som används för att träna högrisksystem inom EU. Enligt det nya regelverket ska all dataförvaltning och datahantering ske i enlighet med ändamålsenliga metoder. Det innebär att data ska hanteras i enlighet med det avsedda ändamålet med AI-systemet samt med beaktande av systemets funktioner, särdrag eller element som är specifika för den särskilda geografiska, beteendemässiga eller funktionsmässiga situation eller kontext där AI-systemet används. Därutöver ska alla data som används för att träna, validera, eller testa AI-system vara relevanta för ändamålet, representera verkligheten, vara fria från fel och fullständiga. Syftet med de högt ställda kraven på data i AI-förordningen är att säkerställa att AI-system tränas och utformas på ett säkert sätt och att minimera risken för att algoritmerna påverkas av diskriminerande eller annan snedvridna data.

För att efterleva förordningens datakrav krävs att företag bland annat undersöker och identifierar eventuella brister med data, vidtar relevanta åtgärder för att förhindra brister samt genomför en förhandsbedömning av tillgängligheten, mängden och lämpligheten avseende träningsdata som behövs för att på ett säkert sätt utforma AI-systemet.

Om träningsdata innehåller personuppgifter? I många fall innehåller träningsdata även personuppgifter. Detta innebär att reglerna i GDPR aktualiseras. Utöver AI-förordningens regler avseende data samt det immaterialrättsliga regelverket måste företag således även ta hänsyn till personuppgiftsbehandlingskraven i GDPR.

TILLGÅNG TILL DATA

För att uppnå högkvalitativa träningsdata i enlighet med EU:s nya regelverk krävs det tillgång till säkra och tillförlitliga data. Ett av målen med EU:s datastrategi är att främja datadelning mellan olika aktörer och skapa ett gemensamt europeiskt datautrymme. Till följd av detta finns inom EU flera stora lagstiftningsinitiativ avseende data.

Förordningen om det fria flödet av andra data än personuppgifter (The Regulation on the free flow of non-personal data)

Förordningen om det fria flödet av andra data än personuppgifter (The Regulation on the free flow of non-personal data) var ett av de första lagstiftningsalternativen gällande data i EU. Enligt förordningen kan alla data – förutom personuppgifter – lagras, behandlas och överföras var som helst inom EU. Förordningen är således grunden till datadelning mellan olika aktörer.

Direktivet om öppna data (Open Data Directive) och Dataförvaltningsförordningen (Data Governance Act)

Direktivet om öppna data (Open Data Directive) reglerar när offentliga myndigheter ska behandla begäran om vidareutnyttjande av data. Direktivet har införlivats i svensk rätt genom lagen (2022:818) om den offentliga sektorns tillgängliggörande av data. Regelverket tar sikte på den offentliga sektorns tillgängliggörande av data för vidareutnyttjande och ska bland annat tillämpas när någon har rätt att få tillgång till data enligt annan lag eller förordning.

Dataförvaltningsakten (Data Governance Act) kompletterar direktivet om öppna data. Dataförvaltningsakten trädde i kraft i juni 2022 och började tillämpas i september 2023. Syftet med lagstiftningen är att underlätta frivillig delning av data mellan offentliga myndigheter och företag. Datadelningen avser vidareutnyttjande av både personuppgifter och annan data, i forskningsändamål eller i skapandet av nya innovativa tjänster och produkter, till exempel AI-system.

Utgångspunkten är att exklusiva avtal om datadelning är förbjudet, men undantag kan göras för en tidsbegränsad period om det anses motiverat och nödvändigt för tillhandahållandet av en tjänst eller produkt av allmänt intresse.

I och med dataförvaltningsakten underlättas således tillgången till säkra och kvalitativa träningsdata. Företag kan dock behöva vidta vissa skyddsåtgärder för att säkerställa att data upprätthåller samma skydd och används i en säker behandlingsmiljö, till exempel genom anonymisering och pseudonymisering av personuppgifter.

Dataakten (Data Act)

Som ytterligare en komplettering till direktivet om öppna data och dataförvaltningsakten har EU antagit den så kallade dataakten (Data Act). Syftet med dataakten är att möjliggöra delning av data som genereras av uppkopplade produkter (Internet of Things) samt främja åtkomst till och användningen av data.

Enligt dataakten kan en användare till en produkt som genererar data genom användning, begära att data görs tillgängliga för en tredje part. Med andra ord kommer företag bli tvungna att dela data med andra företag, på begäran av produktanvändare. Därutöver har företag en skyldighet att göra data tillgängliga för en offentlig myndighet om det föreligger exceptionellt behov, till exempel för att hantera ett allmänt nödläge eller utföra en specifik uppgift av allmänt intresse. I praktiken innebär dataakten att AI-system som är uppkopplade ska vara utformade så att data kan göras tillgänglig. Små företag och mikroföretag är dock undantagna reglerna i dataakten.

VILL DU VETA MER?

Är du intresserad av att veta mer om vad som gäller vid användandet av data för att träna, validera och testa AI- system, eller har andra frågor gällande AI? Välkommen att kontakta Helena Rönqvist och Vilma Slättegård på Magnusson. Vi hjälper dig att navigera inom AI-juridiken och kan erbjuda rådgivning i frågor relaterade till AI inom flera rättsområden.

Contact me and learn more