KB:s utveckling av språkmodeller

KB utvecklar språkmodeller som tränas på bibliotekets samlingar. Syftet är att bidra till den svenska forskningens kvalitet och det demokratiska samhällets utveckling. Här finns information om de lagar som reglerar arbetet.

Så här beskrivs KB:s uppdrag i 1 § Förordning (2008:1421) med instruktion för Kungl. biblioteket: Länk till annan webbplats.

Kungl. biblioteket är Sveriges nationalbibliotek och en nationell forskningsinfrastruktur. Myndigheten ska samla in, beskriva, bevara och tillhandahålla fysiskt och digitalt material som behövs för att fullgöra denna uppgift. Myndigheten ska genom verksamheten bidra till den svenska forskningens kvalitet och det demokratiska samhällets utveckling.

Främjande av svensk forskning

  • Utvecklingen av språkmodeller är ett led i myndighetens uppdrag som nationell forskningsinfrastruktur. Arbetet sker idag inom ramen för forskningsprojekt, antingen interna på KB eller i samarbete med externa forskare.
  • KB samarbetar endast i projekt med slutmålet att främja svensk forskning, som därmed både bidrar till svensk forsknings kvalitet och det demokratiska samhällets utveckling.
  • Resultaten från forskningsprojekten, det vill säga de färdiga språkmodellerna, publiceras öppet i enlighet med principerna för öppen vetenskap.
  • Det ligger i forskningsresultats natur att de senare kan vidareutvecklas av andra aktörer och skapa ytterligare mervärden i samhället.

Legala förutsättningar

För att träna och utveckla AI-modeller krävs stora mängder data. I egenskap av nationalbibliotek har KB denna tillgång, bland annat genom så kallade pliktleveranser av digitalt material. Även verk som har inkommit till KB i fysisk form kan digitiseras och bli en del av KB:s digitala samlingar.

De flesta av dessa verk omfattas av upphovsrätt. KB tillämpar i alla avseenden upphovsrättsreglerna. Det är centralt i legitimiteten och förtroendet vad gäller den myndighetsutövning som KB:s insamling innebär.

KB:s färdiga språkmodeller genererar inte upphovsrättsligt skyddade verk. Därför kan de i dagsläget inte heller medverka till upphovsrättsintrång vid användning.

Inskränkningar för text- och datautvinning

När KB utvecklar språkmodeller behöver myndigheten framställa en kopia av de verk som används, för att kunna utföra text- och datautvinning (text and data mining, TDM) på exemplar av datat.

Om verken omfattas av upphovsrätt får som huvudregel ingen annan än rättighetshavaren framställa exemplar. Sedan 2023 har dock ett EU-direktiv (det så kallade DSM-direktivet) implementerats i lag (1960:729) om upphovsrätt till litterära och konstnärliga verk (upphovsrättslagen).

DSM-direktivet medförde två inskränkningar för TDM i upphovsrättslagen.

  • De innebär att man utan samtycke från upphovsmannen får framställa exemplar av verk för att genomföra TDM, se 15 a och 15 b §§ upphovsrättslagen.
  • KB tillämpar i dag inskränkningen i 15 b § upphovsrättslagen vid utvecklingen av språkmodeller för AI. Paragrafen innebär en inskränkning i upphovsmannens ensamrätt till verk i samband med framställning av exemplar som sker vid TDM för forskningsändamål.
  • När 15 b § i upphovsrättslagen tillämpas utgår ingen ersättning till upphovsmannen. Denne kan inte heller lämna förbehåll om att ett verk inte får användas för TDM enligt paragrafen.

Det är endast de aktörer som omfattas av inskränkningen i 15 b § som kan använda den, bland annat forsknings­organisationer och allmänna bibliotek. Dessa måste också ha lovlig tillgång till de verk som används.