Slutredovisning om språkmodeller i offentlig sektor

Offentlig sektor kan vinna mycket på en utökad användning av anpassade svenska språkmodeller. Det menar KB i slutredovisningen av sitt regeringsuppdrag – och föreslår bland annat mer transparens och en satsning på digitisering. KB har även tagit in externa rättsliga utlåtanden rörande arbetet med AI-utveckling.

Två skärmar bredvid varandra, en med kod och en med en tidning.

Foto: David Frederiksen, Kungliga biblioteket

KB har som Sveriges nationalbibliotek och nationell forskningsinfrastruktur en unik möjlighet att bidra till utvecklingen av svenska språkmodeller. Myndighetens uppdrag är att bidra till den svenska forskningens kvalitet och det demokratiska samhällets utveckling.

KB samlar in, bevarar och tillhandahåller Sveriges publicerade kulturarv. Det innebär att KB bevarar en rik variation av material på svenska, som i nära samverkan med forskarsamhället kan användas för att träna modeller för forskning. En förutsättning för utvecklingen är att kulturarvet finns digitalt – både att det samlas in i digital form och att det fysiska materialet digitiseras.

Stora vinster för offentlig sektor

Under hösten 2025 fick KB i regeringsuppdrag att analysera och förbereda för en bredare användning av KB:s språkmodeller i offentlig sektor. I sin slutredovisning har myndigheten därför belyst hur verksamheten kan bidra till att möta dessa behov.

Utredningen visar att behovet av anpassade svenska språkmodeller är stort inom offentlig sektor. Modellerna kan effektivisera arbetsprocesser, förbättra informationssökning och stärka analysförmågan. För att behoven ska uppfyllas krävs långsiktighet, transparens och samverkan.

KB:s slutredovisning utgör ett underlag för fortsatt dialog om hur Sverige kan stärka sin förmåga inom språkteknologi och AI.

KB:s bedömningar och förslag i korthet

  • Svenska offentligt finansierade språkmodeller bör vara öppna och väldokumenterade.
    Träningsdata kan i många fall inte delas direkt mellan olika aktörer av till exempel upphovsrättsliga skäl. För ett mindre språkområde som Sverige är det därför särskilt betydelsefullt med öppna modeller med så kallade öppna vikter.
  • Genomför en nationell satsning på digitisering av samlingar med särskild relevans för utveckling av språkmodeller.
    KB:s samlingar, e-pliktsmaterial och språkteknologiska verksamhet är en strategisk resurs för både forskning och offentlig sektor. Samtidigt behöver pliktlagstiftningen moderniseras för att göra det möjligt att framöver träna språkmodeller på ett material som speglar dagens samhälle.
  • Etablera en säker nationell beräkningsmiljö inom offentlig sektor, som tar hänsyn till särskilda behov när det gäller nationell säkerhet och beredskap vid gemensam utveckling av språkmodeller.
    KB:s roll är rådgivande under uppbyggnaden och myndigheten använder också miljön vid samarbeten. Förslaget är även att KB får utökat anslag för att vid sådana samarbeten hantera datamängder med viss nivå av skydd från andra myndigheter.
  • KB kan via uppdragsforskning från andra myndigheter bidra med anpassade svenska språkmodeller till Försäkringskassans och Skatteverkets AI-verkstad, eller direkt till specifika myndigheter.
    KB kan också bidra med metod- och kompetensstöd till myndigheter som använder KB:s språkmodeller.

Rättsliga aspekter

Vid utveckling av språkmodeller för forskning tillämpar KB 15 b § lagen (1960:729) om upphovsrätt till litterära och konstnärliga verk. Det är en inskränkning i upphovsrättslagen, som gäller för bland andra forskningsorganisationer och bibliotek som är tillgängliga för allmänheten. De aktörer som omfattas av bestämmelsen kan göra kopior av verk som de har lovlig tillgång till för att utföra text- och datautvinning (TDM), så länge det sker för forskningsändamål.

I arbetet med slutredovisningen har KB tagit in utlåtanden från externa jurister med expertis inom upphovsrätt och EU-rätt. De ger stöd för KB:s legala bedömning, oavsett vilken språkmodell som forskningen berör.

Bland annat framför professor emeritus Jan Rosén, på frågan om han delar den rättsliga bedömning som KB redogjort för i delredovisningen, att:

– Sammanfattningsvis är KB under alla omständigheter att anse som ett offentligt tillgängligt bibliotek eller en institution för film- eller ljudarvet eller annan kulturarvsinstitution eller arkiv i den mening som avses i 15 b § URL och artikel 2.3 i DSM-direktivet. KB är därmed berättigat att utföra text- och datautvinning för forskningsändamål på sådant material som KB har lovlig tillgång till. Åtminstone de språkmodeller som KB hittills tagit fram med TDM-teknik framstår som väl placerade inom bestämmelsens tillämpningsområde. Det kan tilläggas att denna rätt som KB utrustats med är, enligt 15 b § tredje stycket URL, tvingande varför avtalsvillkor som inskränker KB:s rätt till text- och datautvinning saknar verkan.

Ekonomiska aspekter

För att möta behoven hos offentlig sektor skulle det vara nödvändigt att successivt skala upp KB:s AI-verksamhet. Redan i dag krävs resurser för beräkning, lagringskapacitet, digitisering av de fysiska samlingarna och specialistkompetens.

Arbetet är förenat med ökade kostnader, men innebär också en möjlighet till effektivisering i offentlig sektor. Från ett samhällsekonomiskt perspektiv kan språkmodeller göra särskild nytta i kunskapsintensiva verksamheter som hanterar omfattande textmängder.

Läs hela slutredovisningen