fullskärmsbild

Pågåen­de forsk­nings­­pro­jekt

Här finns mer information om de forskningsprojekt som just nu pågår i samarbete med KB.

Deltagande i det visuella kulturarvet. Metadata, återanvändning och tvärvetenskap


Period:
2019–2022
Summa: 8,3 Mkr
Utlysning: Vetenskapsrådet, Projektbidrag för digitalisering och tillgängliggörande av kulturarvssamlingar
Lärosäte: Stockholms universitet/Kungliga Tekniska högskolan
Projektansvarig: Professor Anna Dahlgren

Detta fyraåriga forskningsprojekt adresserar tre sammankopplade problem: avsaknad av metadata i bildsamlingar, att forskares arbete i bildsamlingar inte återanvänds, samt bristen på disciplin- och institutionsöverskridande samarbeten när det gäller bildsamlingar och digitala gränssnitt.

Projektet utförs av Anna Dahlgren forskare i konstvetenskap specialiserad på fotografisk bild och arkiv och Karin Hansson, docent i data- och systemvetenskap specialiserad på crowdsourcing och e-deltagande samt en doktorand i digital humanvetenskap och i dialog med bildarkivexperter från bland annat Kungliga biblioteket, Stockholms stadsarkiv och Umeå universitetsbibliotek. Genom denna samlade expertis söker vi överbrygga olika forskningsområden och samtidigt studera kulturella, sociala och tekniska dimensioner av metadataproduktion för bildsamlingar. Därtill bidrar projektet till erfarenhetsutbyte och samarbete mellan forskare och aktörer inom kulturarvssektorn som är experter på bildsamlingar och digitala gränssnitt. Till sist syftar projektet till att utveckla metoder och modeller för metadatainsamling till nytta både för det humanvetenskapliga forskningsområdet och för de kulturarvsinstitutioner som vårdar och bevarar det visuella kulturarvet.

Det övergripande syftet med detta projekt är att stärka tvärvetenskaplig forskningspraxis och utveckla produktionen av metadata i vårt visuella arv. Projektet kommer dels att undersöka och utveckla metoder för att erhålla kvalificerade och omfattande metadata för bilder i digitaliserade kulturarvsamlingar. Dels kommer deltagandemetoder för öppen och länkad metadataproduktion utvecklas i en tvärvetenskaplig forskargrupp. Vidare söker projektet utgå från metoder som används i crowdsourcing och anpassa dessa till humanvetenskapliga forskningssammanhang. Tanken är att öppna och deltagande metadata är ett sätt att skapa en digital infrastruktur mellan forskare och mellan forskare och kulturarvsinstitutionernas samlingar.

För löpande och aktuell information om forskningsprojektet, se metadataculture.selänk till annan webbplats.

EODOPEN - eBooks-On-Demand-Network Opening Publications for European Netizens


Period:
2019–2023
Summa: EUR 4M
Utlysning:
EACEA 34/2018
Lärosäte: Innsbrucks universitet
Projektansvarig KB:s del: Fil.dr. Christopher Natzén

Libraries all over Europe face the difficulty of managing tremendous amounts of 20th and 21st century textual materials which have not yet been digitised because of the complex copyright situation. These works cannot be accessed by the general public and are slumbering deep in library stacks, as they are often out-of-print or have never even been in-print at all and reprints or facsimiles are out of sight.

The EODOPEN project, as proposed by 15 libraries from 11 European countries, focuses on bringing these digitally-hidden works to the public forefront by digitising and making them available on a pan-European level whilst fully respecting current copyright regimes.

To achieve this aim, the project will - by focusing on the “demand side” rather than merely on the “supply side” - directly engage with national, regional, and local communities in the selection of material as well as the digitisation and dissemination process, finally enhancing intercultural dialogue with the help of the digitized objects. In addition, alternative delivery formats, in particular for mobile devices, as well as for blind or visually impaired users, will allow reaching a broader audience for digitised content.

Furthermore, hands-on-workshops, guidelines and special tools made available to all European libraries shall build confidence amongst library staff in dealing adequately with rights clearance, and therefore contribute to the objective of reinforcing the ability of library staff to operate transnationally.

Finally, the digitised items will be made available to the broad European public on the project participants’ well established digital libraries as well as a common portal developed during the project lifetime, ensuring transnational circulation and access to cultural works in the aftermath of the project. Creativity across Europe will be sparked as new readers and content creators discover works previously unavailable to them.

Expansion och mångfald: Digital kartläggning och analys av den utominstitutionella scenkonsten i Göteborg 1965–2000


Period:
2019–2021
Summa: 13 Mkr
Utlysning:
Vetenskapsrådet, Projektbidrag för digitalisering och tillgängliggörande av kulturarvssamlingar
Lärosäte: Göteborgs universitet
Projektansvarig: Docent Astrid von Rosen

I svenska teaterhistorien ses perioden 1965–2000 som en tid för framväxt och etablering av en utominstitutionell scenkonst. Fältet expanderande kraftigt när institutionsteatrarna utmanades av ”fria” grupper och en ny mycket varierad scenkonstkultur växte fram. Denna nya scenkonst ifrågasatte hierarkier, sökte sig ut från de traditionella scenerna, överskred genregränser, experimenterade konstnärligt och mötte en ny publik. En mångfald angelägna föreställningar för barn, migranter, arbetare, queera personer, studenter och många andra skapades av människor med olika kulturella bakgrunder och kompetenser.

Historieskrivningen har observerat detta skifte, men endast lyft fram några få grupper, verk och välkända artister. Därmed har en endimensionell bild fått fäste i historieskrivningen, men nu har det blivit dags att utmana tidigare forskning genom att se perioden på ett nytt sätt och bejaka dess mångfald. Det är dags att inkludera de många olika uttrycken och grupperna i en historieskrivning som gör det fria kulturarvet rättvisa. Forskningsprojektet ”Expansion och mångfald” vill använda digitalt material och metoder för att analysera, lyfta fram och tillgängliggöra frikulturen som ett värdefullt kulturarv som angår och engagerar många olika människor. Den viktiga mångfalden av uttryck, grupper, relationer och spelplatser i det expanderade fältet har visat sig vara svår för att hantera för traditionell historieskrivning. Den har genom sin linjära karaktär inte kunnat ge plats för exempelvis karnevalers mångfacetterade uttryck, migranters kulturföreningar, jazzdans som folkrörelse och konstnärlig katalysator, fysisk teater, spex och populärkulturella uttryck, danskonst i offentliga rum, och scenkonst för barn.

Med mångfald och skillnader som utmaning för forskningen krävs att arkivmaterial från det expanderade fältet undersöks och görs tillgängligt på nya sätt och att tidigare oanvänt källmaterial görs åtkomligt och tas i anspråk. En grupp bestående av humanistiska och urban-sociologiska forskare med stor erfarenhet av scenkonstforskning och stadsanalyser kommer att tillsammans med experter från digital humaniora undersöka och tillgängliggöra den frikulturella mångfalden. Gruppen, som leds av docent Astrid von Rosen i samarbete med Cecilia Lindhé, föreståndare för Centrum för digital humaniora vid Göteborgs universitet, undersöker på vilka sätt en ny, inkluderande och tillgänglig scenkonsthistoria kan skapas genom att kombinera historiografiska och urbana analyser med digitala material, metoder och presentationsformer. Projektet kommer att generera nya forskningsfrågor, digitala metoder och modeller för tillgängliggörande av ett kulturarv som angår många olika grupper och individer.

KB:s bidrag till projektet är digitalisering av Göteborgsposten, Göteborgstidningen, Göteborgs handels- och sjöfartstidning, samt Arbetet väst för utgivningsperioden 1965–2000.

Filmpubliken i Sverige: En studie om biografens storhetstid och tillbakagång


Period:
2019–2021
Summa: 3,8 Mkr
Utlysning: Vetenskapsrådet, Projektbidrag inom humaniora och samhällsvetenskap
Lärosäte: Örebro universitet
Projektansvarig: Fil.dr. Åsa Jernudd

Var erfarenheter av film annorlunda under den tid då man gick på bio varje vecka, varje månad, år efter år jämfört med dagens upplevelser av filmfiktion på tv och dator? Betydde film något annat för den tidens publik? Och hur upplevdes den tid då en stor del av publiken på mycket kort tid slutade att rutinmässigt gå på bio?

Forskning har visat att efterkrigstidens ungdomskultur genomsyrades av film. Ungdomarna inte bara gick på bio, de hängde på biografer och närliggande fik eller stråk, pratade film, härmade filmstjärnor, samlade på idolporträtt och biobiljetter. Den tiden tycks inte vara så långt borta, men trots filmkulturens höga närvaro i vardagen finns få spår av den i de arkiv som har till syfte att värna vårt kulturarv. Kunskapen om vår biografhistoria och om upplevelser av att gå på bio är också bristfällig. Följande studie vill skriva fram människors upplevelser av att gå på bio i Sverige under filmens storhetstid. Videoinspelningar av berättelser om att gå på bio och filmminnen från denna tid ska samlas in. Dessa berättelser utgör navet i detta projekt. Vidare ska kunskap om biografkulturen digitaliseras och tillgängliggöras. Material om film och biografer såsom filmprogram, affischer, bilder, klipp ur veckotidningar, kartor med biografers läge utmärkta liksom länkar till filmer som berör filmkulturen vid denna tid kommer att samlas in på Kungliga bibliotekets webbsida Filmarkivforskning.selänk till annan webbplats.

Studien vill även dokumentera och analysera upplevelser av det kulturella skifte som skedde i övergången till och början av 1960-talet, då biograferna tappade större delen av sin publik. Det är en historisk förändring som brukar förklaras med televisionens ankomst och snabba spridning, men som inte har undersökts från ett etnografiskt perspektiv som tar fasta på att biografkulturen trots allt fortsatte att existera om än i mindre omfattning än tidigare. Studien vill klargöra hur skiftet upplevdes, för att bidra med en mer nyanserad förståelse än den teknologiskt deterministiska.

Det övergripande syftet med projektet är sålunda att utveckla kunskap om hur filmen som biografkultur var närvarande i vardagen för 1950- och 1960-talets publik. Vidare är syftet att fördjupa förståelsen om hur publiken minns film och att gå på bio som en del i vardagen, och att bidra till att detta blir en del av det svenska bevarade kulturarvet i form av insamlat material som tillgängliggörs i öppna arkiv. Bergslagen är utgångspunkt för studien eftersom den erbjuder en biograftät region med komplex biografstruktur och skiftande geografiska och demografiska förutsättningar.

Förutom den etablerade samarbetspartnern KB har projektet en stark internationell förankring och kommer att bedrivas i nära samarbete med andra pågående europeiska forskningsprojekt som handlar om filmutställningar, filmhistoria och filmgående. Projektets forskningsfrågor har därmed redan bevisats vara av hög relevans och aktualitet såväl nationellt som internationellt.

Projektet kommer att bidra till att nyansera den etablerade filmhistorien och problematisera förgivettagna antaganden om biografåskådaren. Projektet ska ge röst åt filmpubliken och nya perspektiv på vår förståelse av hur filmen tas emot i vår kultur, samt hur den fungerar som upplevelse över tid. Genom att skapa digitala arkiv om filmkultur och filmminnen bidrar projektet till bevarandet och tillgängliggörandet av en framträdande del av vårt populära kulturarv som i sin vardaglighet tycks lätt gå förlorad.

Kritikens nya ordning: mixade metoder i studiet av svensk litteraturkritik under ett sekel


Period:
2020–2023
Summa: 6,8 Mkr
Utlysning: Riksbankens Jubileumsfond, Mixade metoder
Lärosäte: Göteborgs universitet
Projektansvarig: Docent Jonas Ingvarsson

I studien Kritikens ordning: Svenska bokrecensioner 1906, 1956, 2006 (2013) undersökte litteraturvetaren LinaSamuelsson bland annat den kritiska textens normerande diskurser – vad konstituerar en recension, vilka nyckelbegrepp genomsyrar den kritiska texten? Arbetet bestod, trots en räcka självvalda begräsningar, av en betydande materialinsamling.

I det av Riksbankens Jubileumsfond finansierade projektet Kritikens nya ordning: mixade metoder i studiet av svensk litteraturkritik under ett sekel ämnar vi nu göra en metodologisk och kunskapsteoretisk undersökning av motsvarande material med hjälp av digitala verktyg. Samuelssons diskursanalys kommer prövas i en språkteknologisk komparation. Med ”motsvarande material” menas dels Samuelssons egna transkriptioner, men framförallt att göra så uttömmande genomsökningar som möjligt av det litteraturkritiska materialet för de valda åren. Detta innebär att målsättningen är att – utöver de transkriptioner Samuelsson gjorde för sitt projekt – samla in så mycket presstext det överhuvudtaget är möjligt för de undersökta åren. I detta arbete kommer projektet utnyttja de textbaser som redan finns på Språkbanken, men också samarbeta löpande med Kungliga Bibliotekets avdelning för dagstidningar. Ett nytt nedslag, i år 2016, kommer också genomföras inom projektets ram.

Den digitala textanalysen opererar med begrepp som big data, text mining och distant reading. Förutom att göra uppmärkning av (vilka texter är litteraturkritik?) och utsökningar i materialet är målsättningen också att utveckla de digitala verktygen till att med hjälp av AI identifiera och bearbeta argumenterande text. Resultaten av de digitala analyserna kommer sedan att analyseras och jämföras med de resultat Samuelsson fick i sin undersökning. Projektet kommer sålunda på detaljnivå kunna jämföra analoga och digitala analyser av samma historiska nedslag. Undersökningen innebär flera metodutvecklande utmaningar för den tekniska språkanalysen, och belyser flera metodologiska metaperspektiv i skärningspunkten mellan traditionell humaniora, språkteknologi och kunskapsteoretiska aspekter av digitaliseringen.

Vi ämnar därutöver utveckla ett interaktivt gränssnitt för att visualisera – och operationalisera – symbiosen mellan digitala och mera traditionella forskningsmetoder, och därmed också konstruera ett kunskapsteoretiskt underlag för att diskutera hur studiet av ”big data” och olika distansläsningspraktiker kan kombineras med mer traditionella praktiker som diskursanalys, presshistoriska arkivstudier och litteratursociologi.

Mining for meaning: Den offentliga migrationsdiskursens dynamik


Period: 2019–2024
Summa: 17,2 Mkr
Utlysning:
Vetenskapsrådet, Bidrag till forskningsmiljö migration och integration
Lärosäte: Linköpings universitet
Projektansvarig: Docent Marc Keuschnigg

En av de viktigaste framtidsfrågorna gäller hur nyanlända invandrare ska kunna integreras för att undvika att etniskt och socioekonomiskt segregerade samhällen permanenteras. Integration handlar inte enbart om institutionella reformer såsom lika lön utan handlar även till betydande del om hur de nyanlända bemöts och beskrivs i olika formella och informella sammanhang. Inom detta projekt analyseras hur diskursen och debatten om migration och integration utvecklats över tid. Våra analyser baserar sig på storskaliga textdatabaser erhållna från artiklar i dagspressen, inlägg på sociala medier, debatter i riksdagen och politiska partiers program. Vi använder avancerade maskininlärningsmetoder för att analysera hur diskursen och uppfattningarna om migrationen förändrats över tid i olika befolkningsgrupper.

Som ett resultat av sociala mediers ökade betydelse har mycket av den politiska debatten flyttats från den rent privata till den offentliga sfären och detta har medfört att vi nu har betydligt mer information om den allmänna opinionen och dess variationer än vad vi tidigare haft. Vi använder dessa opinionsdata som sociala indikatorer på attityder till migration och integration i olika befolkningsgrupper och vi relaterar dessa till hur motsvarande frågor diskuteras i dagspress, riksdagsdebatter och partiprogram. Fram till nyligen kunde forskare endast analysera den här typen av frågeställningar i småskaliga kvalitativa studier eller i traditionella opinionsundersökningar som svårligen kan fånga de processer genom vilka opinioner och språkbruk förändras.

Nu finns emellertid nya verktyg för storskalig textanalys och inom detta projekt används sådana verktyg för att bättre förstå hur diskursen kring migration och integration utvecklats över tid och hur diskurserna inom tre sfärer – på sociala medier, i dagspress och i riksdagen – förhåller sig till varandra. Den forskningsmiljö som byggs upp sammanför experter i maskininlärningsbaserad textanalys med migrations- och segregationsforskare för att dels tackla en av de socialt sett viktigaste samtidsfrågorna, dels för att utveckla och sprida information om nya metoder för storskalig textanalys. Svensk forskning baserad på sådana data och metoder har inte utvecklats i samma takt som i andra ledande forskningsnationer och ambitionen med denna forskningsmiljö är att flytta Sverige till den internationella samhällsvetenskapliga frontlinjen vad gäller storskalig textanalys.

Den forskningsmiljö som ska byggas kommer att fokusera på frågor av betydande samhällsrelevans. Vi kommer exempelvis att kunna belysa i vilken utsträckning frågor gällande migration och integration uppmärksammas i de tre ovan nämnda sociala sfärerna vid olika tidpunkter och hur mediers och politiska partiers språkbruk gällande frågor relaterade till migration och integration förändras över tid. Vi kommer även att studera hur de olika sfärerna påverkar varandra vid olika tidpunkter – om det verkar vara allmänhetens opinion såsom den kommer till uttryck i olika sociala medier som driver fram liknande opinioner och språkbruk bland journalister och politiker eller om orsaksföljden snarare verkar vara den motsatta. Att analysera och bättre förstå hur dessa tre sfärer påverkar varandra är av avgörande betydelse för att förstå de processer genom vilka ett välkomnande och inkluderande samhälle skapas.

Samisk audiovisuell samling – filmer och teveprogram i arkiv och på webb


Period:
2019–2021
Summa: 13,1 Mkr
Utlysning: Vetenskapsrådet, Projektbidrag för digitalisering och tillgängliggörande av kulturarvssamlingar
Lärosäte: Umeå universitet/Stockholms universitet/Kungliga biblioteket
Projektansvarig: Professor Patrik Lantto

Urfolks rättigheter har på en internationell nivå fått ett allt starkare erkännande under de senaste decennierna, inte minst tydligt i FN:s Deklaration om urfolks rättigheter från 2007. En central del av deklarationen handlar om urfolks rätt till sitt eget kulturarv och sina traditioner; en rätt att bevara, skydda och utveckla detta arv i det förgångna, i nuet och för framtiden. Sverige har idag erkänt samer som ett urfolk med rätt till självbestämmande och med en medföljande rätt till sitt eget kulturarv. I ett historiskt perspektiv har emellertid relationen mellan den svenska staten och samerna i Sverige präglats av ett hierarkiskt synsätt baserat på stereotyper, exotism och föreställningar om en högre kontra en lägre stående kultur, något som var påtagligt tiden före och efter sekelskiftet 1900.

Filmmediets historia tar sin början nästan samtidigt som den svenska staten alltmer aktivt börjar reglera relationen mellan samer och svenskar politiskt, bland annat genom de första renbeteslagarna 1886 och 1898. Det saknas dock grundläggande studier av hur filmmediet och senare även televisionens audiovisuella skildringar av samer och samisk kultur har bidragit till att forma det svenska majoritetssamhällets uppfattning om samerna, men även hur de påverkat samerna själva, deras självbild och relation till Sverige. Som i så många andra sammanhang under 1900-talet har samerna sällan getts chansen att föra sin egen talan: filmer och teveprogram är, med smärre undantag, producerade, distribuerade, förevisade och recenserade av icke-samer. Först under de senaste decennierna har exempel på samisk självrepresentation börjat förekomma då och då på filmdukarna och i teverutan.

Trots de rörliga bildernas betydelse under 1900-talet som förmedlare av svensk historia och kultur, inte minst populärkulturella uppfattningar, finns till dags dato inte någon samlad kartläggning över eller granskning av de filmer och teveprogram som skildrar samerna och samisk kultur. Materialets omfattning är okänd, och forskningen försvåras även av att det handlar om spridda arkivförvaltare (myndigheter, stiftelser, företag), vars verksamheter lyder under skilda lagar, regler och direktiv. Till detta kan även läggas kommersiella skäl, men framför allt tekniska och juridiska hinder (särskilt rättighetsfrågor), som komplicerar eller rent av omöjliggör tillgängliggörande av delar av det befintliga materialet.

Projektets syfte är att skapa en infrastruktur för det samiska audiovisuella kulturarvet, som en del av det svenska kulturarvet. En viktig övergripande frågeställning är hur ett samiskt audiovisuellt kulturarv kan skapas när en så stor del av detta material är skapat av aktörer i och från det dominerande majoritetssamhället. Detta väcker centrala och komplicerade etiska frågor, vilket utgör en central del av detta projekt. De övriga delarna är tre: (i)att företa en inventering av filmer och teveprogram, (ii) att kvalitetssäkra materialets metadata samt (iii) att upprätta en sökbar digital deldatabas, ”Samisk audiovisuell samling”, som kommer att tillgängliggöras för forskare via söktjänsten Svensk mediedatabaslänk till annan webbplats (vid Kungliga biblioteket, KB). Vissa delar av materialet kommer också att tillgängliggöras för en bredare allmänhet via Filmarkivet.selänk till annan webbplats (KB och Svenska Filminstitutet, SFI) och Öppet arkivlänk till annan webbplats (Sveriges Television).


Projektet – som är ett samarbete mellan två akademiska institutioner (Vaartoe, Centrum för samisk forskning vid Umeå universitet och Statsvetenskapliga institutionen vid Stockholms universitet), två institutioner med ansvar för det samiska kulturarvet (Sametinget och Svenskt fjäll- och samemuseum, Ájtte) och två institutioner med ansvar för det svenska audiovisuella kulturarvet (KB och SFI) – banar väg för ny forskning inom ett stort antal olika akademiska ämnesdiscipliner (arkeologi, film, mediestudier, historia, statsvetenskap med flera) och i ett stort antal dagsaktuella frågor, som till exempel om naturresursanvändningen inom det traditionella samiska bosättningsområdet. En infrastruktur för det samiska audiovisuella kulturarvet banar inte bara väg för ny forskning, utan möjliggör också för samerna själva att få kontroll över, skydda och utveckla sin egen audiovisuella historia, samt bidrar till att öka majoritetssamhällets förståelse för och kunskaper om det samiska samhället och dessa audiovisuella kulturarv som en del av det svenska kulturarvet.

Svenska eftermedeltida handskrifter i Kungliga biblioteket och Uppsala universitetsbibliotek – ett katalogiserings- och digitaliseringsprojekt


Period:
2019–2022 
Summa: 4,2 Mkr
Utlysning: Riksbankens jubileumsfond, Infrastruktur för forskning
Lärosäte: Kungliga biblioteket/Uppsala universitet
Projektansvarig: Docent Patrik Åström

De bevarade svenskspråkiga handskrifterna med medeltida texter utgör en mycket viktig del av det svenska kulturarvet. Forskningen som rör handskrifterna är relevant för många områden (historia, rätts-, språk-, bok-, och konsthistoria), men har försvårats på grund av att kataloger med uppgifter om handskrifternas innehåll (till exempel text och bilder) och utförande saknats. De medeltida handskrifterna har tagits om hand inom projektet ”Text till tiden”. Syftet med detta projekt är att skapa en fullständig katalog över de cirka 235 eftermedeltida handskrifterna vid Kungliga biblioteket och Uppsala Universitetsbibliotek och att fulldigitalisera ett femtiotal representativa handskrifter. Dessa yngre handskrifter har länge negligerats av forskningen, bland annat för att de kommit till just i den brytningstid då boktrycket infördes på bred front. Men eftersom de två medierna fortsatte att samexistera under lång tid och i parallella diskurser är det viktigt att tillgängliggöra även 1500- och 1600-talets handskriftsproduktion, och därigenom möjliggöra jämförande studier av bägge medietyperna, deras egenart och ömsesidiga påverkan.

Katalogen kommer att använda ett standardiserat metadataformat för handskriftskatalogisering som kallas TEI P5 Manuscript Description och den kommer att göras tillgänglig i Manuscripta.se, en digital katalog över medeltida och tidigmoderna handskrifter i Sverige.

Utvärdering och anpassning av en förbättrad OCR-process vid massdigitalisering


Period:
2019–2020
Summa: 1,7 Mkr
Utlysning:
Riksbankens jubileumsfond, Infrastruktur för forskning
Lärosäte: Kungliga biblioteket/Göteborgs universitet, Språkbanken text
Projektansvarig: Fil.dr. Lars Björk

Förväntningarna är höga på kulturarvsinstitutionernas kapacitet att tillhandahålla sina samlingar i digitalt format. Datadriven forskning har blivit ett centralt begrepp inom humaniora och samhällsvetenskaplig forskning. KB:s samlingar av digitaliserade dagstidningar kan i detta perspektiv betraktas som stora och unika kulturella dataset med information som inte förmedlas via andra mediatyper. Det digitala formatet möjliggör tillämpningar och bearbetningar som inte är möjliga så länge materialet hanteras i sitt tryckta format.

I och med att texter inte längre enbart läses utan också bearbetas algoritmiskt ökar kraven på tillförlitlighet. Tekniken för att överföra bild till maskinläsbar text (Optical Character Recognition OCR) är av avgörande betydelse för möjligheten att göra dessa resurser tillgängliga men metodens kapacitet varierar med typ av dokument. Detta blir särskilt tydligt i samband med digitalisering av dagstidningar där faktorer som produktionsmetod, layout och nedbrytning av papper ofta påverkar kvaliteten hos OCR-produktionen negativt.

För att förbättra produktionen av maskinläsbar text initierade KB ett projekt med syfte att utveckla en modul för OCR-bearbetning där centrala parametrar kan justeras för att matcha specifik karaktäristik hos det bearbetade materialet. Detta projekt syftar till att genomföra en formell utvärdering av detta redskap med målet att det ska implementeras i KB:s massdigitaliseringsprocess för dagstidningar.

Välfärdsstaten analyserad. Textanalys och modellering av svensk politik, media och kultur, 1945–1989


Period:
2019–2023
Summa: 22,6 Mkr
Utlysning: Vetenskapsrådet, Projektbidrag för digitalisering och tillgängliggörande av kulturarvssamlingar
Lärosäte: Umeå universitet/Uppsala universitet
Projektansvarig: Professor Pelle Snickars

De svenska välfärdsåren utgör en period av förändring, med utbyggda institutioner, nya levnadsmönster och förändrade relationer till omvärlden. Inte minst 1960-talet har framhävts som decenniet då politik och kultur radikaliserades, gamla auktoriteter utmanades och nya delar av världen placerades på kartan. Men trots att perioden är väl utforskad finns det anledning att återvända till den med metoder som låter oss studera diskursiva förändringar på makronivå. Med tillgång till storskaliga digitaliserade textsamlingar från politikens, nyhetsmediernas och kulturens sfärer kan gamla frågor ställas på nytt, samtidigt som relationen mellan de olika samhällssfärerna kan utforskas i detalj.

WeStAc är ett samarbete mellan Umeå universitet och Kungliga biblioteket (KB) och har ett tvådelat syfte: att etablera system och rutiner för att digitalisera och kurera stora textmaterial som möter de krav som digital forskning ställer, samt att kartlägga diskursiva mönster i välfärdsårens texter. Ofta har massdigitalisering bedrivits utan insikter och krav från forskare som arbetar med hela textkorpusar och digitala metoder. Inte sällan har därför digitala resultat varit så bristfälliga att det varit svårt att använda i sådan forskning. WeStAc angriper detta problem genom att bedriva digitalisering och digital forskning parallellt – och i samspel med varandra. I projektet digitaliseras och kureras texter i syfte att möta forskningskraven, samtidigt som projektets empiriska forskningsdel ger kontinuerlig feedback tillbaka till de instanser som digitaliserar och iordningställer texterna som dataset.

WeStAc kommer att arbeta med tre massiva dataset: “politik” – 3 100 SOU:er och allt riksdagsmaterial mellan 1945 och 1989; “media” – två dagstidningar, Aftonbladet och Dagens Nyheter från samma period, och “kultur” – kulturtidskriften Bonniers Litterära Magasin (BLM) samt ett urval av svenska romaner som publicerades under perioden. Projektet är indelat i tre arbetspaket: (WP1) digitalisering & datakurering, (WP2) textanalys & modelering samt (WP3) välfärdsstaten analyserad. I korthet utgör grundfrågorna till alla dataset om övergripande diskursiva förändringar är lika påtagliga som tidigare forskning antagit, eller om de uppvisar oväntade kontinuiteter. Finns det exempelvis kvardröjande diskurser, eller är diskursiva förändringar mer påtagliga i vissa sfärer och genrer jämfört med andra?

Texterna från Sveriges riksdag (protokoll, motioner, propositioner och offentliga utredningar) samt dagtidningsmaterialet är redan digitaliserat. Det förra består av uppskattningsvis 700 miljoner ord, det senare av omkring två miljarder ord. För att öka värdet av dessa digitala samlingar kommer de att kureras och förses med metadata på KB, bland annat för att göra det möjligt att särskilja aktörer i riksdagens debatter och märka upp enskilda delar i dagstidningarna, exempelvis kultursidorna. Detta arbete utförs parallellt med, och utifrån feedback från projektets forskningsdel. Därtill kommer WeStAc att digitalisera BLM, på omkring 28 000 sidor, samt ett urval av svenska publicerade romaner 1945–89. Tidskriften och romanerna utgör nya dataset, som tillsammans med riksdagsmaterialet och dagstidningarna gör det möjligt att spåra språkliga förändringar och ämnesmässiga förskjutningar över genregränserna.

De olika textsamlingarna är valda för att representera tre centrala sfärer i det svenska välfärdssamhället: politikens, mediernas och kulturens. Tre tidstypiska metatrender kommer att utforskas med den samlade textmassan som grund: globalisering, individualisering och emancipation. WeStAc kommer att använda tre metodologiska modeller för att fånga språkliga och ämnesmässiga mönster över tid: topic modeling – som utifrån samförekommande ord kan identifiera innehållsliga ämnen och diskurser samt deras utbredning, named entity recognition (NER) – som lokaliserar person-, organisation- och platsnamn i texterna, samt så kallad word embedding – som gör det möjligt att beräkna relationen mellan enskilda ord och den omgivande språkliga kontexten. Med dessa metoder kan förekomster av geografiska platser studeras över tid, liksom innehållsliga teman i politiska debatter, romaner och nyhetstexter, samt enskilda nyckelords användning och skiftande betydelser. Härutöver undersöks enskilda dataset med metodologiska modeller anpassade för specifika genrer.