Sök i radiosändningar med Mediesök

Med KB:s nya tjänst Mediesök blir det enklare för forskare att söka i våra radiosändningar. Allt som sägs i programmen har transkriberats med hjälp av AI och är därför sökbart som text.

I Mediesök hittar du utskrivna sändningar med tillhörande ljud från slutet av 1970-talet och fram till idag. Än så länge finns allt som sänts i P1 och de flesta av Sveriges radios lokalstationer i tjänsten. Innehållet fylls på successivt allt eftersom sändningar transkriberas.

Mediesök är en pilot för att utforska möjligheterna att med hjälp av AI öka sökbarheten i KB:s radiosamlingar. Den har utvecklats av KB-labb, som är bibliotekets egen AI-verksamhet, med hjälp av tal-till-text-modeller.

Tillgängligt för forskare på plats i KB

Av juridiska skäl är Mediesök i dagsläget bara tillgänglig i forskarrummen på KB i Humlegården, Stockholm. Du behöver också ha ett användarkonto i Svensk mediedatabas (SMDB) för att använda tjänsten.

Kontakta personalen i KB:s expedition för audiovisuella medier för att få tillgång. Hör gärna av dig till info@kb.se om du har frågor.

Från ljud till sökbar text

De senaste framstegen inom AI har öppnat upp nya möjligheter att söka i audiovisuella samlingar. Det som tidigare skulle ha krävt en enorm mängd manuellt arbete – att transkribera talade sändningar till sökbar text – kan nu göras automatiskt.

En förutsättning är att de underliggande språkmodellerna för taligenkänning klarar av variationer i dialekt, ljudkvalitet och sändningsförhållanden. Kort sagt innebär det att man måste förlita sig på en högkvalitativ modell anpassad för svenska, såsom KB-Whisper.

Läs mer på KB-labbs blogg på Github! Länk till annan webbplats.