Easytranscriber – nytt verktyg för att transkribera tal till text
Med KB:s nya AI-verktyg easytranscriber går det att automatiskt transkribera tal till text i stor skala. Verktyget är särskilt användbart för arkiv, bibliotek och museer som vill göra större ljudsamlingar mer sökbara och tillgängliga.

För ett år sedan lanserades tal-till-textmodellen KB-Whisper, som tränats på mer än 50 000 timmar av tv, riksdagstal och dialekter. Därmed blev den första i sitt slag med så gedigen träning på svenska. Tack vare det breda träningsmaterialet har modellen lärt sig att förstå en rik variation av språket.
Nu publicerar KB easytranscriber, ett verktyg som kombinerar det bästa från två modeller: Whisper och Wav2vec2. Whisper skapar läsvänliga transkriptioner med interpunktion och stor bokstav. Wav2vec2 ger i sin tur transkriptioner med träffsäkra tidsstämplar.
Med hjälp av easytranscriber är det därför möjligt att få precisa tidsstämplar på ordnivå i det transkriberade materialet. Det gör att verktyget passar bra för arkiv, bibliotek och museer som vill göra stora ljudsamlingar mer sökbara och tillgängliga.
KB arbetar själva med att transkribera miljontals timmar radiosändningar ur sina samlingar. Möjligheten att generera tidskoder är avgörande för att materialet ska bli lätt att navigera och söka i.