Swepub version 1.8

I dag produktionssattes Swepub version 1.8.

Vid händelse att den nya versionen inte laddas in automatiskt: uppdatera webbsidan (F5) eller uppdatera webbsidan utan att hämta från cachen (Ctrl+F5).

En ny version av Swepub har blivit satt i produktion den 19 maj. Tre områden har varit i fokus för releasen:

  • Effektivisering av datahämtningen och -hanteringen samt förenkling av förvaltningen av Swepub.
  • Förbättring av identifieringen och sammanslagningen av dubbletter.
  • Implementering av den uppdaterade Svenska listan från Vetenskapsrådet.

Utöver fokusområden har det arbetats med återkoppling av berikningar i Swepub-data och nya variabler i API:et för Bibliometri. I samband med releasen påbörjas även datahämtningar från Högskolan Kristianstad som har bytt systemleverantör. I organisationsmenyerna har namnen för Ersta Sköndal Bräcke högskola bytts till Marie Cederschiöld högskola och Mälardalens högskola till Mälardalens universitet.

I anslutning till lanseringen av den nya versionen kommer all data att hämtas och uppdateras på nytt. Beräknad tid för detta är cirka åtta timmar.

För frågor eller vidare information kontakta Libris kundservice.

Effektivisering av datahantering

Förbättrad datahantering i Swepub för att snabbare hämta och bearbeta data.

Refaktorering av Swepub

Swepubs programkod har omstrukturerats. Syftet med denna så kallade refaktorering har varit att förenkla vidareutveckling och underhåll av Swepubs kod. Refaktoreringen har inte påverkat funktionaliteten i Swepub.

I och med refaktoreringen har datahämtningar och -bearbetningar effektiviserats i Swepub. Datamiljön består inte längre av mikrotjänster vilket har lett till att en total omladdning av data sker nu i ca åtta timmar i stället för de tidigare tre-fem dygnen. Eftersom även datalagringen har flyttats, har den tidigare avgränsningen på max 10 000 poster i Bibliometritjänsten kunnat avlägsnas.

I samband med refaktoreringen har Swepubs kod dokumenterats och tillgängliggjorts i GitHub Länk till annan webbplats..

Dubbletthantering

Förbättringar i identifiering och sammanslagning av dubbletter. Läs mer om dubbletthanteringen i Swepub. Observera att trots förbättringar i dubbletthanteringen förekommer det fortsatt dubbletter och felaktiga sammanslagningar.

Identifiering av dubblettkandidater

Dubblettidentifieringen har förbättrats genom att titlar och sammanfattningar nu jämförs på ett sätt som bättre tolererar felstavningar och smärre avvikelser. Vid jämförandet av titel läggs nu mindre vikt på titlar som förekommer ofta, exempelvis Inledning, Förord, Proceeding.

Sammanslagning av information om upphovspersoner och affilieringar

Identifieringen och sammanslagningen av information om upphovspersoner och deras affilieringar har förbättrats genom att i stället för exakt match av hela namnet, jämföra delnamn med så kallat Levenshteinavstånd Länk till annan webbplats.. Detta möjliggör matchningar trots felstavningar och variationer i ordningen på delnamnen. Även i sådana fall där namn i en post skulle ha skrivits med fullständigt förnamn och i en annan post med initial, kan Swepub ändå identifiera dessa två som samma upphovsperson.

Vid sammanslagningen av poster utgås från fullständiga namnformer för upphovspersoner och auktoriserade affilieringar. Affilieringar som inte lyckas matchas med den auktoriserade affilieringen eller andra fritextaffilieringar läggs till.

Öppna API:er till Swepub

För att göra det enklare att använda Swepub-data i egna applikationer är API:er till Swepubs tjänster Länk till annan webbplats. öppna och dokumenterade enligt OpenAPI - specifikationen i Swagger.

BibliometriAPI

API:et mot Bibliometritjänsten har uppdaterats med att lägga till möjlighet att anropa:

  • Om publikationen har fått autoklassning.
  • Mer fullständig information om serie.
  • Om publikationen ingår i en publiceringskanal som i sin tur ingår i Directory of Open Access Journals - DOAJ.
  • Om versionen för fulltexten.

Swepub bibliometri

Nya och förbättrade funktioner i Swepub bibliometri Länk till annan webbplats..

Uppdaterat svenskt register för sakkunniggranskade publiceringskanaler

Den så kallade Svenska listan Länk till annan webbplats, öppnas i nytt fönster. har uppdaterats av Vetenskapsrådet. Den uppdaterade listan har implementerats i Swepub. Poster som har ISSN och utgivningsår som matchar med ISSN och bedömningsår i Svenska listan märks upp. Vid sökning i bibliometritjänsten går det att avgränsa enligt den uppdaterade listan.

Avgränsningen på max antal poster avlägsnad

Avgränsningen på max antal poster som Swepubs tjänst för Bibliometri har haft (max 10 000 poster per uttag) har nu kunnat avlägsnas. Avgränsningen berodde på systemarkitektoniska hinder som i och med refaktoreringen har kunnat tas bort.

Avgränsning till öppet tillgänglig output

Vid sökning i bibliometritjänsten går det nu även att avgränsa till endast öppet tillgänglig output.

Skärmbild på sökningsformuläret i Swepubs tjänst för Biblbiometri med möjlighet att avgränsa sökningen till öppet tillgängliga outputs

Förbättrad matchning mot nyckelord

Sökning på nyckelord är nu mer tillåtande mot gemener och versaler. Sökningen genererar träff oavsett hur man har angett nyckelordet.

Swepub databearbetning

Nya och förbättrade funktioner i Swepub databearbetning Länk till annan webbplats..

Berikade data om öppen tillgång

Nu visas metadata som Swepub har hämtat från de externa datakällorna Unpaywall och Directory of Open Access Books (DOAB). Här visas:

  • URI för fulltexten
  • Åtkomstpolicy i form av URI till KB:s tjänst id.kb.se
  • Version av fulltexten
  • Källa för URI:n

Observera att när data från de externa datakällorna uppdateras en gång per halvår, kan status på berikningarna ändras. Det är rekommenderat att kontrollera de berikningar som har gjorts i Swepub och återkoppla dem till sitt lokala system så att berikningarna även finns i originalposten.

Skärmklipp från Swepubs tjänst för Databearbetning som visar värden för vilka berikningar med information om öppen tillgång har lagts till.

Ogiltiga ORCIDs avlägsnade

ORCID-ID:n som inte följer formatet censureras från utgående Swepub-data. Syftet är att felaktigheter så som e-postadresser och personliga inloggningar som kan återfinnas i originaldata inte förs vidare i datauttagen från Swepub.

Det är rekommenderat att åtgärda ogiltiga ORCIDs omgående för att personuppgifter som felaktigt har angetts som ORCIDs inte återfinns i originaldata.

Skärmklipp från Swepubs tjänst för Databearbetning som visar värden för vilka ORCID-ID:n som har avlägsnats från utgående Swepub-data.

Ogiltiga identifikatorer flyttade till incorrectlyIdentifiedBy

Identifikatorer som inte går att validera och verifiera mot externa datakällor flyttas nu till fältet incorrectlyIdentifiedBy i Swepub-data. Det gäller identifikatorerna DOI, ISBN, ISI ID och ISSN.

Skärmbild från Swepubs tjänst för Databearbetning som visar värden för ogiltiga identifikatorer som har flyttats till fältet incorrectlyIdentifiedByi Swepub-data.