Dataåtkomst
All data från Swepub är fritt tillgänglig. Läs här om hur du kan ta del av denna!
Data från Swepub finns tillgängligt för slutanvändare. Datat kan hämtas fritt via protokollen OAI-PMH och SRU. Det finns även ett lättvikts-API, Xsearch, som ger åtkomst till data via HTTP i en rad olika format. Data finns också tillgängligt som datadumpar. Öppna API:er till tjänsterna för bibliometri, databearbetning och ämnesklassificering finns dokumenterade. Via API:er går det också att titta på fullständiga poster i Swepub MODS som XML och Swepub BIBFRAME som JSON.
Förteckning över dataleverantörer (svenska lärosäten och forskningsinstitutioner).
OAI-PMH
Originaldata så som Swepub hämtar det från dataleverantörerna utan vidare dataprocessering.
Om OAI-PMH: Open Archives Initiative
Metadataformat som stöds:
- Dublin Core
(metadataPrefix = mods)
- MODS
(metadataPrefix = mods)
- Swepub MODS format specification v. 3.0
(metadataPrefix = swepub_mods)
Bas-url: http://api.libris.kb.se/swepub/oaipmh/SWEPUB
Uppdateringsfrekvens: Varje natt. Några av dataleverantörerna stödjer selektiv höstning medan andra utför en total omladdning varje natt. Därmed varierar datumstämpel för den senaste uppdateringen av data.
SRU
SRU är ett XML-baserat protokoll för sökning.
Om SRU: Library of congress standards
Bas-url: http://api.libris.kb.se/sru/swepub
Xsearch lättvikts-API
Xsearch är ett HTTP-baserat lättvikts-API för åtkomst av Swepubdata i en rad xml- och textformat. För närvarande finns stöd för MARC-XML, Dublin Core, JSON, RIS, MODS och RDF.
Om Xsearch: http://librishelp.libris.kb.se/help/xsearch_swe.jsp?redirected=true&language=se
Bas-url: http://libris.kb.se/xsearch?database=swepub
Datadumpar
För att underlätta återanvändning av Swepubdata lägger vi upp databasdumpar. Datadumpar är tillgängliga via FTP från både Swepubs söktjänst och bibliometritjänst
.
Datadumpar från Swepubs söktjänst
All data finns tillgängligt i originalformat som innehåller dubbletter. Datadumparna innehåller data i XML-format från den senaste nattliga uppdateringen. Dumparna är formaterade som OAI-PMH "ListRecords" -svar med Swepub-modifierade MODS som metadataformat (se avsnitt OAI-PMH ovan).
Dumpar av originaldata: ftp://ftp.libris.kb.se/pub/swepub/swepub_dump.xml
Uppdateringsfrekvens: Varje natt.
Datadumpar från Swepubs bibliometritjänst
Följande FTP-adress leder till en indexsida som innehåller datadumpar i formatet JSON Lines med Swepub-modifierade BIBFRAME som metadataformat. Dumparna finns tillgängligt i både duplicerad och deduplicerad variant. Dumparna innehåller data från leverantörerna med vissa berikningar för att kunna göra bibliometriska analyser och uppföljningar.
Totala datadumpar är baserade på ett fullständigt datauttag av all data från alla år tillsammans med alla tillgängliga fält. Årsvisa datadumpar är baserade på ett fullständigt datauttag av all data från ett visst år tillsammans med alla tillgängliga fält. Dumparna finns både tillgängligt i duplicerad och deduplicerad variant. En del äldre dumpar har sparats i syfte att behålla historiska data.
Dumpar av berikade duplicerade och deduplicerade data: ftp://ftp.libris.kb.se/pub/spa/
Uppdateringsfrekvens: Totala datadumpar en gång i veckan. Årsvisa datadumpar en gång i månaden.
API:er till tjänsterna för bibliometri, databearbetning och ämnesklassificering
API:er som används för att hämta data från Swepubs datalager till tjänsterna bibliometri, databearbetning, datastatus och ämnesklassificering finns dokumenterade och fritt tillgängliga för användare. Ett informations-API är också dokumenterat för att hämta organisationskoder, outputtyper och forskningsämnen som används i Swepub.
Observera att API:erna inte har separat versionering utan har samma version som hela Swepub-systemet. Detta innebär att vid varje ny version av Swepub kan även de enskilda API:erna ha ändrats. API:erna är bakåtkompatibla så länge version-numret av Swepub-systemet har samma helnummer (major). Detta betyder att alla eventuella förändringar i minor-versioner är tillägg.
Swepubs öppna API:er: https://bibliometri.swepub.kb.se/api/v1/apidocs/
API:er till fullständiga Swepub poster
Duplicerade poster enligt Swepub MODS i XML-formatet innehåller originalposten från organisationen så som den har levererats till Swepub och konverterats till Swepub MODS.
Fullständiga poster enligt Swepub BIBFRAME i JSON-fomatet finns tillgängliga både som duplicerade och deduplicerade. Deduplicerad post innehåller posten som ligger till grund för den sammanslagna posten, berikad med uppgifter från de andra dubblettposterna. Båda innehåller Swepubs berikningar och normaliseringar.
MODS-post i Swepub: https://bibliometri.swepub.kb.se/api/v1/process/publications/[recordID]/original
Duplicerad BIBFRAME-post i Swepub: https://bibliometri.swepub.kb.se/api/v1/process/publications/[recordID]
Deduplicerad BIBFRAME-post i Swepub: https://bibliometri.swepub.kb.se/api/v1/bibliometrics/publications/[recordID]
Ersätt [recordID] med postens identifikator från OAI-PMH.
Tips: Webbläsaren Firefox visar JSON-poster på ett överskådligt sätt.