fullskärmsbild

Uppmärknings­flaggor

I Swepub finns ett flertal så kallade flaggningar som används för att märka upp poster som har blivit ändrade eller som inte har blivit validerade enligt definierade systemregler.

Syftet med flaggningar är att uppmärksamma ofullständigheter och ändringar i data. Uppmärkningen förutsätter att posterna uppfyller den bibliografiska miniminivån i Swepub.

Uppmärkningsflaggorna består av fyra typer av flaggor:

  • Valideringsflaggor
  • Motstridighetsflaggor
  • Berikningsflaggor
  • Normaliseringsflaggor

Data märkta med validerings-, motstridighets- och berikningsflaggor kan följas upp genom gränssnittet för Databearbetninglänk till annan webbplats.

Valideringsflaggor

Valideringsflaggorna används för att märka upp data som har gått att varken validera eller berika. Här ingår felaktigheter i format och dubblerade, ogiltiga eller saknade värden som kan påverka uttag på kvalitetssäkrade data för analyser, statistik och uppföljningar. Det finns följande typer av valideringsflaggor:

  • Formatfel: Syntaktiskt fel i formateringen av värdet.
  • Kontrollkod fel: Värdet för checksum är felaktigt.
  • Ogiltigt: Värdet går inte att verifieras hos en auktoriserad datakälla.

Data markerade med valideringsflaggor bör kontrolleras och åtgärdas i den lokala publikationsdatabasen om tillämpligt. I vissa fall går det inte att åtgärda. Om en identifikator anges felaktigt i själva outputen, bör dessa dock markeras som ogiltiga vid registreringen.

Motstridighetsflaggor

Motstridighetsflaggorna används för att märka upp data när flera fält korrelerar med varandra men innehåller motstridiga eller oförväntade data. Här ingår motstridigheter i antalet upphovspersoner, dubbla förekomst av samma upphovsperson, saknade ISSN-nummer och ämnesklassificering. Det finns följande typer av motstridighetsflaggor:

  • Dubblering: Samma värde upprepas.
  • Motstridighet: Värden korrelerar inte med varandra som förväntat.
  • Saknat värde: Förväntat värde saknas.

Data markerade med motstridighetsflaggor bör kontrolleras och åtgärdas i den lokala publikationsdatabasen om tillämpligt.

Berikningsflaggor

Berikningsflaggorna används för att märka upp data som har fått ett nytt värde i Swepub. Här ingår data som inte har gått att validera före berikningen. Tillägg och ändringarna har gjorts i Swepubsystemet för att höja datakvaliteten. Det finns följande typer av berikningsflaggor:

  • Separering: Ett värde har separerats från ett annat och flyttats till ett eget fält.
  • Tillägg: Ett värde har lagts till.
  • Tvätt: Värdet har tvättats från ogiltiga tecken.

Data markerade med berikningsflaggor bör kontrolleras och återkopplas till den ursprungliga posten vid datakällan, den lokala publikationsdatabasen, om tillämpligt.

Normaliseringsflaggor

Normaliseringsflaggorna används för att märka upp data som har normaliserats för att skapa konsekvens för hur data presenteras. Dessa flaggor används för information om datahanteringen i Swepubsystemet och behöver inte åtgärdas i de lokala publikationsdatabaserna.

Så beskrivs uppmärkningsflaggorna:

Här visas hur tabellerna för uppmärkningsflaggorna är strukturerade.

Benämning

Motsvarande svensk benämning för uppmärkningsflaggan.

Definition

En kort förklaring till uppmärkningsflaggan.

Extern källa

Den datakälla som används för verifiering eller berikning av ett värde.

Beskrivning

En skildring av vad som avses.

Validering i Swepub

En redogörelse för hur valideringsregeln fungerar i Swepub.

Berikning i Swepub

En redogörelse för hur berikningsregeln fungerar i Swepub.

Normalisering i Swepub

En redogörelse för hur normaliseringregeln fungerar i Swepub.

Swepub MODS

Hänvisning till elementen i överföringsformatspecifikationen där korrekt sätt att ange data är beskrivet i kodexempel.

Swepub BIBFRAME i JSON

Hänvisning till elementen i Swepubs format för datamodellen.

Valideringsflaggor

  • Validation DOI format

    Benämning:
    DOI formatfel.

    Definition:
    DOI felskrivet. DOI börjar alltid med 10. utöver https-prefix.

    Beskrivning:
    DOI består av prefix 10. med efterföljande kod för registrator och eventuell subdivision till denna samt av suffix som är unik i förhållande till registratorkoden. Suffix kan bestå av en sekventiell nummerserie eller en identifikator som ISBN, ISSN och ISNI. Längden och tecken kan variera.

    Flaggning för DOI som inte följer format eller som innehåller en annan prefix än https://doi.org/ eller suffix.

    Validering i Swepub:
    Validering av format utifrån regeln att 10. ska finnas med.

    Swepub MODS 3.0:
    identifier type="doi"
    (se avsnitt 5 Resource identifiers & 18.4 Source identifiers)

    Swepub BIBFRAME i JSON:
    identifiedBy @type "DOI"

  • Validation DOI remote


    Benämning:
    DOI ogiltigt.

    Definition:
    DOI går inte att verifiera mot CrossRef eller shortDOI service.

    Extern datakälla:
    CrossRef & shortDOI service.

    Beskrivning:
    Om det angivna DOI inte matchas mot DOI i CrossRef eller shortDOI, markeras detta som ogiltigt.

    Validering i Swepub:
    Verifiering av DOI mot CrossRef & shortDOI service.

    Swepub MODS 3.0:
    identifier type="doi"
    (se avsnitt 5 Resource identifiers & 18.4 Source identifiers)

    Swepub BIBFRAME i JSON:
    identifiedBy @type "DOI"

  • Validation ISBN format

    Benämning:
    ISBN formatfel.

    Definition:
    ISBN felskrivet. ISBN börjar antingen med 978 eller landskod och skrivs enbart som kod i 10 eller 13 siffror.

    Beskrivning:
    ISBN består av 10-13 siffror. Siffrorna är uppdelade i fem grupper enligt följande: 

    1.  Prefix (978)
    2.  Områdesbeteckning (t.ex. 91=Sverige)
    3.  Förlagsbeteckning
    4.  Titelbeteckning 
    5.  Kontrollkod (1-9 eller även X vid 10-siffriga)
    6. Grupperna kan vara åtskilda med bindestreck eller mellanslag och totalt bestå av upp till 17 tecken för 13-siffriga ISBN eller 13 för 10-siffriga. 

    Flaggning för ISBN som inte följer format eller som innehåller prefix eller suffix.

    Validering i Swepub:
    Kontroll att ISBN enbart består av antingen 13 siffror i max 5 grupper och börjar med 978 eller 10 siffror i max 4 grupper som slutar med siffror 0-9 eller ett stort X.

    Swepub MODS 3.0:
    identifier type="isbn"
    (se avsnitt 5 Resource identifiers & 18.4 Source identifiers)

    Swepub BIBFRAME i JSON:
    identifiedBy @type "ISBN"
    indirectlyIdentifiedBy @type ”ISBN”

  • Validation ISBN checksum

    Benämning:
    ISBN kontrollkod fel.

    Definition:
    ISBN kontrollkod felaktig. Den sista siffran för ISBN-numret ska returnera korrekt kontrollkod.

    Beskrivning:
    ISBN består av 10-13 siffror varav den sista är kontrollkod (checksum). Kontrollkoden kan vara 0-9 vid 13-siffriga och även X vid 10-siffriga. Den räknas utifrån de föregående siffrorna i ISBN-numret. Om kalkyleringen returnerar fel siffra för kontrollkoden, är ISBN-numret inte giltigt.

    Flaggning för ISBN med felaktig kontrollkod.

    Validering i Swepub:
    Validering utifrån respektive algoritmen för kontrollkoden.

    Swepub MODS 3.0:
    identifier type="isbn"
    (se avsnitt 5 Resource identifiers & 18.4 Source identifiers)

    Swepub BIBFRAME i JSON:
    identifiedBy @type "ISBN"
    indirectlyIdentifiedBy @type ”ISBN”

  • Validation ISI format

    Benämning:
    ISI ID formatfel.

    Definition:
    ISI ID felskrivet. ISI ID skrivs antingen 1) med 15 siffror som börjar med 000, 2) 15 tecken som börjar med A19 och efterföljs med tecken bestående av stora bokstäver och siffror.

    Beskrivning:
    ISI ID/UT-nummer/WoS ID från databasen Web of Science ska anges som kod med 15 tecken. 

    Flaggning för ISI ID som inte följer formatet eller som innehåller prefix eller suffix.

    Validering i Swepub:
    Validering av format enligt definitionen.

    Swepub MODS 3.0:
    identifier type="isi"
    (se avsnitt 5 Resource identifiers)

    Swepub BIBFRAME i JSON:
    identifiedBy @type "ISI"

  • Validation ISSN format

    Benämning:
    ISSN formatfel.

    Definition:
    ISSN felskrivet. ISSN skrivs enbart som kod i format XXXX-XXXX.

    Beskrivning:
    ISSN ska bestå av 8 siffror varav det sista kan även vara X. Skiljs med bindestreck i två 4-sifferblock. 

    Flaggning av ISSN som inte följer format eller som innehåller prefix eller suffix.

    Validering i Swepub:
    Kontroll på 8 siffror separerade i två 4-sifferblock med streck samt kontroll av att sista tecknet är 0-9 eller stort X.

    Swepub MODS 3.0:
    identifier type="issn"
    (se avsnitt 18.4 Source identifiers)

    Swepub BIBFRAME i JSON:
    identifiedBy @type "ISSN"
    indirectlyIdentifiedBy @type ”ISSN”

  • Validation ISSN checksum

    Benämning:
    ISSN kontrollkod fel.

    Definition:
    ISSN kontrollkod felaktig. Den sista siffran för ISSN-numret ska returnera korrekt kontrollkod.

    Beskrivning:
    ISSN består av 8 siffror varav den sista är kontrollkod (checksum). Kontrollkoden kan vara 0-9 eller X och räknas utifrån de föregående siffrorna i ISSN-numret. Om kalkyleringen returnerar fel siffra för kontrollkoden, är ISSN-numret inte giltigt.

    Flaggning för ISSN med felaktig kontrollkod.

    Validering i Swepub:
    Validering utifrån algoritmen för kontrollkoden.

    Swepub MODS 3.0:
    identifier type="issn"
    (se avsnitt 18.4 Source identifiers)

    Swepub BIBFRAME i JSON:
    identifiedBy @type "ISSN"
    indirectlyIdentifiedBy @type ”ISSN”

  • Validation ISSN remote


    Benämning:
    ISSN ogiltigt.

    Definition:
    ISSN går inte att verifiera mot ISSN portalen.

    Extern datakälla:
    ISSN Portal.

    Beskrivning:
    Om det angivna ISSN inte matchas mot ISSN i ISSN portalen, markeras detta som ogiltigt.

    Validering i Swepub:
    Verifiering av ISSN mot ISSN portalen.

    Swepub MODS 3.0:
    identifier type="issn"
    (se avsnitt 18.4 Source identifiers)

    Swepub BIBFRAME i JSON:
    identifiedBy @type "ISSN"
    indirectlyIdentifiedBy @type ”ISSN”

  • Validation ORCID format

    Benämning:
    ORCID formatfel.

    Definition:
    ORCID felskrivet. ORCID skrivs enbart som kod i format XXXX-XXXX-XXXX-XXXX.

    Beskrivning:
    ORCID ska bestå av 16 tecken i siffror 0-9 varav det sista kan även vara X. Skiljs med bindestreck i fyra 4-teckenblock.

    Flaggning för ORCID som inte följer formatet som innehåller prefix eller suffix.

    Validering i Swepub:
    Validering av format enligt definitionen.

    Swepub MODS:
    name/description type="orcid" (se MODS 2.6 , avsnitt 13.1.2 Person identifier ORCID)
    nameIdentifier type="orcid" (se MODS 3.0, avsnitt 13.1.2 Name identifier )

    Swepub BIBFRAME i JSON:
    identifiedBy @type "ORCID"

  • Validation ORCID checksum

    Benämning:
    ORCID kontrollkod fel.

    Definition:
    ORCID kontrollkod felaktig. Den sista siffran för ORCID ska returnera korrekt kontrollkod.

    Beskrivning:
    ORCID består av 16 siffror varav den sista är kontrollkod (checksum). Kontrollkoden kan vara 0-9 eller X och räknas utifrån de föregående siffrorna i ORCID-numret. Om kalkyleringen returnerar fel siffra för kontrollkoden, är ORCID-numret inte giltigt.

    Flaggning för ORCID med felaktig kontrollkod.

    Validering i Swepub:
    Validering utifrån algoritmen för kontrollkoden  ISO/IEC 7064:2003 MOD 11-2.

    Swepub MODS:
    name/description type="orcid" (se MODS 2.6 , avsnitt 13.1.2 Person identifier ORCID)
    nameIdentifier type="orcid" (se MODS 3.0, avsnitt 13.1.2 Name identifier )

    Swepub BIBFRAME i JSON:
    identifiedBy @type "ORCID"

  • Validation ORCID span

    Benämning:
    ORCID spannfel.

    Definition:
    ORCID spann felaktig. ORCID formatet ska vara enligt ISO 27729.

    Beskrivning:
    ORCID följer ISNI-standarden ISO 27729.

    Flaggning för ORCID som inte följer standarden.

    Validering i Swepub:
    Kontroll på 16 tecken inom spannet för ISO 27729.

    Swepub MODS:
    name/description type="orcid" (se MODS 2.6 , avsnitt 13.1.2 Person identifier ORCID)
    nameIdentifier type="orcid" (se MODS 3.0, avsnitt 13.1.2 Name identifier )

    Swepub BIBFRAME i JSON:
    identifiedBy @type "ORCID"

  • Validation UKA format

    Benämning:
    SSIF formatfel.

    Definition:
    Ämnesklassificering enligt Standard för svensk indelning av forskningsämnen 2011 (SSIF) felkodad.

    Beskrivning:
    Forskningsämnet anges i sifferkoder enligt SSIF.

    Flaggning då ämnesklassificeringen inte följer den korrekta kodningen.

    Validering i Swepub:
    Verifiering av ämneskoden.

    Swepub MODS:
    subject/topic 
    (se avsnitt 8.1 Subject classification according to Swedish research subjects standard)

    Swepub BIBFRAME i JSON:
    subject @type "Topic" 

  • Validation unicode

    Benämning:
    Teckenfel.

    Definition:
    Teckenkodning felaktig. Tecken ska vara enligt UTF-8.

    Beskrivning:
    Systemet stödjer endast teckenkodning enligt UTF-8.

    Flaggning för felaktig teckenkodning, exempelvis HTML.

    Validering i Swepub:
    Validering av tecken i identifikatorer som ska vara inom ASCII 128.

    Swepub MODS 3.0:
    identifier
    (se avsnitt 5 Resource identifiers & 18.4 Source identifiers)

    Swepub BIBFRAME i JSON:
    identifiedBy

  • Validation creatorCount numeric

    Benämning:
    Upphovsantal formatfel.

    Definition:
    Totalt antal upphovspersoner felformaterat. Antal upphovspersoner (creator count) måste anges som ett numeriskt antal.

    Beskrivning:
    Flaggning då totalt antal upphovspersoner inte finns angivet som ett numeriskt värde.

    Validering i Swepub:
    Verifiering av fältets numeriska värde.

    Swepub MODS 3.0:
    note type="creatorCount"
    (se avsnitt, 14 Creator count)

    Swepub BIBFRAME i JSON:
    hasNote @type "CreatorCount"

  • Validation publication year format

    Benämning:
    Utgivningsdatum formatfel.

    Definition:
    Utgivningdatum felskrivet. Utgivningsdatum anges enligt ISO 8601 i format YYYY för årtal och YYYY-MM-DD för datum.

    Beskrivning:
    Utgivningsdatum ska anges som 4-siffrigt årtal i format YYYY för årtal och 8-siffrigt datum i format YYYY-MM-DD enligt standarden ISO 8601..

    Flaggning om fältet för utgivningsdatum innehåller annat än datum eller årtal. 

    Validering i Swepub:
    Kontroll på att elementet innehåller årtal eller datum.

    Swepub MODS 3.0:
    dateIssued
    (se avsnitt 17.1 Publication date)

    Swepub BIBFRAME i JSON:
    date

Motstridighetsflaggor

  • Audit UKA comprehensive check invalid

    Benämning:
    UKÄ ofullständig.

    Definition:
    Ämnesklassificering enligt Standard för svensk indelning av forskningsämnen 2011 (SSIF) på för övergripande nivå. Åtminstone en ämnesklassificering enligt standarden bör vara angiven på minst 3-siffernivå. Benämningen härrör från Universitetskanslersämbetet (UKÄ) som tillsammans med Statistiska Centralbyrån (SCB) förvaltar standarden. 

    Beskrivning:
    Forskningsämnet anges enligt SSIF som består av tre nivåer: högsta (forskningsämnesområde på 1-siffernivå), mellersta (forskningsämnesgrupp på 3-siffernivå) och lägsta (forskningsämne på 5-siffernivå). Åtminstone en ämnesklassificering bör ligga på minst 3-siffernivån.

    Flaggning då ämnesklassificeringen har angetts på 1-siffernivån.

    Validering i Swepub:
    Verifiering av ämneskoden.

    Swepub MODS 3.0:
    subject/topic (se avsnitt 8.1 Subject classification according to Swedish research subjects standard)

    Swepub BIBFRAME i JSON:
    subject @type "Topic" 

  • Audit contributor duplicate check invalid

    Benämning:
    Upphov dubblerat.

    Definition:
    Dubbel angivelse av samma upphovsperson. En upphovsperson bör vara registrerad enbart en gång för samma roll.

    Beskrivning:
    Upphovsperson anges endast en gång för samma roll när författarskap respektive redaktörskap beskrivs.

    Flaggning då en person är angiven flera gånger med samma roll.

    Validering i Swepub:
    Dubblettkontroll utifrån namn och personID tillsammans med roll.

    Swepub MODS 3.0:
    namePart (se avsnitt 13 Name Part)
    role/roleTerm (se avsnitt 13.1.5.1 Role Term)

    Swepub BIBFRAME i JSON:
    contribution @type "Contribution"
    agent

    role

  • Audit ISSN missing check invalid


    Benämning:
    ISSN saknas.

    Definition:
    ISSN saknas. ISSN borde vara angiven för artiklar publicerade i tidskrift.

    Beskrivning:
    Flaggning för saknade ISSN för publicerade verk angivna som Artikel i vetenskaplig tidskrift, Artikel i övrig tidskrift, Artikel i dags/nyhetstidning, Special-/temanummer av tidskrift.

    Validering i Swepub:
    Validering utifrån angiven outputtyp alternativt publikationstyp samt publiceringsstatus.

    Swepub MODS 3.0:
    identifier type="issn" (se avsnitt 18.4 Source identifiers)
    genre type="outputType" alt. "publicationType" (se avsnitt 10 Resource type)

    note type="publicationStatus" (se avsnitt 12 Publication status)

    Swepub BIBFRAME i JSON:
    identifiedBy @type "ISSN"
    indirectlyIdentifiedBy @type ”ISSN”

  • Audit creator count check invalid

    Benämning:
    Upphovsantal motstridigt.

    Definition:
    Totalt antal upphovspersoner stämmer inte. Det numeriska antalet upphovspersoner kan inte vara mindre än antalet angivna namn på upphovspersoner.

    Beskrivning:
    Flaggning då antalet angivna namn på upphovspersoner i förhållande till författarskap respektive redaktörskap överstiger det numeriska värdet för totalt antal upphovspersoner (creator count).

    Validering i Swepub:
    Jämförelse mellan det numeriska värdet i totalt antal upphovspersoner och angivna namn utifrån rollerna "aut" och "cre". Jämförelse mellan det numeriska värdet i totalt antal upphovspersoner och angivna namn utifrån rollen "edt" för samlingsverk och proceedings samt även rapporter om det inte finns andra namn angivna med rollerna "aut" och "cre".

    Swepub MODS 3.0:
    note type="creatorCount"
    (se avsnitt, 14 Creator count)

    Swepub BIBFRAME i JSON:
    hasNote @type "CreatorCount"

Berikningsflaggor

  • Enrichment DOI recovery

    Benämning:
    DOI tvättat.

    Definition:
    DOI bör endast innehålla kod som börjar med 10. samt https-prefix.

    Beskrivning:
    DOI består av https-prefix och kod som börjar med 10.

    Flaggning för poster som har tvättats från ytterligare tecken, prefix eller suffix.

    Berikning i Swepub:
    Radering av alla övriga tecken före 10. utöver https-prefix.

    Swepub MODS 3.0:
    identifier type="doi"
    (se avsnitt 5 Resource identifiers & 18.4 Source identifiers)

    Swepub BIBFRAME i JSON:
    identifiedBy @type "DOI"

  • Enrichment ISBN split

    Benämning:
    ISBN separerat.

    Definition:
    ISBN för olika format ska ligga på varsitt fält.

    Beskrivning:
    Flaggning för ISBN som har separerats från ett och samma fält till varsitt fält. 

    Berikning i Swepub:
    Flera ISBN angivna i ett ISBN-fält separeras till var sitt fält varav det senare flyttas till fältet indirectlyIdentifiedBy @type ”ISBN”.

    Swepub MODS 3.0:
    identifier type="isbn"
    (se avsnitt 5 Resource identifiers & 18.4 Source identifiers)

    Swepub BIBFRAME i JSON:
    identifiedBy @type "ISBN"
    indirectlyIdentifiedBy @type ”ISBN”

  • Enrichment ISBN recovery

    Benämning:
    ISBN tvättat.

    Definition:
    ISBN bör endast innehålla en kod bestående av 10- eller 13-tecken.

    Beskrivning:
    Flaggning för ISBN som har tvättats från ytterligare tecken än ISBN-numret.

    Berikning i Swepub:
    Radering av övriga tecken utöver ISBN-numret, till exempel prefix som ISBN: och suffix som (Print).

    Swepub MODS 3.0:
    identifier type="isbn"
    (se avsnitt 5 Resource identifiers & 18.4 Source identifiers)

    Swepub BIBFRAME i JSON:
    identifiedBy @type "ISBN"
    indirectlyIdentifiedBy @type ”ISBN”

  • Enrichment ISI double

    Benämning:
    ISI ID dubblerat.

    Definition:
    ISI ID bör endast förekomma en gång i en post.

    Beskrivning:
    Flaggning för poster som har tvättats från dubblerade ISI ID.

    Berikning i Swepub:
    Radering av dubblerat ISI ID.

    Swepub MODS 3.0:
    identifier type="isi"
    (se avsnitt 5 Resource identifiers)

    Swepub BIBFRAME i JSON:
    identifiedBy @type "ISI"

  • Enrichment ISI recovery

    Benämning:
    ISI ID tvättat.

    Definition:
    ISI ID bör endast innehålla en kod enligt formatet.

    Beskrivning:
    ISI ID består av kod i format 1) med 15 siffror som börjar med 000 alternativt 2) 15-tecken som börjar med A19 och efterföljs med tecken bestående av stora bokstäver och siffror.

    Flaggning för poster som har tvättats från ytterligare tecken, prefix eller suffix.

    Berikning i Swepub:
    Radering av alla övriga tecken vid ett ISI ID.

    Swepub MODS 3.0:
    identifier type="isi"
    (se avsnitt 5 Resource identifiers)

    Swepub BIBFRAME i JSON:
    identifiedBy @type "ISI"

  • Enrichment ISSN split

    Benämning:
    ISSN separerat.

    Definition:
    ISSN för olika format ska ligga på varsitt fält.

    Beskrivning:
    Flaggning för ISSN som har separerats från ett och samma fält till varsitt fält. 

    Berikning i Swepub:
    Flera ISSN angivna i ett ISSN-fält separeras till var sitt fält varav det senare flyttas till fältet indirectlyIdentifiedBy @type ”ISSN”.

    Swepub MODS 3.0:
    identifier type="issn"
    (se avsnitt 5 Resource identifiers & 18.4 Source identifiers)

    Swepub BIBFRAME i JSON:
    identifiedBy @type "ISSN"
    indirectlyIdentifiedBy @type ”ISSN”

  • Enrichment ISSN recovery

    Benämning:
    ISSN tvättat.

    Definition:
    ISSN bör endast innehålla en kod i format XXXX-XXXX.

    Beskrivning:
    Flaggning för ISSN som har tvättats från ytterligare tecken än ISSN-numret.

    Berikning i Swepub:
    Radering av övriga tecken utöver ISSN-numret, till exempel prefix som ISSN: och suffix som (Print).

    Swepub MODS 3.0:
    identifier type="issn"
    (se avsnitt 18.4 Source identifiers)

    Swepub BIBFRAME i JSON:
    identifiedBy @type "ISSN"
    indirectlyIdentifiedBy @type ”ISSN”

  • Enrichment ORCID extend

    Benämning:
    ORCID formatberikning.

    Definition:
    ORCID börjar alltid med 0000.

    Beskrivning:
    Flaggning för poster som har berikats med en extra 0.

    Berikning i Swepub:
    Berikning med extra 0.

    Swepub MODS:
    name/description type="orcid" (se MODS 2.6 , avsnitt 13.1.2 Person identifier ORCID)
    nameIdentifier type="orcid" (se MODS 3.0, avsnitt 13.1.2 Name identifier )

    Swepub BIBFRAME i JSON:
    identifiedBy @type "ORCID"

  • Enrichment ORCID recovery

    Benämning:
    ORCID tvättat.

    Definition:
    ORCID bör endast innehålla kod i format XXXX-XXXX-XXXX-XXXX samt https-prefix.

    Beskrivning:
    ORCID består av https-prefix och kod i format XXXX-XXXX-XXXX-XXXX.

    Flaggning för poster som har tvättats från ytterligare tecken, prefix eller suffix.

    Berikning i Swepub:
    Radering av alla övriga tecken utöver https-prefix.

    Swepub MODS 3.0:
    name/description type="orcid" (se MODS 2.6 , avsnitt 13.1.2 Person identifier ORCID)
    nameIdentifier type="orcid" (se MODS 3.0, avsnitt 13.1.2 Name identifier )

    Swepub BIBFRAME i JSON:
    identifiedBy @type "ORCID"

  • Enrichment unicode recovery

    Benämning:
    Tecken tvättade.

    Definition:
    Teckenkodning felaktig. Tecken ska vara enligt UTF-8.

    Beskrivning:
    Systemet stödjer endast teckenkodning enligt UTF-8. Flaggning för felaktig teckenkodning, exempelvis HTML.

    Berikning i Swepub:
    Felaktiga unicode-tecken tas bort eller byts ut (\u2044 (fraction slash); \u2013 (en dash)).

    Swepub MODS 3.0:
    Samtliga fält

    Swepub BIBFRAME i JSON:
    Samtliga fält

  • Enrichment auto classify autoclassified

    Benämning:
    Autoklassning.

    Definition:
    Ämnesklassificering på 3-siffernivå enligt Standard för svensk indelning av forskningsämnen 2011 tillagd om saknas.

    Beskrivning:
    Om ämnesklassificering på minst 3-siffernivån enligt Standard för svensk indelning av forskningsämnen 2011 saknas, läggs det till utifrån ett resultat av algoritmen för textanalys som baseras på abstract, nyckelord och titel.

    Flaggning då ämnesklassificeringen på 3-siffernivå har lagts till.

    Berikning i Swepub:
    Berikning utifrån algoritm om abstract finns angivet.

    Swepub MODS 3.0:
    subject/topic (se MODS 3.0, 8.1 Subject classification according to Swedish research subjects standard)

    Swepub BIBFRAME i JSON:
    subject @type "Topic"

Normaliseringsflaggor

  • Normalization DOI prefix (add & update)

    Benämning:
    DOI normaliserat.

    Definition:
    DOI bör länka direkt till resursen som http-URI.

    Beskrivning:
    DOI består av https-prefix och kod som börjar med prefix doi.org. Prefixet doi.org ersätter dx som prefix. DOI som http-URI stödjer länkade data.

    Normalisering i Swepub:
    Berikning med https-prefix, alla dx-prefix byts mot doi.org-prefix.

    Swepub MODS 3.0:
    identifier type="doi"
    (se avsnitt 5 Resource identifiers & 18.4 Source identifiers)

    Swepub BIBFRAME i JSON:
    identifiedBy @type "DOI"

  • Normalization freetext strip tags & clean text

    Benämning:
    Fritext tvättad.

    Definition:
    Fritextfält bör inte innehålla annan teckenkodning än UTF-8.

    Beskrivning:
    Flaggning för fritextfält som har tvättats från html-taggar.

    Normalisering i Swepub:
    Radering av html-taggar.

    Swepub MODS 3.0:
    Samtliga abstract-, note- och title-element.

    Swepub BIBFRAME i JSON:
    Samtliga summary-, hasNote- och hasTitle-element

  • Normalization ISBN format

    Benämning:
    ISBN normaliserat.

    Definition:
    ISBN normaliseras till att bestå endast av siffror och stort X.

    Beskrivning:
    ISBN består av 10-13 tecken varav mestadels är siffror förutom det sista tecknet vid 10-siffriga som kan vara X. Siffrorna är uppdelade i grupper som kan vara åtskilda med bindestreck eller mellanrum. Katalogiseringspraxis är att ange ISBN utan streck.

    Normalisering i Swepub:
    Radering av bindestreck, ersättning av ett litet x mot stort X

    Swepub MODS 3.0:
    identifier type="isbn"
    (se avsnitt 5 Resource identifiers & 18.4 Source identifiers)

    Swepub BIBFRAME i JSON:
    identifiedBy @type "ISBN"

  • Normalization ISI capitalize

    Benämning:
    ISI ID normaliserat.

    Definition:
    ISI ID normaliseras med stora bokstäver.

    Beskrivning:
    ISI ID som består av 15-tecken och börjar med A19 normaliseras med stora bokstäver.  

    Normalisering i Swepub:
    Ersättning av små bokstäver mot stora.

    Swepub MODS 3.0:
    identifier type="isi"
    (se avsnitt 5 Resource identifiers)

    Swepub BIBFRAME i JSON:
    identifiedBy @type "ISI"

  • Normalization ISSN format

    Benämning:
    ISSN normaliserat

    Definition:
    ISSN normaliseras till att bestå endast av siffror och stort X

    Beskrivning:
    ISSN består av 8 tecken i siffror 0-9 varav det sista kan även vara X. Skiljs med bindestreck i två 4-teckenblock. Katalogiseringspraxis är att ange ISSN med streck.

    Normalisering i Swepub:
    Berikning med bindestreck, ersättning av ett litet x mot stort X.

    Swepub MODS 3.0:
    identifier type="issn"
    (se avsnitt 18.4 Source identifiers)

    Swepub BIBFRAME i JSON:
    identifiedBy @type "ISSN"

  • Normalization ORCID format delimiters & prefix (add & update)

    Benämning:
    ORCID normaliserat.

    Definition:
    ORCID består av https-prefix samt kod i format XXXX-XXXX-XXXX-XXXX.

    Beskrivning:
    ORCID ska bestå av 16 tecken som skiljs med bindestreck i fyra 4-teckenblock. Det sista tecknet är kontrollkod som kan vara 0-9 eller X. Enligt ORCID bör ORCID-ID anges med https-prefix för att underlätta direkt åtkomst till personposten. Flaggning för ORCID som har normaliserats med bindestreck, https-prefix och stora bokstäver.

    Normalisering i Swepub:
    Berikning med bindestreck och https-prefix. Http-prefix byts mot https. Små bokstäver byts mot stora.

    Swepub MODS 3.0:
    name/description type="orcid" (se MODS 2.6 , avsnitt 13.1.2 Person identifier ORCID)
    nameIdentifier type="orcid" (se MODS 3.0, avsnitt 13.1.2 Name identifier )

    Swepub BIBFRAME i JSON:
    identifiedBy @type "ORCID"

Tyck till

Hjälpte den här sidan dig?