fullskärmsbild

Uppmärknings­flaggor

I Swepub finns ett flertal så kallade flaggningar som används för att märka upp poster som har blivit ändrade eller som inte har blivit validerade enligt definierade systemregler.

Syftet med flaggningar är att uppmärksamma ofullständigheter och ändringar i data. Uppmärkningen förutsätter att posterna uppfyller den bibliografiska miniminivån i Swepub.

Uppmärkningsflaggorna består av fyra typer av flaggor:

  • Valideringsflaggor
  • Motstridighetsflaggor
  • Berikningsflaggor
  • Normaliseringsflaggor

Valideringsflaggor

Valideringsflaggorna används för att märka upp data som har gått att varken validera eller berika. Här ingår felaktigheter i format och dubblerade, ogiltiga eller saknade värden som kan påverka uttag på kvalitetssäkrade data för analyser, statistik och uppföljningar. Det finns följande typer av valideringsflaggor:

  • Formatfel: Syntaktiskt fel i formateringen av värdet.
  • Kontrollkod fel: Värdet för checksum är felaktigt.
  • Ogiltigt: Värdet går inte att verifiera hos en auktoriserad datakälla.

Data markerade med valideringsflaggor bör kontrolleras och åtgärdas i den lokala publikationsdatabasen om tillämpligt. I vissa fall går det inte att åtgärda. Om en identifikator anges felaktigt i själva outputen, bör dessa dock markeras som ogiltiga vid registreringen.

Motstridighetsflaggor

Motstridighetsflaggorna används för att märka upp data när flera fält korrelerar med varandra men innehåller motstridiga eller oförväntade data. Här ingår motstridigheter i antalet upphovspersoner, dubbla förekomst av samma upphovsperson, saknade ISSN-nummer och ämnesklassificeringar. Det finns följande typer av motstridighetsflaggor:

  • Dubblering: Samma värde upprepas.
  • Motstridighet: Värden korrelerar inte med varandra som förväntat.
  • Saknat värde: Förväntat värde saknas.

Data markerade med motstridighetsflaggor bör kontrolleras och åtgärdas i den lokala publikationsdatabasen om tillämpligt.

Berikningsflaggor

Berikningsflaggorna används för att märka upp data som har fått ett nytt värde i Swepub. Här ingår data som inte har gått att validera före berikningen. Tillägg och ändringarna har gjorts i Swepubsystemet för att höja datakvaliteten. Det finns följande typer av berikningsflaggor:

  • Separering: Ett värde har separerats från ett annat och flyttats till ett eget fält.
  • Tillägg: Ett värde har lagts till.
  • Tvätt: Värdet har tvättats från ogiltiga tecken.
  • Flytt: Ett ogiltigt värde har flyttats till ett annat fält eller censurerats.

Data markerade med berikningsflaggor bör kontrolleras och återkopplas till den ursprungliga posten vid datakällan, den lokala publikationsdatabasen, om tillämpligt.

Normaliseringsflaggor

Normaliseringsflaggorna används för att märka upp data som har normaliserats för att skapa konsekvens för hur data presenteras. Dessa flaggor används för information om datahanteringen i Swepubsystemet och behöver inte åtgärdas i de lokala publikationsdatabaserna. Därmed synliggörs normaliseringar inte i gränssnittet för Databearbetning.

Så beskrivs uppmärkningsflaggorna:

Här visas hur tabellerna för uppmärkningsflaggorna är strukturerade.

Benämning

Motsvarande svensk benämning för uppmärkningsflaggan.

Definition

En kort förklaring till uppmärkningsflaggan.

Extern källa

Den datakälla som används för verifiering eller berikning av ett värde.

Beskrivning

En skildring av vad som avses.

Validering i Swepub

En redogörelse för hur valideringsregeln fungerar i Swepub.

Berikning i Swepub

En redogörelse för hur berikningsregeln fungerar i Swepub.

Normalisering i Swepub

En redogörelse för hur normaliseringregeln fungerar i Swepub.

Swepub MODS

Hänvisning till elementen i överföringsformatspecifikationen där korrekt sätt att ange data är beskrivet i kodexempel.

Swepub BIBFRAME i JSON

Hänvisning till elementen i Swepubs format för datamodellen.

Valideringsflaggor

  • Validation DOI format

    Benämning:
    DOI formatfel.

    Definition:
    DOI felskrivet. DOI börjar alltid med 10. utöver https-prefix.

    Beskrivning:
    DOI består av prefix 10. med efterföljande kod för registrator och eventuell subdivision till denna samt av suffix som är unik i förhållande till registratorkoden. Suffix kan bestå av en sekventiell nummerserie eller en identifikator som ISBN, ISSN och ISNI. Längden och tecken kan variera.

    Flaggning för DOI som inte följer format eller som innehåller en annan prefix än https://doi.org/ eller suffix.

    Validering i Swepub:
    Validering av format utifrån regeln att 10. ska finnas med.

    Swepub MODS 3.0:
    identifier type="doi"
    (se avsnitt 5 Resource identifiers & 18.4 Source identifiers)

    Swepub BIBFRAME i JSON:
    identifiedBy @type "DOI"

  • Validation DOI remote


    Benämning:
    DOI ogiltigt.

    Definition:
    DOI går inte att verifiera mot Crossref eller shortDOI service.

    Extern datakälla:
    Crossref & shortDOI service.

    Beskrivning:
    Om det angivna DOI inte matchas mot DOI i Crossref eller shortDOI, markeras detta som ogiltigt.

    Validering i Swepub:
    Verifiering av DOI mot Crossref & shortDOI service.

    Swepub MODS 3.0:
    identifier type="doi"
    (se avsnitt 5 Resource identifiers & 18.4 Source identifiers)

    Swepub BIBFRAME i JSON:
    identifiedBy @type "DOI"

  • Validation ISBN format

    Benämning:
    ISBN formatfel.

    Definition:
    ISBN felskrivet. ISBN börjar antingen med 978 eller landskod och skrivs enbart som kod i 10 eller 13 siffror.

    Beskrivning:
    ISBN består av 10-13 siffror. Siffrorna är uppdelade i fem grupper enligt följande: 

    1.  Prefix (978)
    2.  Områdesbeteckning (t.ex. 91=Sverige)
    3.  Förlagsbeteckning
    4.  Titelbeteckning 
    5.  Kontrollkod (1-9 eller även X vid 10-siffriga)
    6. Grupperna kan vara åtskilda med bindestreck eller mellanslag och totalt bestå av upp till 17 tecken för 13-siffriga ISBN eller 13 för 10-siffriga. 

    Flaggning för ISBN som inte följer format eller som innehåller prefix eller suffix.

    Validering i Swepub:
    Kontroll att ISBN enbart består av antingen 13 siffror i max 5 grupper och börjar med 978 eller 10 siffror i max 4 grupper som slutar med siffror 0-9 eller ett stort X.

    Swepub MODS 3.0:
    identifier type="isbn"
    (se avsnitt 5 Resource identifiers & 18.4 Source identifiers)

    Swepub BIBFRAME i JSON:
    identifiedBy @type "ISBN"
    indirectlyIdentifiedBy @type ”ISBN”

  • Validation ISBN checksum

    Benämning:
    ISBN kontrollkod fel.

    Definition:
    ISBN kontrollkod felaktig. Den sista siffran för ISBN-numret ska returnera korrekt kontrollkod.

    Beskrivning:
    ISBN består av 10-13 siffror varav den sista är kontrollkod (checksum). Kontrollkoden kan vara 0-9 vid 13-siffriga och även X vid 10-siffriga. Den räknas utifrån de föregående siffrorna i ISBN-numret. Om kalkyleringen returnerar fel siffra för kontrollkoden, är ISBN-numret inte giltigt.

    Flaggning för ISBN med felaktig kontrollkod.

    Validering i Swepub:
    Validering utifrån respektive algoritmen för kontrollkoden.

    Swepub MODS 3.0:
    identifier type="isbn"
    (se avsnitt 5 Resource identifiers & 18.4 Source identifiers)

    Swepub BIBFRAME i JSON:
    identifiedBy @type "ISBN"
    indirectlyIdentifiedBy @type ”ISBN”

  • Validation ISI format

    Benämning:
    ISI ID formatfel.

    Definition:
    ISI ID felskrivet. ISI ID skrivs antingen 1) med 15 siffror som börjar med 000, 2) 15 tecken som börjar med A19 och efterföljs med tecken bestående av stora bokstäver och siffror.

    Beskrivning:
    ISI ID/UT-nummer/WoS ID från databasen Web of Science ska anges som kod med 15 tecken. 

    Flaggning för ISI ID som inte följer formatet eller som innehåller prefix eller suffix.

    Validering i Swepub:
    Validering av format enligt definitionen.

    Swepub MODS 3.0:
    identifier type="isi"
    (se avsnitt 5 Resource identifiers)

    Swepub BIBFRAME i JSON:
    identifiedBy @type "ISI"

  • Validation ISSN format

    Benämning:
    ISSN formatfel.

    Definition:
    ISSN felskrivet. ISSN skrivs enbart som kod i format XXXX-XXXX.

    Beskrivning:
    ISSN ska bestå av 8 siffror varav det sista kan även vara X. Skiljs med bindestreck i två 4-sifferblock. 

    Flaggning av ISSN som inte följer format eller som innehåller prefix eller suffix.

    Validering i Swepub:
    Kontroll på 8 siffror separerade i två 4-sifferblock med streck samt kontroll av att sista tecknet är 0-9 eller stort X.

    Swepub MODS 3.0:
    identifier type="issn"
    (se avsnitt 18.4 Source identifiers)

    Swepub BIBFRAME i JSON:
    identifiedBy @type "ISSN"
    indirectlyIdentifiedBy @type ”ISSN”

  • Validation ISSN checksum

    Benämning:
    ISSN kontrollkod fel.

    Definition:
    ISSN kontrollkod felaktig. Den sista siffran för ISSN-numret ska returnera korrekt kontrollkod.

    Beskrivning:
    ISSN består av 8 siffror varav den sista är kontrollkod (checksum). Kontrollkoden kan vara 0-9 eller X och räknas utifrån de föregående siffrorna i ISSN-numret. Om kalkyleringen returnerar fel siffra för kontrollkoden, är ISSN-numret inte giltigt.

    Flaggning för ISSN med felaktig kontrollkod.

    Validering i Swepub:
    Validering utifrån algoritmen för kontrollkoden.

    Swepub MODS 3.0:
    identifier type="issn"
    (se avsnitt 18.4 Source identifiers)

    Swepub BIBFRAME i JSON:
    identifiedBy @type "ISSN"
    indirectlyIdentifiedBy @type ”ISSN”

  • Validation ISSN remote


    Benämning:
    ISSN ogiltigt.

    Definition:
    ISSN går inte att verifiera mot ISSN portalen.

    Extern datakälla:
    ISSN Portal.

    Beskrivning:
    Om det angivna ISSN inte matchas mot ISSN i ISSN portalen, markeras detta som ogiltigt.

    Validering i Swepub:
    Verifiering av ISSN mot ISSN portalen.

    Swepub MODS 3.0:
    identifier type="issn"
    (se avsnitt 18.4 Source identifiers)

    Swepub BIBFRAME i JSON:
    identifiedBy @type "ISSN"
    indirectlyIdentifiedBy @type ”ISSN”

  • Validation ORCID format

    Benämning:
    ORCID formatfel.

    Definition:
    ORCID felskrivet. ORCID skrivs enbart som kod i format XXXX-XXXX-XXXX-XXXX.

    Beskrivning:
    ORCID ska bestå av 16 tecken i siffror 0-9 varav det sista kan även vara X. Skiljs med bindestreck i fyra 4-teckenblock.

    Flaggning för ORCID som inte följer formatet eller som innehåller prefix eller suffix.

    Validering i Swepub:
    Validering av format enligt definitionen.

    Swepub MODS:
    name/description type="orcid" (se MODS 2.6 , avsnitt 13.1.2 Person identifier ORCID)
    nameIdentifier type="orcid" (se MODS 3.0, avsnitt 13.1.2 Name identifier )

    Swepub BIBFRAME i JSON:
    identifiedBy @type "ORCID"

  • Validation ORCID checksum

    Benämning:
    ORCID kontrollkod fel.

    Definition:
    ORCID kontrollkod felaktig. Den sista siffran för ORCID ska returnera korrekt kontrollkod.

    Beskrivning:
    ORCID består av 16 siffror varav den sista är kontrollkod (checksum). Kontrollkoden kan vara 0-9 eller X och räknas utifrån de föregående siffrorna i ORCID-numret. Om kalkyleringen returnerar fel siffra för kontrollkoden, är ORCID-numret inte giltigt.

    Flaggning för ORCID med felaktig kontrollkod.

    Validering i Swepub:
    Validering utifrån algoritmen för kontrollkoden  ISO/IEC 7064:2003 MOD 11-2.

    Swepub MODS:
    name/description type="orcid" (se MODS 2.6 , avsnitt 13.1.2 Person identifier ORCID)
    nameIdentifier type="orcid" (se MODS 3.0, avsnitt 13.1.2 Name identifier )

    Swepub BIBFRAME i JSON:
    identifiedBy @type "ORCID"

  • Validation ORCID span

    Benämning:
    ORCID spannfel.

    Definition:
    ORCID spann felaktig. ORCID formatet ska vara enligt ISO 27729.

    Beskrivning:
    ORCID följer ISNI-standarden ISO 27729.

    Flaggning för ORCID som inte följer standarden.

    Validering i Swepub:
    Kontroll på 16 tecken inom spannet för ISO 27729.

    Swepub MODS:
    name/description type="orcid" (se MODS 2.6 , avsnitt 13.1.2 Person identifier ORCID)
    nameIdentifier type="orcid" (se MODS 3.0, avsnitt 13.1.2 Name identifier )

    Swepub BIBFRAME i JSON:
    identifiedBy @type "ORCID"

  • Validation UKA format

    Benämning:
    SSIF formatfel.

    Definition:
    Ämnesklassificering enligt Standard för svensk indelning av forskningsämnen 2011 (SSIF) felkodad.

    Beskrivning:
    Forskningsämnet anges i sifferkoder enligt SSIF.

    Flaggning då ämnesklassificeringen inte följer den korrekta kodningen.

    Validering i Swepub:
    Verifiering av ämneskoden.

    Swepub MODS:
    subject/topic 
    (se avsnitt 8.1 Subject classification according to Swedish research subjects standard)

    Swepub BIBFRAME i JSON:
    subject

  • Validation unicode

    Benämning:
    Teckenfel.

    Definition:
    Teckenkodning felaktig. Tecken ska vara enligt UTF-8.

    Beskrivning:
    Systemet stödjer endast teckenkodning enligt UTF-8.

    Flaggning för felaktig teckenkodning, exempelvis HTML.

    Validering i Swepub:
    Validering av tecken i identifikatorer som ska vara inom ASCII 128.

    Swepub MODS 3.0:
    identifier
    (se avsnitt 5 Resource identifiers & 18.4 Source identifiers)

    Swepub BIBFRAME i JSON:
    identifiedBy

  • Validation creatorCount numeric

    Benämning:
    Upphovsantal formatfel.

    Definition:
    Totalt antal upphovspersoner felformaterat. Antal upphovspersoner (creator count) måste anges som ett numeriskt antal.

    Beskrivning:
    Flaggning då totalt antal upphovspersoner inte finns angivet som ett numeriskt värde.

    Validering i Swepub:
    Verifiering av fältets numeriska värde.

    Swepub MODS 3.0:
    note type="creatorCount"
    (se avsnitt, 14 Creator count)

    Swepub BIBFRAME i JSON:
    hasNote @type "CreatorCount"

  • Validation publication year format

    Benämning:
    Utgivningsdatum formatfel.

    Definition:
    Utgivningdatum felskrivet. Utgivningsdatum anges enligt ISO 8601 i format YYYY för årtal och YYYY-MM-DD för datum.

    Beskrivning:
    Utgivningsdatum ska anges som 4-siffrigt årtal i format YYYY för årtal och 8-siffrigt datum i format YYYY-MM-DD enligt standarden ISO 8601.

    Flaggning om fältet för utgivningsdatum innehåller annat än datum eller årtal. 

    Validering i Swepub:
    Kontroll på att elementet innehåller årtal i format YYYY eller datum i format YYYY-MM-DD.

    Swepub MODS 3.0:
    dateIssued
    (se avsnitt 17.1 Publication date)

    Swepub BIBFRAME i JSON:
    date

Motstridighetsflaggor

  • Audit UKA comprehensive check invalid

    Benämning:
    UKÄ ofullständig.

    Definition:
    Ämnesklassificering enligt Standard för svensk indelning av forskningsämnen 2011 (SSIF) på för övergripande nivå. Åtminstone en ämnesklassificering enligt standarden bör vara angiven på minst 3-siffernivå. Benämningen härrör från Universitetskanslersämbetet (UKÄ) som tillsammans med Statistiska Centralbyrån (SCB) förvaltar standarden. 

    Beskrivning:
    Forskningsämnet anges enligt SSIF som består av tre nivåer: högsta (forskningsämnesområde på 1-siffernivå), mellersta (forskningsämnesgrupp på 3-siffernivå) och lägsta (forskningsämne på 5-siffernivå). Åtminstone en ämnesklassificering bör ligga på minst 3-siffernivån.

    Flaggning då ämnesklassificeringen har angetts enbart på 1-siffernivån.

    Validering i Swepub:
    Verifiering av ämneskoden.

    Swepub MODS 3.0:
    subject/topic (se avsnitt 8.1 Subject classification according to Swedish research subjects standard)

    Swepub BIBFRAME i JSON:
    subject

  • Audit contributor duplicate check invalid

    Benämning:
    Upphov dubblerat.

    Definition:
    Dubbel angivelse av samma upphovsperson. En upphovsperson bör vara registrerad enbart en gång för samma roll.

    Beskrivning:
    Upphovsperson anges endast en gång för samma roll när författarskap respektive redaktörskap beskrivs.

    Flaggning då en person är angiven flera gånger med samma roll.

    Validering i Swepub:
    Dubblettkontroll utifrån namn och personID tillsammans med roll.

    Swepub MODS 3.0:
    name/namePart (se avsnitt 13.1.1 Name Part)
    role/roleTerm (se avsnitt 13.1.6.1 Role Term)

    Swepub BIBFRAME i JSON:
    contribution @type "Contribution"
    agent

    role

  • Audit ISSN missing check invalid


    Benämning:
    ISSN saknas.

    Definition:
    ISSN saknas. ISSN borde vara angiven för artiklar publicerade i tidskrift.

    Beskrivning:
    Flaggning för saknade ISSN för publicerade verk angivna som Artikel i vetenskaplig tidskrift, Artikel i övriga tidskrifter, Artikel i dags/nyhetstidning, Special-/temanummer av tidskrift.

    Validering i Swepub:
    Validering utifrån angiven outputtyp alternativt publikationstyp samt publiceringsstatus.

    Swepub MODS 3.0:
    identifier type="issn" (se avsnitt 18.4 Source identifiers)
    genre type="outputType" alt. "publicationType" (se avsnitt 10 Resource type)

    note type="publicationStatus" (se avsnitt 12 Publication status)

    Swepub BIBFRAME i JSON:
    identifiedBy @type "ISSN"
    indirectlyIdentifiedBy @type ”ISSN”

    genreForm

    hasNote @type "PublicationStatus"


  • Audit creator count check invalid

    Benämning:
    Upphovsantal motstridigt.

    Definition:
    Totalt antal upphovspersoner stämmer inte. Det numeriska antalet upphovspersoner kan inte vara mindre än antalet angivna namn på upphovspersoner.

    Beskrivning:
    Flaggning då antalet angivna namn på upphovspersoner i förhållande till författarskap respektive redaktörskap överstiger det numeriska värdet för totalt antal upphovspersoner (creator count).

    Validering i Swepub:
    Jämförelse mellan det numeriska värdet i totalt antal upphovspersoner och angivna namn utifrån rollerna "aut" och "cre". Jämförelse mellan det numeriska värdet i totalt antal upphovspersoner och angivna namn utifrån rollen "edt" för samlingsverk och proceedings samt även rapporter om det inte finns andra namn angivna med rollerna "aut" och "cre".

    Swepub MODS 3.0:
    note type="creatorCount"
    (se avsnitt, 14 Creator count)

    Swepub BIBFRAME i JSON:
    hasNote @type "CreatorCount"

Berikningsflaggor

  • Enrichment DOI recovery

    Benämning:
    DOI tvättat.

    Definition:
    DOI bör endast innehålla kod som börjar med 10. samt https-prefix.

    Beskrivning:
    DOI består av https-prefix och kod som börjar med 10.

    Flaggning för poster som har tvättats från ytterligare tecken, prefix eller suffix.

    Berikning i Swepub:
    Radering av alla övriga tecken före 10. utöver https-prefix.

    Swepub MODS 3.0:
    identifier type="doi"
    (se avsnitt 5 Resource identifiers & 18.4 Source identifiers)

    Swepub BIBFRAME i JSON:
    identifiedBy @type "DOI"

  • Enrichment DOI incorrectlyIdentifiedBy

    Benämning:
    DOI flyttat till fältet incorrectlyIdentifiedBy.

    Definition:
    Ett ogiltigt DOI bör vara uppmärkt som ”invalid”.

    Beskrivning:
    DOI som är kända att vara ogiltiga bör vara angivna som sådana.

    Flaggning för DOI som har flyttats till fältet incorrectlyIdentifiedBy.

    Berikning i Swepub:
    Ogiltigt DOI flyttas till fältet incorrectlyIdentifiedBy.

    Swepub MODS 3.0:
    identifier type="doi"
    (se avsnitt 5 Resource identifiers & 18.4 Source identifiers)

    Swepub BIBFRAME i JSON:
    incorrectlyIdentifiedBy @type ”DOI”

  • Enrichment ISBN split

    Benämning:
    ISBN separerat.

    Definition:
    ISBN för olika format ska ligga på varsitt fält.

    Beskrivning:
    Flaggning för ISBN som har separerats från ett och samma fält till varsitt fält. 

    Berikning i Swepub:
    Flera ISBN angivna i ett ISBN-fält separeras till var sitt fält varav det senare flyttas till fältet indirectlyIdentifiedBy @type ”ISBN”.

    Swepub MODS 3.0:
    identifier type="isbn"
    (se avsnitt 5 Resource identifiers & 18.4 Source identifiers)

    Swepub BIBFRAME i JSON:
    identifiedBy @type "ISBN"
    indirectlyIdentifiedBy @type ”ISBN”

  • Enrichment ISBN recovery

    Benämning:
    ISBN tvättat.

    Definition:
    ISBN bör endast innehålla en kod bestående av 10- eller 13-tecken.

    Beskrivning:
    Flaggning för ISBN som har tvättats från ytterligare tecken än ISBN-numret.

    Berikning i Swepub:
    Radering av övriga tecken utöver ISBN-numret, till exempel prefix som ISBN: och suffix som (Print).

    Swepub MODS 3.0:
    identifier type="isbn"
    (se avsnitt 5 Resource identifiers & 18.4 Source identifiers)

    Swepub BIBFRAME i JSON:
    identifiedBy @type "ISBN"
    indirectlyIdentifiedBy @type ”ISBN”

  • Enrichment ISI double

    Benämning:
    ISI ID dubblerat.

    Definition:
    ISI ID bör endast förekomma en gång i en post.

    Beskrivning:
    Flaggning för poster som har tvättats från dubblerade ISI ID.

    Berikning i Swepub:
    Radering av dubblerat ISI ID.

    Swepub MODS 3.0:
    identifier type="isi"
    (se avsnitt 5 Resource identifiers)

    Swepub BIBFRAME i JSON:
    identifiedBy @type "ISI"

  • Enrichment ISBN incorrectlyIdentifiedBy.

    Benämning:
    ISBN flyttat till fältet incorrectlyIdentifiedBy.

    Definition:
    Ett ogiltigt ISBN bör vara uppmärkt som ”invalid”.

    Beskrivning:
    ISBN som är kända att vara ogiltiga bör vara angivna som sådana.

    Flaggning för ogiltiga ISBN som har flyttats till fältet incorrectlyIdentifiedBy.

    Berikning i Swepub:
    Ogiltigt ISBN flyttas till fältet incorrectlyIdentifiedBy.

    Swepub MODS 3.0:
    identifier type="isbn"
    (se avsnitt 5 Resource identifiers & 18.4 Source identifiers)

    Swepub BIBFRAME i JSON:
    identifiedBy @type "ISBN"
    incorrectlyIdentifiedBy @type ”ISBN”

  • Enrichment ISI recovery

    Benämning:
    ISI ID tvättat.

    Definition:
    ISI ID bör endast innehålla en kod enligt formatet.

    Beskrivning:
    ISI ID består av kod i format 1) med 15 siffror som börjar med 000 alternativt 2) 15-tecken som börjar med A19 och efterföljs med tecken bestående av stora bokstäver och siffror.

    Flaggning för poster som har tvättats från ytterligare tecken, prefix eller suffix.

    Berikning i Swepub:
    Radering av alla övriga tecken vid ett ISI ID.

    Swepub MODS 3.0:
    identifier type="isi"
    (se avsnitt 5 Resource identifiers)

    Swepub BIBFRAME i JSON:
    identifiedBy @type "ISI"

  • Enrichment ISI incorrectlyIdentifiedBy.

    Benämning:
    ISI ID flyttat till fältet incorrectlyIdentifiedBy.

    Definition:
    Ett ogiltigt ISI ID bör vara uppmärkt som ”invalid”.

    Beskrivning:
    ISI ID som är kända att vara ogiltiga bör vara angivna som sådana.

    Flaggning för ogiltiga ISI ID som har flyttats till fältet incorrectlyIdentifiedBy.

    Berikning i Swepub:
    Ogiltigt ISI ID flyttas till fältet incorrectlyIdentifiedBy.

    Swepub MODS 3.0:
    identifier type="isi"
    (se avsnitt 5 Resource identifiers)

    Swepub BIBFRAME i JSON:
    identifiedBy @type "ISI"
    incorrectlyIdentifiedBy @type ”ISI”

  • Enrichment ISSN split

    Benämning:
    ISSN separerat.

    Definition:
    ISSN för olika format ska ligga på varsitt fält.

    Beskrivning:
    Flaggning för ISSN som har separerats från ett och samma fält till varsitt fält. 

    Berikning i Swepub:
    Flera ISSN angivna i ett ISSN-fält separeras till var sitt fält varav det senare flyttas till fältet indirectlyIdentifiedBy @type ”ISSN”.

    Swepub MODS 3.0:
    identifier type="issn"
    (se avsnitt 5 Resource identifiers & 18.4 Source identifiers)

    Swepub BIBFRAME i JSON:
    identifiedBy @type "ISSN"
    indirectlyIdentifiedBy @type ”ISSN”

  • Enrichment ISSN recovery

    Benämning:
    ISSN tvättat.

    Definition:
    ISSN bör endast innehålla en kod i format XXXX-XXXX.

    Beskrivning:
    Flaggning för ISSN som har tvättats från ytterligare tecken än ISSN-numret.

    Berikning i Swepub:
    Radering av övriga tecken utöver ISSN-numret, till exempel prefix som ISSN: och suffix som (Print).

    Swepub MODS 3.0:
    identifier type="issn"
    (se avsnitt 18.4 Source identifiers)

    Swepub BIBFRAME i JSON:
    identifiedBy @type "ISSN"
    indirectlyIdentifiedBy @type ”ISSN”

  • Enrichment ISSN incorrectlyIdentifiedBy.

    Benämning:
    ISSN flyttat till fältet incorrectlyIdentifiedBy.

    Definition:
    Ett ogiltigt ISSN bör vara uppmärkt som ”invalid”.

    Beskrivning:
    ISSN som är kända att vara ogiltiga bör vara angivna som sådana.

    Flaggning för ogiltiga ISSN som har flyttats till fältet incorrectlyIdentifiedBy.

    Berikning i Swepub:
    Ogiltigt ISSN flyttas till fältet incorrectlyIdentifiedBy.

    Swepub MODS 3.0:
    identifier type="issn"
    (se avsnitt 18.4 Source identifiers)

    Swepub BIBFRAME i JSON:
    identifiedBy @type "ISSN"
    incorrectlyIdentifiedBy @type ”ISSN”

  • Enrichment ORCID extend

    Benämning:
    ORCID formatberikning.

    Definition:
    ORCID börjar alltid med 0000.

    Beskrivning:
    Flaggning för poster som har berikats med en extra 0.

    Berikning i Swepub:
    Berikning med extra 0.

    Swepub MODS:
    name/description type="orcid" (se MODS 2.6 , avsnitt 13.1.2 Person identifier ORCID)
    nameIdentifier type="orcid" (se MODS 3.0, avsnitt 13.1.2 Name identifier )

    Swepub BIBFRAME i JSON:
    identifiedBy @type "ORCID"

  • Enrichment ORCID recovery

    Benämning:
    ORCID tvättat.

    Definition:
    ORCID bör endast innehålla kod i format XXXX-XXXX-XXXX-XXXX samt https-prefix.

    Beskrivning:
    ORCID består av https-prefix och kod i format XXXX-XXXX-XXXX-XXXX.

    Flaggning för poster som har tvättats från ytterligare tecken, prefix eller suffix.

    Berikning i Swepub:
    Radering av alla övriga tecken utöver https-prefix.

    Swepub MODS 3.0:
    name/description type="orcid" (se MODS 2.6 , avsnitt 13.1.2 Person identifier ORCID)
    nameIdentifier type="orcid" (se MODS 3.0, avsnitt 13.1.2 Name identifier )

    Swepub BIBFRAME i JSON:
    identifiedBy @type "ORCID"

  • Enrichment ORCID removed

    Benämning:
    ORCID avlägsnad.

    Definition:
    Endast giltiga ORCID-ID ska anges som ORCID.

    Beskrivning:
    Om andra personuppgifter än ORCID har felaktigt angetts som ORCID behöver dessa avlägsnas från utgående data.

    Flaggning för ogiltiga värden angivna som ORCID som har censurerats från Swepub-data.

    Berikning i Swepub:
    Ogiltigt ORCID censureras.

    Swepub MODS:
    name/description type="orcid" (se MODS 2.6 , avsnitt 13.1.2 Person identifier ORCID)
    nameIdentifier type="orcid" (se MODS 3.0, avsnitt 13.1.2 Name identifier )

    Swepub BIBFRAME i JSON:
    identifiedBy @type "ORCID"

  • Enrichment unicode recovery

    Benämning:
    Tecken tvättade.

    Definition:
    Teckenkodning felaktig. Tecken ska vara enligt UTF-8.

    Beskrivning:
    Systemet stödjer endast teckenkodning enligt UTF-8. Flaggning för felaktig teckenkodning, exempelvis HTML.

    Berikning i Swepub:
    Felaktiga unicode-tecken tas bort eller byts ut (\u2044 (fraction slash); \u2013 (en dash)).

    Swepub MODS 3.0:
    Samtliga fält

    Swepub BIBFRAME i JSON:
    Samtliga fält

  • Enrichment auto classify autoclassified

    Benämning:
    Autoklassning.

    Definition:
    Ämnesklassificering på 3-siffernivå enligt Standard för svensk indelning av forskningsämnen 2011 tillagd om saknas.

    Beskrivning:
    Om ämnesklassificering på minst 3-siffernivån enligt Standard för svensk indelning av forskningsämnen 2011 saknas, läggs det till utifrån ett resultat av algoritmen för textanalys som baseras på abstract, nyckelord och titel.

    Flaggning då ämnesklassificeringen på 3-siffernivå har lagts till.

    Berikning i Swepub:
    Berikning utifrån algoritm om abstract finns angivet. Berikningen görs på poster med abstract, nyckelord och titel från och med 2010 som har engelska eller svenska angiven som språk. Om det finns flera förslag på autoklassning, läggs till tre första förslag med mest poäng.

    Swepub MODS 3.0:
    subject/topic (se MODS 3.0, 8.1 Subject classification according to Swedish research subjects standard)

    Swepub BIBFRAME i JSON:
    subject

  • Enrichment add_oa add_oa

    Benämning:
    Öppen tillgång berikning.

    Definition:
    Information om länk till fulltext, villkor för åtkomst och datakälla för berikningen tillagd.

    Extern datakälla:
    Unpaywall och Directory of Open Access Books.

    Beskrivning:
    Om DOI eller övriga uppgifter om en output matchar data hos de externa datakällorna Unpaywall och Directory of Open Access Books (DOAB) berikas posterna i Swepub med länk till fulltext, information om fulltexten är öppet tillgänglig eller prenumerationsbaserad och datakälla som informationen har hämtats från.

    Flaggning då information om åtkomst har lagts till.

    Berikning i Swepub:
    Berikningen görs på poster med DOI eller ISBN som får träff mot data som har hämtats från de externa datakällorna Unpaywall och DOAB. Länk till fulltext, villkor för åtkomst och datakälla läggs till.

    Swepub MODS 3.0:
    Berikningen sker endast i Swepub BIBFRAME.

    Swepub BIBFRAME i JSON:
    electronicLocator

Normaliseringsflaggor

  • Normalization DOI prefix (add & update)

    Benämning:
    DOI normaliserat.

    Definition:
    DOI bör länka direkt till resursen som https-URI.

    Beskrivning:
    DOI består av https-prefix och kod som börjar med prefix doi.org. Prefixet doi.org ersätter dx som prefix. DOI som https-URI stödjer länkade data.

    Normalisering i Swepub:
    Berikning med https-prefix, alla dx-prefix byts mot doi.org-prefix.

    Swepub MODS 3.0:
    identifier type="doi"
    (se avsnitt 5 Resource identifiers & 18.4 Source identifiers)

    Swepub BIBFRAME i JSON:
    identifiedBy @type "DOI"

  • Normalization freetext strip tags & clean text

    Benämning:
    Fritext tvättad.

    Definition:
    Fritextfält bör inte innehålla annan teckenkodning än UTF-8.

    Beskrivning:
    Flaggning för fritextfält som har tvättats från html-taggar.

    Normalisering i Swepub:
    Radering av html-taggar.

    Swepub MODS 3.0:
    Samtliga abstract-, note- och title-element.

    Swepub BIBFRAME i JSON:
    Samtliga summary-, hasNote- och hasTitle-element

  • Normalization ISBN format

    Benämning:
    ISBN normaliserat.

    Definition:
    ISBN normaliseras till att bestå endast av siffror och stort X.

    Beskrivning:
    ISBN består av 10-13 tecken varav mestadels är siffror förutom det sista tecknet vid 10-siffriga som kan vara X. Siffrorna är uppdelade i grupper som kan vara åtskilda med bindestreck eller mellanrum. Katalogiseringspraxis är att ange ISBN utan streck.

    Normalisering i Swepub:
    Radering av bindestreck, ersättning av ett litet x mot stort X

    Swepub MODS 3.0:
    identifier type="isbn"
    (se avsnitt 5 Resource identifiers & 18.4 Source identifiers)

    Swepub BIBFRAME i JSON:
    identifiedBy @type "ISBN"

  • Normalization ISI capitalize

    Benämning:
    ISI ID normaliserat.

    Definition:
    ISI ID normaliseras med stora bokstäver.

    Beskrivning:
    ISI ID som består av 15-tecken och börjar med A19 normaliseras med stora bokstäver.  

    Normalisering i Swepub:
    Ersättning av små bokstäver mot stora.

    Swepub MODS 3.0:
    identifier type="isi"
    (se avsnitt 5 Resource identifiers)

    Swepub BIBFRAME i JSON:
    identifiedBy @type "ISI"

  • Normalization ISSN format

    Benämning:
    ISSN normaliserat

    Definition:
    ISSN normaliseras till att bestå endast av siffror och stort X

    Beskrivning:
    ISSN består av 8 tecken i siffror 0-9 varav det sista kan även vara X. Skiljs med bindestreck i två 4-teckenblock. Katalogiseringspraxis är att ange ISSN med streck.

    Normalisering i Swepub:
    Berikning med bindestreck, ersättning av ett litet x mot stort X.

    Swepub MODS 3.0:
    identifier type="issn"
    (se avsnitt 18.4 Source identifiers)

    Swepub BIBFRAME i JSON:
    identifiedBy @type "ISSN"

  • Normalization ORCID format delimiters & prefix (add & update)

    Benämning:
    ORCID normaliserat.

    Definition:
    ORCID består av https-prefix samt kod i format XXXX-XXXX-XXXX-XXXX.

    Beskrivning:
    ORCID ska bestå av 16 tecken som skiljs med bindestreck i fyra 4-teckenblock. Det sista tecknet är kontrollkod som kan vara 0-9 eller X. Enligt ORCID bör ORCID-ID anges med https-prefix för att underlätta direkt åtkomst till personposten. Flaggning för ORCID som har normaliserats med bindestreck, https-prefix och stora bokstäver.

    Normalisering i Swepub:
    Berikning med bindestreck och https-prefix. Http-prefix byts mot https. Små bokstäver byts mot stora.

    Swepub MODS 3.0:
    name/description type="orcid" (se MODS 2.6 , avsnitt 13.1.2 Person identifier ORCID)
    nameIdentifier type="orcid" (se MODS 3.0, avsnitt 13.1.2 Name identifier )

    Swepub BIBFRAME i JSON:
    identifiedBy @type "ORCID"

Tyck till

Hjälpte den här sidan dig?