Podes prosjektblogg

Sammenligning frbr versjon 1 og 2

Postet den 14. May 2010 | Skrevet av Anne Karine | Ingen kommentarer

Formålet med frbriseringen av Knut Hamsun og Per Pettersons forfatterskap har vært å tolke postene i katalogen i henhold til FRBR modellen. Et verk kan være en novelle, et essay, en samling av noveller og essays og romaner. Vi har valgt å se bort fra dikt og artikler i denne sammenhengen.

Per Petterson har skrevet 8 verk, dersom man ser bort fra enkeltnoveller og essays. Tar man med artikler, essays og noveller øker antall verk til 40. Søk på Per Petterson i Deichmans katalog gir treff på 60 uttrykk/ manifestasjoner. Frbriseringen av eksporten basert på postene slik de var i januar 2010 resulterte i 28 verk. Etter rettelsen inneholder den frbriserte lista 40 verk. Årsaken til økningen i antall verk er analyseringen av essay- og novellesamlingene. Det er ikke tradisjon for å analysere essaysamlinger på Deichman, men vi valgte å gjøre det i denne sammenhengen for å få en mer fullstendig liste over Pettersons forfatterskap. Selv om rettingene har ført til flere verk, er lista blitt mer ryddig og oversiktelig etter oppryddingen.

Knut Hamsun skrev 40 verk, dersom man ser bort fra brev, foredrag, artikler, hver enkelt noveller og dikt. Inkludert novellene i novellesamlingene, er antall verk 72 (ekskludert brev,  foredrag og artikler). Kilde Hamsun.no.  Søk på Knut Hamsun som forfatter i Deichmans katalog gir treff på 588 manifestasjoner. Eksporten av disse postene i januar 2010 omgjør 588 manifestasjoner til 200 verk. Etter rettelsene er antall verk ned i 94 inkludert novellene i Kratskog, Siesta og Stridende liv.  I ryddeprosessen har vi oversett to verk som forekommer med to ulike skrivemåter, noe som har ført til at Paa gjengrodde stier og På gjengrodde stier og Mit reisefølge og Mitt reisefølge telles som fire verk og ikke to. Hamsun var produktiv og noveller som Nabobyen og Paa klinik ble ikke utgitt i noen av novellesamlingene i hans levetid, men telles i denne sammenhengen som verk (Felt 740 2) så det å få en endenlig liste over Hamsuns verk er en tidkrevende prosess. Rettelsene har ført til en ryddigere liste hvor (nesten) alle uttrykk er knyttet til et verk.

Ingen av listene er perfekte, men konsekvent bruk av felter og  indikatorer i 240, 245, 700 og 740 har ført til færre feilkilder når det gjelder å tolke reelle verk og knytte uttrykk til verket.

Her følger et utdrag fra Aalbergs dokumentasjon Frbrisering av testdata fra Deichmanske som kan leses i sin helhet her.  Utdraget teller antall rettinger og konsekvensen av de.


Redigering av postene
Basert på resultatene fra første runde så vi at det var mulighet for bedre resultat og vi bestemte at det ville vært interessant å rette feil i postene, legge til informasjon samt se på effekten av en mer konsistent bruk av indikatorene. Endringene som ble gjort er i overensstemmelse med katalogiseringsreglene. For å begrense omfanget av dette arbeidet jobbet vi videre kun med Per Petterson og Knut Hamsun (908 poster). Siden dette er norske forfattere er dette i praksis også en forenkling av noen av de problemene som skyldes språk på tittel i biinførsler.
Endringer som ble gjort i de 908 postene i inkluderte:
·    Endring av språkkode i 008 for 5 poster
·    Legge til 240$a i 85 poster og rette skrivefeil i 24 eksisterende poster
·    Rette skrivefeil i 245$a (eller feil ISBD syntaks) i 6 poster
·    Endre første indikator i 245. Før korreksjon hadde 137 poster ind1 = 0 eller blank, mens ind1 = 1 var brukt i 774 poster. Etter korreksjon var fordelingen 263 – 651.  Den vesentligste endringen her var at i postene etter korreksjon er det 113 færre 245 felt som skal tolkes som egne verk.
·    Korrigere 700-felter. I opprinnelige poster finner vi 948 700$a subfelter og 545 700$t felter. I de korrigerte postene er antallet redusert til hhv 917 $a og 481 $t. Endringen skyldes en mer systematisk bruk av 740-feltene der alle innførsler har samme forfatter (som er registrert i 100). Her ble også titler endret til samme skriveform og språk som man ville brukt i 240 for et mindre antall poster, men det er ikke mulig å telle disse endringene på grunn av de øvrige endringer som ble gjort.
·    Endre andre indikator i 700-felt for å tydeliggjøre om en innførsel er et eget verk eller ikke. På grunn av endringene som er gjort er det vanskelig å identifisere antallet korreksjoner
·    Korrigering av 740 felter. I de opprinnelige postene er det 387 felter, mens det i de korrigerte postene er 873 felter. Årsaken til denne økningen er at nye felter er lagt til for ”verks”-skrivemåten og andre indikator er brukt for å kunne skille verkstitlene fra andre titler. Også her ble det gjennomført en mer systematisk bruk av andre indikator, men disse endringene er vanskelig å telle spesifikt.
Resultat etter retting av postene
Etter at postene var rettet ble det utført en ny eksport og en ny runde frbrisering. Resultatet av dette var en tydelig forbedring som i hovedsak kan oppsummeres som:
·    Færre ”falske” verk både på grunn av bedre kvalitet i 240/245 titler. I tillegg var det i denne runden mulig å ignorere 245 titler som ikke er signifikante verkstitler (basert på indikator).
·    Flere ”riktige” verk fordi det var mulig å utnytte titler i 700 og 740 i vesentlig større grad siden andre indikator nå kunne brukes for å bestemme om en tittel var et eget verk eller ikke.
I tillegg er det et viktig poeng at man i denne omgangen kunne lage enklere regler. Å bruke indikator-verdier som betingelser er for eksempel vesentlig enklere enn måtte skrive regler basert på innholdet i tittelfelt.
Konverteringen som ble utført etter rettingen av postene var litt forskjellig fra den opprinnelige og resultatet er ikke direkte sammenlignbart mht. antall entiteter og relasjoner. Videre er bruken av Petterson og Hamsun i den siste konverteringen en forenkling av noen problemer siden man i en norsk katalog for norske forfattere får færre problemer mht. språk som er brukt på titler i biinførsler og emneinnførsler.
De rettinger som ble gjort er ikke i konflikt med katalogiseringsreglene og resultatet viser at man vesentlig kan forbedre postene med tanke på ”frbr-kvalitet”. Konsistent bruk av indikatorer, funksjonsbetegnelser osv. er vesentlig mer viktig i kontekst av FRBR enn i tradisjonelle bibliotekssystemer. Tilsvarende krav gjelder for konsistent bruk av standard og orginaltitler.
Dette er dessverre et omfattende arbeid siden det for det meste må gjøres manuelt.

Kommentarer

Legg igjen en kommentar