„MARC (formátum)” változatai közötti eltérés

Tartalom törölve Tartalom hozzáadva

Sorban

A lap 2012. március 13., 22:53-kori változata

A MARC formátum (MAchine Readable Cataloguing; magyarul: géppel olvasható katalogizálás) a könyvtárakban és a nemzeti bibliográfiai központokban általában alkalmazott adatcsere formátum. Megjelenése szorosan összefügg a szabványosítási törekvésekkel.

A számítógép terjedésének következtében szükségessé vált a könyvtárakban, hogy a számítógép kezelni tudja a bibliográfiai adatokat, ezért szabványos kódokat rendeltek hozzájuk. A gépi katalogizálásban a bibliográfiai leírás elkészítésének, a besorolási adatok kiválasztásának és egységesítésének folyamata összeolvad az adatoknak a bibliográfiai adatcsere-formátum előírásainak megfelelő kódolásával. Ennek során a katalogizáló a gondos elemzés alapján minősített adatelemeket, adatokat a csereformátum megfelelő adatmezőiben rögzíti, a gépi rendszer pedig gondoskodik a kódolásnak megfelelő adatfeldolgozásról, az indexállományok felépítéséről, a bibliográfiai tételek megjelenítéséről.

A MARC formátum törtétneti háttere

A 1960-as évek elején a Library of Congress fejlesztette ki az első MARC formátumot.

Az Egyesült Államokban végzett fejlesztést közvetlenül követte Nagy-Britannia.

A munka eredményeként két formátum jött létre:

- LCMARC (későbbi nevén USMARC) - UKMARC

A többi nemzeti MARC formátum ezeknek a mintájára készült el.

1970-es évekre jellemző a különböző nemzeti formátumok kialakulása pl.: ANNAMARC (Olaszország), IBERMARC (Spanyolország), DANMARC (Dánia), KATMARC (Katalónia).

1973-ban a Német Szövetségi Köztársaság saját formátumot adott közre. Ez a formátum a MAB (Maschinefles Austauschformat für Bibliotheken) volt. A MAB legfőbb jellemzője, hogy fejlesztői létrehozták a különböző szintű bibliográfiai leírási rekordok – a többkötetes monográfiák, a monográfiák és analitikus leírásai – rekordjainak kapcsolására szolgáló eszközöket. Ez azért volt szükséges, mert a német nemzeti katalogizálási szabályzat (RAK = Regeln für die alphabetische Katalogisierung) előírja, hogy e sajátos bibliográfiai körülmények között többlépcsős bibliográfiai leírásokat kell alkalmazni. A MAB formátum kapcsolás technikája – mely a többlépcsős leírás bibliográfiai feltétel szükségességét felismerő határozott európai gyakorlatra támaszkodik – nagy hatással volt az UNIMARC formátum fejlesztésére.

A legelső nemzetközi MARC formátumnak az 1975-ben megjelent INTERMARC (International MARC) formátum tekinthető. Kifejlesztője a nyugat-európai könyvtárak képviselőinek egy csoportja. (Belgium és Franciaország nemzeti formátuma is ez lett.)

1977 az UNIMARC formátum első kiadása, mely erősen hatott a nemzeti formátumok kialakulására.

1994 HUNMARC magyar nemzeti MARC szabvány megjelenése

A következő nagy változást az Internet megjelenése jelentette.

A MARC formátum szerkezetete

Három szintből áll, melyek mindegyikének alkalmazása magas fokú szabványosítást igényel.

A formátum struktúrája

Mindegyik MARC formátum az ISO 2709 szabvány alkalmazásának speciális formája, mely szabvány meghatározza a bibliográfiai adatokat tartalmazó rekordok szerkezetét. Következetes alkalmazásával különböző formátumok között, lényegében egyértelmű konverzió lehetséges; lehetővé teszi a géppel olvasható bibliográfiai adatok cseréjét.

E szabvány szerint minden cserére szánt bibliográfiai rekordnak tartalmaznia kell: - rekord fejet, amely a rekord szerkezetével kapcsolatos - mutatót, mely egy-egy eleme három részből áll: a mező hívójelét, az illető mezőben található karakterek számát és a mező induló (első) karakterének a rekordon belüli pozícióját tartalmazza - változó hosszúságú adatmezőket. Ezek indikátorokat, almezőazonosítókat és adatokat tartalmaznak.

A tartalmi azonosító kódok

A mezők hívójelei, az indikátorok és az almezőazonosítók.

A formátumok közötti híd

A CCF és az SGML CCF (Common Commonication Format): a formátum alapeszméje, hogy olyan csereformátum legyen, melyet hídként használhatnak a könyvtári közösség és a referáló és indexelő szolgáltatási környezet között. Jellemzői lehetővé teszik azonban, hogy a sok intézet saját belső formátumaként is felhasználja.

A formátum két jellemzőjét úgy lehet összefoglalni, hogy - a formátum nem kötődik katalogizálási szabályokhoz - a CCF rekord struktúráját az ISO 2709-1983 szabvány legfrissebb kiadása határozza meg.

Nemzeti szabványok

HUNMARC

A HUNMARC bibliográfiai rekordok adatcsere-formátuma, magyar szabványalkalmazás, (OSZK 1994; ISBN 963 200 344 6). A nemzeti MARC formátumok rendszeréhez csatlakozva, az MSZ ISO 2709 Információ és dokumentáció Információs csereformátum című szabvány által megadott keretekben határozza meg a bibliográfiai adatok tartalmi jelölőit, és egyéb jellemzőit. Az adatcserében részt vevő adatok közlésmódjára a magyar könyvtári szabványok, valamint könyvtári és szakirodalmi tájékoztatási szabályzatok előírásai az irányadók.

A HUNMARC formátum kialakításakor figyelembe vették a Magyar Nemzeti Bibliográfiai Könyvek Adatbázisa számítógépes rendszerben alkalmazott MAMARC formátum sajátosságait, valamint a nemzetközi szolgáltatásokban elérhető UNIMARC vagy USMARC alapú nemzeti MARC formátumok gyakorlatát.

A HUNMARC formátum, ill. egyes elemei az adatcsere mellett a bibliográfiai adatok beviteli és a bibliográfiai tételek megjelenítési formátumaként is alkalmazható.

A HUNMARC formátum elemei

3 elemből áll: rekordszerkezet; tartalomjelölők, adattartalom.

1. rekordszerkezet: a bibliográfiai rekord alkotó részeinek elrendezésére vonatkozó „MSZ ISO 2709 Információ és dokumentáció. Információs csereformátum” szabvány alkalmazása 2. tartalomjelölők: meghatározza a HUNMARC bibliográfiai rekord adatelemeit azonosító hívójeleket, indikátorokat és almezőazonosítókat, ill. ezek értékeit, valamint a kódok értékét és jelentéstartalmát. 3. adattartalom három fő részből áll:

- rekordfej – a bibliográfiai rekordnak az elején található, és a rekord feldolgozására vonatkozó információkat tartalmazó része. Ezek az információk számok vagy kódértékek, melyeket relatív karakterpozíciójuk azonosít. A rekordfej állandó hosszúságú, 24 karakterpozícióból áll, és a HUNMARC rekord első mezője. - mutató – a rekord valamennyi adatmezőjének a hívójeléből, az adatmező hosszából és kezdőkarakterének pozíciójából álló tételek összessége. Minden egyes mutatótétel 12 karakterhosszúságú. A mutatótételek a hívójelek növekvő sorrendjében következnek. Azonos hívójelű ismétlődő mezők esetén a kezdőkarakter pozíciójának növekvő sorrendje szerint rendezettek. A mutató mezőhatárjel karakterrel (hex1E) végződik. - Adatmezők – a HUNMARC bibliográfiai rekordban a bibliográfiai adatokat tartalmazó mezők, melyek mindegyikét egy 3 számjegyből álló, a mutató tételében elhelyezkedő hívójel azonosít. Minden adatmező mezőhatárjel karakterrel végződik.

Az adatmező a bibliográfiai rekord változó hosszúságú része, mely adott kategóriákhoz tartozó adatokat tartalmaz.

===== Az adatmező típusai =====

Tájékoztató adatmezők: a gépi adatfeldolgozáshoz szükséges adatokat tüntetjük fel bennük. Nem tartalmaz sem indikátort, sem almezőazonosítót. Állhatnak egyetlen elemből, vagy adatelemek sokaságából kódolt értékek formájában.

Bibliográfiai adatmezők: a mutatóban hívójelével azonosított minden bibliográfiai adatmező 2 indikátorpozíciót tartalmaz az adatmező elején, melyet közvetlenül követ egy 2 karakteres almezőazonosító. Az almezőazonosító első karaktere hex 1F, második karaktere a latin abc kis- vagy nagybetűje, vagy arab számjegy. A bibliográfiai adatmezők mindig tartalmaznak legalább egy – rendszerint $a – almezőt, de előfordul több, meghatározott azonosítójú, esetenként ismétlődő almező is egy bibliográfiai adatmezőn belül.

Kötelező mezők

Minden HUNMARC bibilográfiai rekordban szerepelnie kell a következő mezőknek: 001 Rekodazonosító 005 A rekorddal való utolsó művelet dátuma és ideje 003 Meghatározott jellemzők és információs adatok 040 A leírás forrása

Nemzetközi szaványok

UNIMARC

A nemzeti könyvtárak igazgatóinak konferenciája tervbe vette a Nemzetközi MARC Hálózat kialakulását, mert az eltérő nemzeti MARC formátumok gyakran inkompatibilisek voltak egymással. A munkák irányát meghatározó tervtanulmányokat Stephen Green (British Library) és R. M. Duchesne (National Library of Canada) dolgozta ki. R. M. Duchesne már 1971-ben felvetette egy valóban nemzetközi kommunikációs formátumnak a gondolatát, mely a nemzeti változatok szuper halmaza volt.

1977-ben a következő szabványosítási javaslatokat tették:

- leíró adatok ISBD alapú szabályozása, - tárgyköri adatok szabályozása, - a nemzeti központok közötti kommunikációs hálózat, a bibliográfiai adatcsere, a rekordtulajdonságok politikájának szabályozása - együttműködésben végzett tervezés és fejlesztés az egyes országokban létrehozott, regionális MARC hálózati csoportok, valamint az International MARC Network Tanácsadó Bizottsága, az IFLA testületek, az ISO, az UNESCO, az ISDS Központ és minden más, a szabványosításban érintett intézmény részvételével.

A javaslatok egyik eredménye az IFLA International MARC Network Committee létrehozása volt, amely MARC fejlesztése nemzetközi koordinátoraként működik. 1977-ben jelent meg az UNIMARC első kiadása, második kiadása pedig 1980-ban. Az UNIMARC Handbook-ot 1983-ban adták ki. Az 1987-es átdolgozott kiadása – az UNIMARC Manual – tartalmazza az ISBD legújabb kiadásaiban található változásokat. Így ez tekinthető az UNIMARC formátum harmadik kiadásának. A formátum elsődleges célja az volt, hogy megkönnyítse a nemzeti bibliográfiai központok között a géppel olvasható bibliográfiai adatok cseréjét.

===== A formátum főbb jellemzői =====

- a formátum független a katalogizálási szabályzatoktól, az UNIMARC formátumcsalád az egyes nemzeti MARC formátumokhoz képest általánosabb szintű struktúrát határoz meg - nem ír elő, ill. nem feltételez különleges katalogizálási szabályokat - a szakterület nemzetközi szakérzői együttesen tervezték - IFLA szabvány, ezért az IFLA által javasolt szabványokat és irányelveket alkalmazza - IFLA formátum, ezért az IFLA biztosítja annak szakértői szintű fenntartását és továbbfejlesztését - integrált formátum, vagyis különböző könyvtári anyagok esetében használható - lehetőséget biztosít a nem latin írás és a többnyelvű rekordok kezelésére - biztosítja a rekordkapcsolás mechanizmusát - nemzetközi szintű csereformátum, így minden azt alkalmazó intézmény közvetlenül átveheti az adatokat más országok intézményeiből

UNIMARC/Authorities

1991-ben megjelent az UNIMARC/Authorities (egységes besorolási adatok formátuma). Ez a formátum az IFLA Working Group on an International Authority System (Egységes Besorolási Adatok Nemzetközi Munkacsoportja) ajánlásait tartalmazó, 1984-ben kiadott Guidelines for Authority and Reference Entries alapjaira épül. Az UNIMARC/Authorities besorolási, utaló- és általános, magyarázatos utaló-tételek mezőinek hívójeleit határozza meg és kiegészíti az UNIMARC Manualban definiált, a bibliográfiai adatok közlésének szerkezetét, tartalmi azonosítóit, kódolási rendszerét és kapcsolási technikáját szabályozó formátumot. Az UNIMARC besorolási formátum alapja a tulajdonnév elemekkel foglalkozó Guidelines for Authority and Reference Entries (GARE, 1984; 2. kiad.: Guidelines for Authority Records and References, GARR, 2001), valamint a tartalomfeltárást célzó besorolási adatokat taglaló Guidelines for Subject Authority and Reference Entries (GSARE, 1993). A két útmutató meghatározza a besorolási rekordok (authority record) és az utalótételek (reference record) adatelemeit.

1990-es években az Európai Közösségben lévő könyvtárak projektjeik adatcseréjéhez már az UNIMARC-ot vették figyelembe szabványos csereformátumként. (Pl.: EROMM, European Register of Microform Masters; Consortium of European Research Libraries-nek a régi nyomtatványok számbavételére irányuló projektje).

A formátum alapjai

Kiterjed a rekordtípusokra és ezek fizikai szerkezetére, az adatelemek kezeléséhez szükséges tartalomjelölőkre és a bibliográfiai feldolgozás szabványos adattartalmi elemeire.

A formátum felépítése

Az UNIMARC besorolási adatok formátuma a MARC formátumok rendszeréhez tartozik, a szokásos rekordfej, mutató, adatmezők − indikátorok, almezőazonosítók, adatelemek − összetevőkkel. A formátum adatmezői funkcionális szempontból adatcsoportokat képeznek (tömbök, blokkok), ezeket a kézikönyv külön listázza. Egy rekord felépítése a következő mező-csoportokból állhat: 0– Azonosítók adatcsoport: jelzetek a rekord és a rekordban leírt entitás azonosítására 1– Kódolt információk adatcsoport: állandó karakterhosszúságú kódok, a rekord vagy adatai különféle szempontú megjelölésére (előállítási adatok: az egységesített besorolási adat státusza, a katalogizálás nyelve, transzliteráció, karakterkészlet, a katalogizálás írásrendszere; az entitás nyelve; nemzetisége; a tárgyi hozzáférési pont kódolása; személynévnél az entitás neme, megkülönböztetett/nem megkülönböztetett név; földrajzi neveknél koordináták; testületi név típusa; szabályok: katalogizálási szabvány, tárgyszórendszer; egységesített cím típusa; a jelölt entitás fajtája: mű, kifejezési forma; a földrajzi térség kódja). 2– Kitüntetett hozzáférési pont adatcsoport: a kitüntetett hozzáférési pont (authorized access point), az utaló hozzáférési pontja (reference access point) vagy az általános magyarázatos hozzáférési pont (general explanatory access point) információs blokkja. 3– Megjegyzések adatcsoport: nyilvánosan is megtekinthető megjegyzések, amelyek 1) a rekordok közötti és egyéb hozzáférési pontok közötti összefüggéseket magyarázzák meg; 2) a besorolási rekordban leírt entitás azonosításához szükséges információkkal szolgálnak. 4– Variáns hozzáférési pont adatcsoport: azokat a variáns hozzáférési pontokat tartalmazza, amelyekből a rekord hozzáférési pontjához visszavezető „lásd” utalótételeket kell elkészíteni. 5– Kapcsolódó hozzáférési pont adatcsoport: a kapcsolódó kitüntetett hozzáférési pontokat tartalmazza, amelyekből a „lásd még” utalótételeket kell elkészíteni. 6– Osztályozás és entiástörténeti adatcsoport: osztályozási jelzeteket és egyéb besorolási információkat tartalmaz, valamint a rekord hozzáférési pontjára vonatkozó entitás-történeti megjegyzéseket (létezés kezdete, vége, székhely, tevékenység stb.) 7– Más nyelvű/írású kitüntetett hozzáférési pont adatcsoport: az ugyanabban a rekordban bejegyzett másik egyenrangú hozzáférési pont regisztrálásának helye, illetve kapcsolat olyan másik rekordhoz, amelyikben ez a másik egyenrangú hozzáférési pont a kapcsolódó rekordban 2– típusú kitüntetett hozzáférési pont. 8– Forrásinformációs adatcsoport: a rekord forrása, nem nyilvánosnak szánt katalogizálói megjegyzések 9– Nemzeti (helyi) használatra fenntartott adatcsoport: a rekord előállítójának helyi vonatkozású adatai. Az UNIMARC nem dolgozza ki ennek csereszabatos szerkezetét, hiszen ezek az információk nem képezik a nemzetközi érdekeltségű adatcsere tárgyát.