Wikipédia:Wikidata

(Wikipédia:WDATA szócikkből átirányítva)
A Wikidata logója

A Wikidata a Wikimédia Németország projektje, amely lexikális adatok közös, emberek és gépek számára egyaránt olvasható formátumú szolgáltatására irányul. A Wikidata ahhoz hasonlóan osztja meg az adatokat, ahogy a Commons a médiaállományokat, és ezek az összes Wikimédia-projekt nyelvén hozzáférhetőek. Habár a kezdeményezést a Wikimédia Németország gondozza, a megvalósítás az összes Wikimédia-projekt, így a magyar Wikipédia működésére is hatással van.

A jelen elképzelések szerint a Wikidata működése három fő területet ölel fel, és ez egyúttal a bevezetés tervezett sorrendjét is jelzi:

  1. fázis: központi interwiki-adatbázis létrehozása, mely a jelenlegi interwikirendszer alternatívája. Ebben a rendszerben elég egy helyen kigyomlálni a hibás interwikit, és nem kell körbeszerkeszteni érte mind a huszonhármat, ahol betették egy szócikkbe.
  2. fázis: kiépül az infoboxok adatainak központi adatbázisa. Ezután az infoboxok a data.wikimedia.org szerverről nyert adatokat használhatják. Ezáltal egész más megvilágításba kerülhet a születési-halálozási kategóriák szükségességéről folyó vita.
  3. fázis: lehetővé válik automatikus listák és összefoglalók beillesztése a szócikkekbe.

Interwikik

szerkesztés

Minden „entitáshoz” (személy, film, csata, kisbolygó…), amelyről valamelyik Wikipédia valamelyik cikke szól, tartozik egy leíró lap. Ez háromféle információt tárol:

  • linkeket a különböző Wikipédiák megfelelő cikkeihez (ebből egy wikiben csak egy lehet),
  • címkéket és rövid leírásokat az összes wiki nyelvén,
  • másodlagos címeket (aliasokat), melyekből több is lehet egy wikin.

Ez tehát a Wikipédia belső céljait szolgáló eszköz. Az adatok többféle formátumban lesznek lekérdezhetők, és nem szerkeszthetők közvetlenül a Wikipédiában megszokott módon, hanem csak egy ellenőrzött felületen keresztül. Az egyes wikik egy MediaWiki-kiterjesztés révén vehetik igénybe a szolgáltatást. Mellékhatásként remélhető, hogy a laptörténetek áttekinthetőbbek lesznek. (Most elég sok szerkesztés az interwiki-botok műve).

A projektnek nem része az adatbázis feltöltése és a cikkek összekapcsolása, ez a szerkesztők feladata, elsősorban a botgazdáké. Ebben egy szűk, de lelkes csapat munkájára számítanak, ez nem igényli sok ember közreműködését.

A Wikidata önmagában nem ad választ az olyan problémákra, hogy a cikkek nem mindig feleltethetők meg egymásnak (pl. az egyik wikiben két cikk van arról a témáról, amelyikről a másikban egy közös). A projekt révén keletkező interwikik minősége kezdetben a jelenlegivel egyezik meg, és az ilyen eseteknél továbbra is egyedileg, emberi munkával kell beavatkozni.[1]

A fent említett leírólapok kibővülhetnek mindenféle adatokkal, amelyeket tulajdonság-érték párok formájában tárolhatunk (pl. születési dátum = ...), mellétéve a forrást és más szükséges információt. A szerkesztők saját maguk is definiálhatnak új tulajdonságokat, tehát gyakorlatilag bármilyen tényadat tárolható a forrásával együtt (így csökkentve a többnyelvű környezetben előre látható konfliktusok számát). Ez is többféle formátumban lesz hozzáférhető, hogy a gépek is könnyen kezelhessék.

Ebben a fázisban a projekt kilép a Wikipédia keretei közül, mert az így létrehozott szabad adatgyűjteményt (a Commons képeihez hasonlóan) bárki felhasználhatja, nem csak a wikipédiák. A koncepció érdekessége, hogy az adatbázisban létrehozott entitásoknak nem kell valamely Wikipédia-cikkhez kapcsolódniuk, pl. felvihetjük olyan személyek életrajzi adatait is, akikről egy wikipédián sincs cikk. Ily módon meghaladja a jelenlegi nevezetességi kritériumokat, és új kritériumok felállítását teszi szükségessé.

A megvalósítás része lesz egy MediaWiki-kiterjesztés, amely támogatja az adatok beépítését a szócikkek infoboxaiba.

A fejlesztők reményei szerint így nőni fog az egyes wikik közötti konzisztencia, csökkenni a karbantartási munka, és – elsősorban a kisebb wikikben – hasznos csonkcikkek születhetnek.

A WikiData ennek a grandiózus közös tudásbázisnak az infrastruktúráját biztosítja, de nem foglalkozik sem a tartalom kiválogatásával és feltöltésével, sem a szabályok megállapításával – ez már a szerkesztői közösség feladata lesz. A második fázis a szemantikus Wikipédia eszméjét valósítja meg.

A tényekről nem mindig tud mindenki megegyezni (gondoljunk akár etnikai és vallási nézőpontokra, akár egyszerű tudományos, statisztikai adatokról folyó vitákra). Ezért a Wikidata alapeszméje az, hogy nem tényeket, hanem állításokat és ezekhez tartozó forrásokat gyűjt. Tehát nem azt tárolja, hogy hány lakosa van Magyarországnak, hanem hogy milyen forrásolt állítások vannak Magyarország lakosságáról. Ezeknek a felhasználása továbbra is a szerkesztői közösség dolga.

Az adatmodell egyszerűsített, nagyközönségnek szánt bemutatása itt látható (egyelőre csak angol leírással).

A harmadik fázis elmélyíti a szemantikus Wikipédia megvalósítását. Komplex lekérdezéseket tesz lehetővé, melyek különböző szempontok alapján összegyűjtött adatokat szolgáltatnak, és ezáltal tovább csökkentik a Wikipédia karbantartási igényét.

Maga a projekt nem foglalkozik az adatok értékelésével, megbízhatóságával; ez a kimenetet felhasználó rendszerek dolga.

Ezen a ponton a Wikidata kiépítése lezárul, és a projekt gondozását a Wikimédia Alapítvány veszi át. Természetesen a fejlesztés, karbantartás nem áll le.

Aktualitások 2012-ben

szerkesztés
 
A Wikidata fejlesztőcsapata: John Erling Blad, Abraham Taherivand, Tobias Gritschacher, Jeroen De Dauw, Henning Snater, Lydia Pintscher, Daniel Kinzler, Markus Krötzsch, Silke Meyer, Denny Vrandečić, Katie Filbert, Daniel Werner, Jens Ohlig

A Wikidata 870 000 eurós kiadási összeggel rendelkezik a Wikimédia Németország 2012-es gazdasági tervében,[2] szerepelt a 2012. június 1–3-i berlini Hackathon konferencia napirendjén, továbbá ezzel kapcsolatos állásokat is meghirdettek.[3] A csapat már fel is állt, és megkezdte a munkát. Az évek óta tervezett projekt[4] ezzel jelentős lendületet kapott. 2012 júniusában már elérhető az első demóváltozat is (lásd lent a hivatkozásokat).

2012. október 30-án a Wikidata megkezdte működését, egyelőre a Wikipédiával való kapcsolat nélkül.[5][6]

A projekt haladása angolul értőknek nyomon követhető a heti összefoglalók révén.

A Wikidatára hivatkozó „wd” sablon

szerkesztés

A Wikidata felsorolja a témához már megírt Wikipédia-cikkeket az összes nyelven akkor is, ha az még magyarul nincs meg, és ezt a listát szükség esetén az olvasónak is hozzáférhetővé tehetjük a piros belső linkek után írott {{wd}} sablonnal.

Csak akkor tanácsos egy cikkbe beleírni, ha egy idegen nyelvű Wikipédia-cikk lefordítása indokolt lenne, illetve ha nem magától értetődő a téma szócikkeinek megtalálása más nyelveken.

A sablon szorosan következik a piros link után, egyetlen paramétere a Q-kezdetű wikidatás azonosítót kell megadni: {{wd|Q...}}.

A sablon csak addig látszik a cikkekben, amíg a linkelt témát még nem írták meg. Utána láthatatlanná válik addig is, amíg HerculeBot legközelebb arra jár, és eltávolítja a cikkből.

A Szignál (egyértelműsítő lap) szemlélteti a használatát.

További információk

szerkesztés