Wikidata

a Wikimédia adatbázisa
Ez a közzétett változat, ellenőrizve: 2023. április 27.

A Wikidata egy világméretű, ingyenesen hozzáférhető és bárki által frissíthető internetes adatbázis, mely eredetileg a Wikipédia tudásanyagára épült, mára azonban jócskán túlnőtt rajta: míg 2020 januárjában az összes Wikipédiában 51,8 millió szócikk volt,[1] a Wikidatán ugyanekkor 73,8 millió adatlap található. Összehasonlításul: a világ 57 országának tízezer könyvtára minden egyes tételét (vagyis jószerével a világ összes könyvét, újságját és szerzőjét) tartalmazó Nemzetközi Virtuális Katalógustár adatbázisában 2019 szeptemberében 464 millió bibliográfiai rekord volt.[2]

Wikidata
Vállalkozás típusa
  • tartalmi Wikimédia-projekt
  • MediaWiki-oldal
  • tudásbázis
  • internetes adatbázis
  • tudásgráf
Oldal típusa
  • tartalmi Wikimédia-projekt
  • MediaWiki-oldal
  • tudásbázis
  • internetes adatbázis
  • tudásgráf
Elérhető nyelv(ek)több nyelv
Alapítva2012. október 29.
Elődje(i)
TulajdonosWikimédia Alapítvány
Alapító
URL[ ]
Fejlesztő
Alexa-helyezés7136 (legfrissebb érték, 2021. május 23.)
A Wikimédia Commons tartalmaz Wikidata témájú médiaállományokat.

Az adatbázis

szerkesztés

A Wikidata olyan adatokat őriz, amihez nem kell hosszú folyószöveges ismertető, hanem rövid szöveggel (például név) vagy számokkal (bármilyen adat, dátum stb.) leírható.[3] A projekt lényege kezdetben az volt, hogy a Wikipédia-szócikkekben összegyűjtött adatokat kereshető és könnyen hozzáférhető formában rögzítse, és a világ valamennyi nyelvén működő Wikipédia számára strukturáltan kiadja. A Wikipédia azonos témáról szóló, de különböző nyelven megjelent (általában különböző szerkesztők által írt, és tartalmában is eltérő) szócikkei a Wikidata adatbázisán keresztül kapcsolódnak egymáshoz, és az egyes szócikkek alanyával vagy tárgyával kapcsolatos későbbi változások is közzétehetők az adatbázis segítségével az összes Wikipédián egyszerre.[4]

Az adatok között lehet egyszerű és összetett keresést végrehajtani, adatszerkezete gépi olvasásra, feldolgozásra is alkalmas. Az adatbázis összetettségét és a lekérdezésekben rejlő perspektívát érzékelteti, hogy a 2015-ben kiszivárgott úgynevezett Panama-aktákban szereplőkkel kapcsolatban egy dán szoftvermérnök a Wikidatában végzett elemző kutatás után tudta összeállítani az érintettek foglalkozásával kapcsolatos kimutatását, bebizonyítva ezzel, hogy a legtöbb off-shore-ügyben érintett személy politikus, ügyvéd és labdarúgó.[5]

 
Részlet egy Wikidata-elem (Douglas Adams (Q42)) adataiból

A Wikidata nem témaspecifikus, vagyis ellentétben például egy könyvtári adatbázissal, ami könyvek, folyóiratok és szerzők adatait tartalmazza, vagy egy tőzsdei adatbázissal, ami cégek, vállalatok, részvények, értékpapírok adatait és árfolyamait mutatja, a Wikidatán sokkal több adattípus található. Egyfelől a Wikipédia valamennyi szócikkében szereplő adatok, másfelől 2014 óta a tudományos folyóiratokban megjelent cikkek főbb paraméterei is megjelentek az adatbázisban.

A 2019 júliusában megjelent statisztika szerint az adatok 43,5 százaléka a fent már említett tudományos cikk, közel tíz százaléka életrajzi adatlap, öt százaléka biológiai adat, négy-négy százalék körüli az építmények és közigazgatási egységek (például települések) adatait tartalmazó elem.[6]

A Wikidata indulása

szerkesztés

A Wikidatát 2012-ben hozta létre a német Wikimédia Alapítvány, a projekt atyja pedig egy horvát származású informatikus, Denny Vrandečić volt 2013-ig, amikor a Google LLC elcsábította Vrandečićet egy hasonló projekt vezetésére.[7] A 2012 októberében indult Wikidatához elsőként 2013 januárjában csatlakozott a magyar, a héber és az olasz Wikipédia, majd februárban követte ezeket az angol, márciusban pedig az összes többi nyelvi változat. 2013 májusában már több mint 3500 aktív felhasználó vitte fel és javította az adatokat (a felhasználók egy része nem élő személy, hanem szoftver, amely például adatmásolással vagy információk kiegészítésével foglalkozik).[8]

Lásd még

szerkesztés
  1. Editing List of Wikipedias. meta.wikimedia.org (2020. január 12.) (Hozzáférés: 2020. január 12.)
  2. OCLC delivers quality. OCLC (angolul) (2019. szeptember) (Hozzáférés: 2020. január 12.)
  3. Borek András: Egyetemes nyílt tudás. Netidők Blogtársaság (2012. április 12.) (Hozzáférés: 2018. november 27.)
  4. A wikipédiások új, nagy dobása. HVG (2012. április 2.) (Hozzáférés: 2018. november 27.)
  5. Előd Fruzsina: Nézze meg, mit dolgoznak a panamázók, amikor épp nem panamáznak. Index.hu (2016. május 12.) (Hozzáférés: 2018. november 27.)
  6. Wikidata:Statistics. Wikidata (2019. július 23.) (Hozzáférés: 2020. január 12.)
  7. Dojcsák Dániel: A Google megfojtja a Wikipediát. HWSW (2014. január 13.) (Hozzáférés: 2018. november 27.)
  8. Denny Vrandečić – Markus Krötzsch: Wikidata: A Free Collaborative Knowledgebase. Communications of the ACM (2014. október) (Hozzáférés: 2019. január 2.) arch