Ontológia megfeleltetés

Az ontológia megfeleltetés vagy ontológia illesztés adott fogalmak közötti kapcsolatok keresését jelenti. Kapcsolatok egy adott halmazát szintén megfeleltetésnek nevezik. Ez a fogalom némileg más értelmet nyer a számítástechnika világában.

Ontológia megfeleltetés az informatikábanSzerkesztés

A számítástechnikában a fogalmak tulajdonképpen címkézett adatokként értelmezhetők. Történelmileg, az ontológia megfeleltetések szükségességét a heterogén adatbázisok integrációjának problémája motiválta, amely adathalmazok függetlenül kerültek kialakításra, és mind saját adatszótárral rendelkeztek. Szemantikus webes környezetben, ahol sok olyan szereplő került bevonásra, akik saját ontológiákat biztosítanak, az ontológia megfeleltetés különösen kritikus helyet kapott a heterogén adatforrások együttműködésének kialakításában. Az ontológia megfeleltető eszközök adott adatoknak olyan osztályait keresik, amelyek "szemantikusan ekvivalensek", mint például az "autó" és a "gépkocsi" fogalmak. Az osztályok nem feltétlenül azonosak logikailag. Euzenat és Shvaiko (2007)[1] szerint a hasonlóság három fő dimenzióját különíthetjük el: szintaktikus, külső és szemantikus. Számos eszköz és keretrendszer került kifejlesztésre ontológiák megfeleltetésének céljából, amelyek közül néhány alkalmazás számára a megismeréstudomány szolgált inspirációként, néhány pedig ettől függetlenül készült.

Az ontológia megfeleltető eszközök általában adatbázis sémák,[2] XML sémák,[3] taxonómiák,[4] formális nyelvek, egyed-kapcsolat modellek,[5] szótárak és más, címkézett adathalmazok feldolgozására készültek. Ezen adathalmazoknak a megfeleltetés előtt legtöbb esetben egy adott gráf reprezentációra történő konverzióját végzik el. A Szemantikus Web megjelenése óta ezen gráfok az RDF (Resource Description Framework) nyelvcsalád segítségével reprezentálhatók, mégpedig <alany, állítmány, tárgy> alakú rendezett hármasok formájában, legtöbbször a Notation 3 szintaxisnak megfelelően. Ebben a környezetben az ontológiák megfeleltetésének problémakörét sok esetben "ontológia illesztésnek" nevezik.

Az ontológia megfeleltetési problémát jelenleg úgy kezelik, hogy először megpróbálják az illesztést kiszámítani, majd a kapott illesztésnek megfelelően automatikusan megfeleltetni az adott ontológiákat. Jelenleg a DSSim, az X-SOM[6] és a COMA++ rendszerek képesek elérni a legnagyobb pontosságot és lefedettséget.[3] Az Ontology Alignment Evaluation Initiative kezdeményezés a különböző módszerek kiértékelését, összehasonlítását és javítását tűzte ki célként.

Legújabb eredményként egy minimális megfeleltetéseken alapuló technika került bemutatásra, amely hasznosnak bizonyult a megfeleltetések validációjának és vizualizációjának erőforrásigény szempontjából történő minimalizálásában. A minimális megfeleltetések olyan speciális megfeleltetések, amelyekből egyrészt minden más megfeleltetés kiszámítható lineáris időben (az input gráf méretét alapul véve), másrészt egyikük sem csökkenthető az előbb említett tulajdonság elvesztése nélkül.

Formális definícióSzerkesztés

Adott   és   ontológiák között számos különböző kapcsolatot definiálhatunk. Ezen kapcsolatokat együttesen megfeleltetéseknek nevezzük, és különböző dimenziók szerint csoportosíthatók:

  • hasonlóság vagy logika: ez képezi a különbséget az illesztések (az ontológiabeli kifejezések szemantikus hasonlóságának becslése) és a megfeleltetések (logikai axiómák, amelyek általában ontológiabeli kifejezések közötti logikai ekvivalenciát vagy tartalmazást fejeznek ki) között
  • atomi vagy komplex: az adott megfeleltetés "egy az egyhez" típusú, vagy több kifejezést is magában foglalhat egy lekérdezéshez hasonló formulában (pl. LAV/GAV megfeleltetés)
  • homogén vagy heterogén: a megfeleltetések ugyanolyan típusú kifejezések felett értelmezettek (pl. osztályok csak osztályokkal, példányok csak példányokkal állhatnak kapcsolatban, stb.) vagy megengedünk heterogenitást is a kapcsolatokban?
  • megfeleltetés típusa: a megfeleltetésekben használt szemantikus kapcsolatok típusa, amely lehet alárendeltség, ekvivalencia, függetlenség, tartalmazás, vagy más, felhasználó által definiált kapcsolat.

Az alárendeltségen alapuló, atomi, homogén megfeleltetések képezik az alapvető építőköveket nagyobb megfeleltetések konstruálásához, és minden leíró logikában megfelelő szemantikával rendelkeznek.

Egy atomi homogén illesztés egy olyan megfeleltetés, amely egy   hasonlósági mértéket foglal magában, leírva ezzel az   és   input ontológiák két kifejezésének hasonlóságát. Egy illesztés kiszámítható heurisztikus algoritmusok használatával, vagy más illesztésekből következtethető.

Formálisan azt mondhatjuk, hogy egy illesztés egy   rendezett négyes, ahol   és   ontológiabeli homogén kifejezések, valamint   jelenti az   illesztés hasonlósági mértékét. Egy (alárendeltségen alapuló, homogén, atomi) megfeleltetés egy   rendezett párként definiálható, ahol   és   ontológiabeli homogén kifejezések.

Vizualizációs eszközökSzerkesztés

HivatkozásokSzerkesztés

  1. Jérôme Euzenat and Pavel Shvaiko. 2007. Ontology matching Archiválva 2010. január 16-i dátummal a Wayback Machine-ben, Springer-Verlag, 978-3-540-49611-3.
  2. J. Berlin and A. Motro. 2002. Database Schema Matching Using Machine Learning with Feature Selection. Proc. of the 14th International Conference on Advanced Information Systems Engineering, pp. 452-466
  3. a b D. Aumueller, H. Do, S. Massmann, E. Rahm. 2005. Schema and ontology matching with COMA++. Proc. of the 2005 International Conference on Management of Data, pp. 906-908
  4. S. Ponzetto, R. Navigli. 2009. "Large-Scale Taxonomy Mapping for Restructuring and Integrating Wikipedia". Proc. of the 21st International Joint Conference on Artificial Intelligence (IJCAI 2009), Pasadena, California, pp. 2083-2088.
  5. A. H. Doan, A. Y. Halevy. Semantic integration research in the database community: A brief survey. AI magazine, 26(1), 2005
  6. Carlo A. Curino – Giorgio Orsi – Letizia Tanca: X-SOM: A Flexible Ontology Mapper. (angolul) Database and Expert Systems Applications Conference. DEXA’07, (2007. okt.) doi Hozzáférés: 2022. okt. 19.

Kapcsolódó szócikkekSzerkesztés

További információkSzerkesztés