Szemantikus HTML

A szemantikus HTML a HTML felhasználása arra, hogy a weboldalak és webalkalmazások esetében biztosítsa az információ helyes szemantikáját ill. értelmezését, a megjelenítési mód meghatározásán túl. A szemantikus HTML-t mind a hagyományos webböngészők, mind felhasználói ügynökprogramok fel tudják dolgozni. Ezek az emberi felhasználók felé való megjelenítéshez a CSS-t használják.

Története szerkesztés

A HTML kidolgozása óta tartalmazza a szemantikus jelölők lehetőségét.[1]A HTML dokumentum szerzője egyebek mellett megteheti, hogy "a címmel kezd, aztán hozzáadja a fejezetcímeket, a bekezdéseket, a szöveg bizonyos részeit kiemeli, és más oldalakra való hivatkozásokat szúr be, és a felsorolások különböző fajtáit alkalmazza." [2]

A HTML szabvány különböző verziói alkalmaztak olyan megjelenítési jelölőket is, mint pl. a <font> (a HTML 3.2 adta hozzá, majd a HTML 4.0 szigorú változata eltávolította), az <i> minden verzióban jelen van, a <center> jelölőt szintén a HTML 3.2-től kezdve használhatjuk. Léteznek a szemantikailag semleges <div>és <span>elemek is. Amióta az 1990-es évek végétől a CSS a legtöbb böngészőben működik, a webes szerzőket arra bátorították, hogy kerüljék ezeket megjelenítési jelölőket, mert így a megjelenítés szétválaszthatóvá válik a tartalomtól.[3]

2001-ben Tim Berners-Lee részt vett egy a szemantikus webről szóló olyan vitában, ahol demonstrálták, hogy intelligens szoftverügynök-programok egy napon majd automatikusan képesek lesznek megtalálni, kiszűrni és korrelálni korábban nem relációba állított tényeket a véghasználó hasznára.[4] Az ilyen ügynökprogramok nem általánosak ma sem, jóllehet a Web 2.0 néhány alkalmazása, a hibrid webalkalmazások, illetve az árösszehasonlító oldalak, eléggé megközelítik ezt az ideát. A legnagyobb különbség ezen alkalmazás-hibridek és a Lee-féle szemantikus ügynökprogramok között abban rejlik, hogy a jelenlegi információgyűjtést és hibridizációt olyan webfejlesztők tervezik meg, akik már ismerik az általuk összekötni, összehasonlítani és ötvözni kívánt adatok webhelyeit, az API-szemantikáját

A webes keresőrobot olyan fontos webügynök típus, amely képes előzetes tudás nélkül feltérképezni,az általa beolvasott adatokat. Ezek a szoftveres ügynökök erősen függnek weboldalakon talált információk szemantikus tisztaságától, mivel ezek különböző technikákat, algoritmusokat használnak arra, hogy weboldalak millióit indexeljék egy nap alatt, és a webfelhasználóknak keresési lehetőségeket nyújtsanak.

Annak érdekében, hogy a kereső-robotok a HTML dokumentumokban talált szövegek relevanciáját fel tudják becsülni, fejlesztésük során a HTML-ben meglévő szemantikus struktúrákat széleskörűen és egyöntetűen feldolgozzák, hogy így a felszínre tudják hozni a rendelkezésre álló információ jelentését. Ugyanígy járnak el az adatövözeteket (mash-up) és hibrideket létrehozó alkalmazások, és az erősen automatizált ügynökprogramok is. [5] Jóllehet a valódi szemantikus háló bonyolult meta-adatoktól és RDF ontológiákból áll, minden HTML dokumentum hozzájárul a világháló értelmezéséhez azzal, hogy helyes módon alkalmazza a fejezetcímeket, listákat és egyéb szemantikus jelölőket. A HTML egyszerű korábbi használatát angolul "Plain Old Semantic HTML"-nek rövidítve POSH-nak nevezték el.[6] A Web 2.0-s jelölők megfelelő használata olyan vezérszó-gyűjteményeket (folksonomy) hoz létre, amelyek sokak számára legalább annyira értékések, mint a korábbi jelölési mód.

A HTML 5 olyan új szemantikai elemeket vezetett be, mint a section, article, footer, progress, nav, aside, mark, és time.[7][8] Összességében a W3C konzorcium célja az, hogy lépésenként olyan új lehetőségeket vezessen be, amely a böngészők, a kereső-robotok és a fejlesztők számára megkönnyíti az adatok közötti különbségtételt. Ezzel elősegítik az adatok jobb megjeleníthetőségét, a különböző eszközökön.[7]

A megjelenítési jelölőket a HTML 4.01-ben és az XHTML-ben hivatalosan nem vezették ki, azonban eltanácsoltak tőle. A HTML 5-ben olyan általánosan elterjedt jelölőkről, mint az i[9] és bb,[10] kijelentik, hogy "jelentésük világosan meg van határozva", mégpedig úgy, "hogy stilisztikailag elkülönítik a szöveget az alapstílustól, anélkül, hogy túlságosan nagy hangsúlyt kapnának"[9]

Szempontok szerkesztés

Azokban az esetekben, amikor a HTML-ben lehetségesnél pontosabb szemantikai jelölőkre van szükség, a dokumentum egyes részei elkülöníthetőek a span vagy div jelölőkkel, Ezeknek a jelölőknek (tageknek) aztán olyan érthető osztályneveket [11] adhatunk meg. Például <span class="szerző"> , <div class="számla">. Ezek az osztálynevek aztán az adott sémán, vagy ontológián belül a szövegrészlet azonosítójaként szolgálnak, s ezzel elősegítik a pontosabb tartalom meghatározást. Az ún. mikroformátumok ezt a jelentéstani megközelítést formalizálják a HTML-ben.

Fontos megszorítás, hogy az ilyen testreszabható jelölőknek meg kell felelnie a helyesen megformáltság feltételeinek.[12] Miután az ilyen dokumentumok általában fa struktúrát követnek, ez azt jelenti, hogy az így megjelölt al-fáknak hasonló súlyúaknak kell lenniök. Ez egyben azt is jelenti, hogy csak kiegyensúlyozott töredékeket egy-egy al-fa jelöli. Ezért szükségünk lehet egy olyan eszközre, amely a HTML szakaszok megjelölésénél, a jelölő struktúrától függetlenül segít egyensúlyt tartani, ilyen eszköz az XPointer.

A jó szemantikus HTML maga is javítja az a webdokumentumok elérhetőségét (lásd még: Webtartalom Hozzáférhetőségi Irányelvek). Például, ha a képernyőolvasó vagy a hangböngésző helyesen meg tudja állapítani a dokumentum szerkezetét, akkor nem fogja a látássérült felhasználó idejét ismétlődő vagy irreleváns információ felolvasásával vesztegetni.

A Google a "bővített szövegrészletek" szerkesztés

2010-ben a Google három, a rendszeri által használt metaadat struktúrát határozott meg, ezek alapján fognak strukturált szemantikai tartalmat keresni a weboldalakon. Ezzel a recenziós, személyi és üzleti illetve eseményleíró információval fogják kiegészíteni a "snippeteket". Ezek azok a rövid szövegrészek, amelyek a keresőmotorok találati listáján megjelennek. A Google úgy határozza meg, hogy ilyen adatok mikroadat. mikroformátum, vagy RDFa[13] segítségével adhatók meg. A mikroadat a meglévő HTML elemek belső itemtype , itemprop attribútumában hozzáadott adat. A mikroformátum class osztályleíró kulcsszavaiban megadott információ. Az RDFa a meglévő elemek rel, typeof , property tulajdonságokban hozzáadott információkra támaszkodik.[13]

Jegyzetek szerkesztés

  1. Berners-Lee, Tim: Weaving the Web : the original design and ultimate destiny of the World Wide Web by its inventor. Fischetti, Mark. 1st ed. 1999. ISBN 0062515861 Hozzáférés: 2018. október 21.  
  2. Raggett, Dave: Adding a touch of style. World Wide Web Consortium, 2002. április 8. (Hozzáférés: 2010. december 8.)
  3. Raggett, Dave: Getting started with HTML. World Wide Web Consortium, 2005. április 24. (Hozzáférés: 2010. december 8.)
  4. Berners-Lee: The Semantic Web. Scientific American, 2001. (Hozzáférés: 2009. október 2.)
  5. Shadbolt: The Semantic Web Revisited (PDF). IEEE Intelligent Systems, 2006. május 1. [2013. március 20-i dátummal az eredetiből archiválva]. (Hozzáférés: 2010. december 8.)
  6. Plain Old Semantic HTML (POSH). Microformats Wiki . microformats community, 2007. április 20. (Hozzáférés: 2013. május 4.)
  7. a b Understanding Semantic HTML and Its Applications for 2015 and Beyond. Dallas SEO Geek. [2018. október 22-i dátummal az eredetiből archiválva]. (Hozzáférés: 2015. október 26.)
  8. Let's Talk about Semantics. HTML 5 Doctor. (Hozzáférés: 2015. október 26.)
  9. a b HTML5. World Wide Web Consortium
  10. HTML5. World Wide Web Consortium
  11. Ezek az osztálynevek a legjobb esetben csak szuggesztívek lesznek, és nem formálisan értelmezhetőek, hacsak a szöveg szerzője meg nem osztotta tartalmukat a szöveg felhasználóival.
  12. Well-Formed XML Documents. Extensible Markup Language (XML) 1.1. W3C
  13. a b Businesses and organizations - About organization information. Webmaster Central. Google. (Hozzáférés: 2010. május 26.)

Fordítás szerkesztés

Ez a szócikk részben vagy egészben a Semantic HTML című angol Wikipédia-szócikk ezen változatának fordításán alapul. Az eredeti cikk szerkesztőit annak laptörténete sorolja fel. Ez a jelzés csupán a megfogalmazás eredetét és a szerzői jogokat jelzi, nem szolgál a cikkben szereplő információk forrásmegjelöléseként.

További információk szerkesztés

Kapcsolódó szócikkek szerkesztés