„Webarchiválás” változatai közötti eltérés

[nem ellenőrzött változat][nem ellenőrzött változat]
Tartalom törölve Tartalom hozzáadva
Nemethm78 (vitalap | szerkesztései)
aNincs szerkesztési összefoglaló
Nemethm78 (vitalap | szerkesztései)
aNincs szerkesztési összefoglaló
26. sor:
 
=== A távoli aratással begyűjtött anyagok tárolási formája és megjelenítés módjai ===
A HTTRACKHTTrack ugyanabban a könyvtárszerkezetben gyűjti be a webes anyagot, ahogyan az eredeti webhelyen megjelent. A hosszútávú megőrzéshez azonban a webarchívumok ennél célravezetőbb tárolási módot használnak. A WARC a robotok által által begyűjtött digitális objektumok és metaadataik tárolására szolgáló, 2009-ben szabványosított (ISO 28500), nyílt formátum. A WARC fájl egy olyan (jellemzően nagyméretű) csomag, amely egy vagy több WARC rekordot tartalmaz (ezeknek 8 fajtája létezik), melyek mindegyike egy header-ből és egy content block-ból áll. Utóbbiban bármilyen fájltípus tárolható. A Heritrix által vezérelt robotok ilyen gyűjtőfájlokba mentik a learatott tartalmat<ref>{{Cite web |title=WARC – MIA WIKI szócikk |url=http://mekosztaly.oszk.hu/mediawiki/index.php/WARC |work=mekosztaly.oszk.hu |accessdate=2019-03-13}}</ref>. A WARC fájlokba mentett tartalmakat a [[Wayback Machine]] nyílt forráskódú szoftver segítségével jelenítik általában meg, de léteznek alternatív megoldások is például a webrecorder player.<ref>{{Cite journal|date=2019-03-13|title=Webrecorder Player WARC fájl megjelenítő alkalmazás fejlesztői honlapja angol nyelven|url=https://github.com/webrecorder/webrecorder-player}}</ref>
 
=== Adatbázis archiválás ===