archive.today

(Archive.is szócikkből átirányítva)

Az archive.today (vagy archive.is) egy 2012-ben alapított webarchiváló oldal, mely kérés alapján snapshotot készít többek között olyan weboldalakról is, mint a Javascripttel hevesen megtámogatott Google Maps vagy a Twitterhez hasonló progresszív webes alkalmazásokról.[1] Az archive.today 2 snapshotot készít. Az egyik minden funkcionális élő linket magában foglal, a másik pedig a weboldalról készített képernyőkép.[2]

archive.today
Vállalkozás típusa
  • webhely
  • webarchívum
  • böngészőbővítmény
Oldal típusa
  • webhely
  • webarchívum
  • böngészőbővítmény
Elérhető nyelv(ek)több nyelv
Alapítva2012. május 16.
URL[ ]
RegisztrációNem
Hivatalos bloghttps://blog.archive.today/
Alexa-helyezés9725 (https://archive.is, 2021. június 15.)
A Wikimédia Commons tartalmaz archive.today témájú médiaállományokat.

Jellemzői szerkesztés

Funkcionalitás szerkesztés

Az archive.today kifejezett felhasználói kérést követően képes egyéni oldalakat letárolni.[3][4][5] Az archive.today a kezdetektől fogva támogatta a ma már teljesen elfogadott # jelet az URL-ek tagolásában.[6]

Az archive.today csak szöveget és képeket rögzít, az XML, az RTF valamint az xls, xlsx és ods formátumúhoz hasonló táblázatkezelő formátumok, valamint a nem statikus elemek nem lesznek letárolva. Ennek ellenére néhány oldal, így például a Twitter videóit lementi.[7] Kezeli a lementett snapshotok idővonalát, és megerősítést kér, mielőtt egy már rögzített weboldal újabb változatát akarjuk lementeni.[8][9]

Az oldalakat 1024 képpont szélességű böngészővel menti el. A CSS file-okat inline CSS-ekké konvertálja, eltávolítja a reszponziv weboldalakat valamint a :hover és az :active kódokhoz hasonló választókat. A keresés során a JavaScript által generált tartalmak is szerepelnek a befagyott weboldalon.[10] A HTML osztályok neveit rögzíti az old-class atribútomon belül. Ha szöveget jelölnek ki, egy JavaScript kódsor egy olyan URI részt készít, mely látható a böngésző címsorában, melyet legközelebb használva az oldal úgy töltődik be, hogy benn marad az eredeti kijelölés.

Az archive.today oldalairól a web.archive.org oldalon nem lehet második szintű adatmentést végrehajtani, mert az archive.today visszautasítja a Wayback Machine kéréseit, és nem készít az ottani oldalakról WARC formátumú snapshotot. Fordított irányú, a web.archive.org-ról az archive.today-re történő adatmentés – lehetséges,[11] de a másolat elkészítése több időt vesz igénybe, mintha közvetlen mentést készítünk az oldalról. Az Internet Archive listájából akár visszamenőlegesen is törölhettek vagy blokkolhattak olyan oldalakat, melyek robots.txt file-t, használtak, de az archive.today nem használja ezt ki.[12]

A kereső felületen haladó kereső kifejezéseket is lehet használni, valamint tudja kezelni a *-hoz hasonló helyettesítő karaktereket. például egy sor kérdőjel a keresett kifejezést az adott cím vagy szövegrész egy konkrét részére irányítja, míg az insite operátor egy meghatározott internet domainre szűkít.[13]

Ha egy oldalt archiváltak már, azt egy felhasználó már nem tudja kitörölni.[14]

Reklámokat, felugró ablakokat és tovább mutató linkeket úgy lehet törölni, hogy erre a tulajdonost kérjük meg.[15]

Dinamikus listák mentésekor az archive.today kereső doboza csak olyan eredményeket mutat, mely a lista előző vagy következő elemére mutat (például a következő 20 oldal).[16] Más weboldalakat úgy mentenek, hogy a listák szűrve fordulnak elő, és minden elem csak az első előfordulásával szerepel.[8][pontosabban?]

A kereső alkalmazást a Google CustomSearch-e támogatja. Ha nem talál eredményt, az oldal megpróbálkozik a Yandex Search alkalmazásával.[17]

Mentés közben megjeleníti az egyes URL elemek címét, az elem méretét, a http-állapotkódját és a média típusát. Ezeket az adatokat csak a keresési folyamat alatt lehet látni.

ZIP file-ként le lehet menteni az archivált oldalakat, kivéve azokat, melyeket 2019. november 29. óta archiváltak, mert akkor az archive.today a kereső motorját PhantomJS-ről Chromiumra cserélte.[18]

2013. július óta az archive.today támogatja a Memento Project API-ját.[19][20]

Története szerkesztés

Az archive.today-t 2012-ben alapították. Az oldal eredetileg archive.today-nek nevezte magát, de 2015. májusban az elsődleges tüköroldalát az archive.is-re irányította át.[21]

2019. januárban az archive.is domaint háttérbe szorította, és inkább az archive.today-t használta.[22]

Elérhetősége szerkesztés

Ausztrália szerkesztés

2019. márciusban, a christchurchi mecset elleni támadás után több ausztrál internetszolgáltató blokkolta a hozzáférést az oldalhoz, hogy így csökkentsék a támadáskor készült képek terjedését.[23][24]

Kína szerkesztés

A GreatFire.org szerint az archive.today-t Kínában 2016. márciusban blokkolták.[25] Az archive.li 2017. szeptemberben,[26] az archive.fo 2018. júliusban,[27] az archive.ph pedig 2019. decemberben[28] jutott ugyanerre a sorsra.

Finnország szerkesztés

2015. július 21-én a a szolgáltatók minden finn IP-címről blokkolták a hozzáférést az oldalhoz, hogy ezzel is visszaszorítsák a finn kormánnyal zajló vitájukat.[29] A blokkolást azóta már megszüntették.

Oroszország szerkesztés

Oroszországban csak HTTP kapcsolatot lehet létrehozni, HTTPS-t nem, azokat blokkolátk.[30][31]

Elérhetőség a Cloudflare DNS-én keresztül szerkesztés

2018-ban nem lehetett hozzáférni az oldalhoz a Cloudflare 1.1.1.1 DNS szolgáltatásán keresztül.[32] A Cloudflare személyzete szerint a probléma az archive.today oldalán van, mert ha a kérelem a Cloudfare hálózatából érkezik, a jóváhagyó névszerverek érvénytelen üzenetet küldenek vissza. Az archive.today ezt azzal magyarázza, hogy a Cloudflare nem küld EDNS Client Subnet információkat a DNS kérelmekben.[33][34]

Jegyzetek szerkesztés

  1. Create publicly available web page archives with Archive.is. Ghacks , 2015. április 22. [2019. április 12-i dátummal az eredetiből archiválva]. (Hozzáférés: 2015. június 13.)
  2. (2015. január 25.) „The impact of JavaScript on archivability”. International Journal on Digital Libraries 17 (2), 95–117. o. DOI:10.1007/s00799-015-0140-8.  
  3. Web page archiving – Dan Dascalescu's Wiki (review). Wiki.dandascalescu.com, 2013. február 18. [2013. szeptember 22-i dátummal az eredetiből archiválva]. (Hozzáférés: 2013. október 3.)
  4. Dear GamerGate: Please Stop Stealing Our Shit. Motherboard, 2014. október 29. [2019. május 27-i dátummal az eredetiből archiválva]. (Hozzáférés: 2017. március 22.) „There is no way for a website to protect itself from having an Archive.today user mirror the site.”
  5. archive.is/faq (angol nyelven). archive.is . (Hozzáférés: 2019. február 15.)
  6. Home page of Archive.is in 2013. [2013. január 12-i dátummal az eredetiből archiválva].
  7. Archive.today blog. [2021. szeptember 7-i dátummal az eredetiből archiválva].
  8. a b Archiving Websites with the Archive.is, <https://www.youtube.com/watch?v=LK_bp9_ZyQs>. Hozzáférés ideje: 2022-01-27
  9. Example snapshot history on archive.is
  10. JavaScript-generated loading animation of Dailymotion video appearing in a frozen state
  11. Example: Page saved from Web Archive to Archive.is (spanyol nyelven). [2013. május 20-i dátummal az eredetiből archiválva]. (Hozzáférés: 2019. október 23.)
  12. Archive.today FAQ. archive.ph
  13. "World+Cup"/ Például a insite: https://en.wikipedia.org "World Cup" laraktersor a következő eredményt hozza
  14. Some Frequently Asked Question (blog). archive.is , 2013. január 24. [2013. szeptember 26-i dátummal az eredetiből archiválva]. (Hozzáférés: 2018. november 12.)
  15. Example user request on the Archive.is blog. Archive.is blog . (Hozzáférés: 2022. április 7.)
  16. Example of dynamic list. WorldCat.org
  17. Just realized that I can search for keywords in the search bar for archive today, was this a recently added feature?. Archive.is blog . (Hozzáférés: 2022. január 27.)
  18. Archive.is blog, 2020. július 17. [2020. október 3-i dátummal az eredetiből archiválva].
  19. Archive.is Supports Memento (angol nyelven). Research and Teaching Updates. Web Science and Digital Libraries Research Group at Old Dominion University, 2013. július 9. [2013. július 27-i dátummal az eredetiből archiválva]. (Hozzáférés: 2013. szeptember 17.)
  20. archive.is. Memento Protocol Information . Memento Development Group. [2013. szeptember 15-i dátummal az eredetiből archiválva]. (Hozzáférés: 2013. szeptember 17.)
  21. Why did you change the URL back from archive-today to archive-is?. Archive.is Blog, 2015. május 3. [2015. június 1-i dátummal az eredetiből archiválva]. (Hozzáférés: 2019. január 6.)
  22. @archiveis: Please do not use archive.IS mirror for linking, use others mirrors [.TODAY .FO .LI .VN .MD .PH. .IS might stop working soon.], 2019. január 4. [2019. január 6-i dátummal az eredetiből archiválva].
  23. ISPs in AU and NZ start censoring the internet without legal precedent. Private Internet Access , 2019. március 19. (Hozzáférés: 2019. március 20.)
  24. New Zealand ISPs Say They're Blocking Sites That Fail To Remove Christchurch Shooting Video. Gizmodo Australia, 2019. március 19. [2019. május 18-i dátummal az eredetiből archiválva]. (Hozzáférés: 2019. március 20.)
  25. archive.is is 100% blocked in China. GreatFire Analyzer , 2018. augusztus 12. [2018. augusztus 12-i dátummal az eredetiből archiválva].
  26. archive.li is 100% blocked in China. Great Fire Analyzer , 2018. augusztus 12. [2018. augusztus 12-i dátummal az eredetiből archiválva].
  27. archive.fo is 100% blocked in China. Great Fire Analyzer , 2018. augusztus 12. [2018. augusztus 12-i dátummal az eredetiből archiválva].
  28. archive.ph is 100% blocked in China. en.greatfire.org . (Hozzáférés: 2022. április 7.)
  29. Suomalaisilta estettiin haktivistien suosimalla verkkosivulla käynti (finn nyelven). Iltalehti, 2015. július 22. [2019. május 27-i dátummal az eredetiből archiválva]. (Hozzáférés: 2016. március 4.)
  30. Roskomnadzor zablokiroval servis archive.is, khranyashchiy kopii veb-saytov (orosz nyelven). TJournal , 2016. január 29. [2017. augusztus 30-i dátummal az eredetiből archiválva]. (Hozzáférés: 2016. január 30.)
  31. Russia Blocks Another Archive Site Because It Might Contain Old Pages About Drugs. Techdirt, 2016. február 4. [2019. március 23-i dátummal az eredetiből archiválva]. (Hozzáférés: 2016. február 26.)
  32. Archive.is - Error 1001 (angol nyelven). Cloudflare Community , 2018. május 15. (Hozzáférés: 2021. december 2.)
  33. @archiveis: "Having to do" is not so direct here. Absence of EDNS and massive mismatch (not only on AS/Country, but even on the continent level) of where DNS and related HTTP requests come from causes so many troubles so I consider EDNS-less requests from Cloudflare as invalid.
  34. Comment by Matthew Prince on Hacker News. Hacker News , 2019. május 4. [2022. november 28-i dátummal az eredetiből archiválva]. (Hozzáférés: 2021. október 4.)

További információk szerkesztés

A Wikimédia Commons tartalmaz Archive.today témájú médiaállományokat.

Kapcsolódó szócikkek szerkesztés