„Veszteségmentes tömörítés” változatai közötti eltérés

[nem ellenőrzött változat][ellenőrzött változat]
Tartalom törölve Tartalom hozzáadva
SamatBot (vitalap | szerkesztései)
a kozmetikai javítások
XZeroBot (vitalap | szerkesztései)
a Bot: pl. javítása példáulra, Replaced: pl. → például (4)
1. sor:
A '''veszteségmentes tömörítés''' az [[adattömörítés]]i [[algoritmus]]ok egy osztálya, ami lehetővé teszi a tömörített adatból az eredeti adatok pontos rekonstrukcióját. Párja a [[veszteséges tömörítés]], amikor az eredeti adatok nem mindig állíthatók pontosan helyre – ezt főleg a [[multimédia]] területén használják.
 
Veszteségmentes tömörítést számos program használ. Legnyilvánvalóbb előfordulási helyük az archív fájlformátumok, mint pl.például a népszerű [[ZIP]], a [[unix]]os [[gzip]], vagy a [[7z]] formátum. Gyakran veszteséges tömörítési eljárások részeként is előfordul.
 
Veszteségmentes tömörítést akkor alkalmaznak, ha fontos, hogy az eredeti és a kicsomagolt adat bitről bitre megegyezzen, illetve ha nem tudni, hogy az esetleges eltérések kritikusak-e. Tipikus példák a futtatható állományok vagy a forráskódok. Néhány képformátum, köztük a [[PNG]] csak veszteségmentes tömörítést használ, míg egy [[TIFF]] vagy [[MNG (informatika)|MNG]] fájl veszteséges és veszteségmentes tömörítést is tartalmazhat. A [[GIF]] veszteségmentes tömörítést használ, de a legtöbb megvalósításában csak 8 bites [[színmélység]]gel, így egy [[true color]] képet először [[kvantálás|kvantálni]] kell (gyakran [[dithering]]<!-- összemosás?--> használatával) mielőtt GIF-be lehetne kódolni. A kvantálás veszteséges módszer, de maga a tömörítés veszteségmentes.
12. sor:
 
Statisztikai modellkészítő algoritmusok szöveges bemeneti adatokra (vagy szöveg-jellegű bináris adatokra, mint amilyenek a futtatható fájlok):
* [[Burrows-Wheeler transzformáció]] (blokkos rendezéssel előfeldolgozza a szöveget, ami a tömörítést hatékonyabbá teszi), pl.például a [[bzip]] és a [[bzip2]] használja
* [[LZ77]] és [[LZ78]], a [[DEFLATE]] tömörítési algoritmus használja
* [[LZW]]
22. sor:
A fenti módszerek előfordulnak a legkülönbözőbb nyílt forrású és kereskedelmi programokban, leggyakrabban az [[LZW]] és variánsai. Néhány algoritmus szabadalmi védelem alatt áll az [[USA]]-ban, és más országokban ahol lehetséges algoritmusokat szabadalmaztatni. Ezeket licencelni kell a jogszerű használathoz. Éppen az LZW tömörítés bizonyos fajtáira vonatkozó szabadalmak, és a szabadalom tulajdonosának, a [[Unisys]]nek a praktikái miatt szólították fel az információszabadságért küzdők az [[1990-es évek]] közepétől az embereket, hogy váltsák fel a [[GIF]] formátumot a [[PNG]]-vel, ami elkerüli a jogi csapdát, és még kisebb fájlméretet is nyújt. A Unisys szabadalma 2003-ban elévült.
 
A szöveges adatokon jó hatásfokkal működő veszteségmentes tömörítési technikák sokszor elég jó eredményt nyújtanak palettázott képekre is, de léteznek más technikák, amik szöveg esetében gyengén teljesítenek, viszont egyszerű bittérképes grafikáknál hasznosak. Ezeken túl vannak képekre specializált tömörítő algoritmusok, amik pl.például kihasználják, hogy a képen 2 dimenzióban egymáshoz közel eső részek általában azonos vagy közel azonos színűek, és hogy a színes képek általában a teljes színskála csak egy korlátozott kis részét használják ki.
 
A veszteségmentes hangtömörítés elég speciális terület. Az idetartozó algoritmusok kihasználhatják az adatok hullám-jellegéből adódó ismétlődő mintázatait – lényegében modelleket állítva fel a „következő” érték megbecslésére, és elkódolni a (remélhetőleg kicsi) eltérést a becsült és a tényleges érték között.
 
Ha az eltérés a becsült és a tényleges érték között (azaz a „hiba”) általában kicsi, akkor bizonyos differencia-értékek (pl.például 0, +1, −1) nagyon gyakoriak lehetnek, amit ki lehet használni, és le lehet tárolni őket kevesebb biten is.
 
Néha hasznos, ha egy fájl két verziója között csak a különbséget tömörítjük (vagy a [[videotömörítés]]ben egy kép verziói között). Ezt a technikát [[delta-kódolás]]nak nevezik (a görög [[delta|Δ]] betűből, amit a matematikában gyakran különbség jelölésére használnak), de általában csak akkor hívják így, ha mindkét változat önmagában is értelmes. Például, a hiba tömörítését az előbb említett hangtömörítési séma esetében leírhatnánk az eredeti és a becsült hanghullám közti delta-kódolásként, ám a hullámforma közelítő, becsült alakja nem használatos a tömörítésen kívüli semmilyen kontextusban.