Veszteséges tömörítés

az adattömörítési algoritmusok egy osztálya

A veszteséges tömörítés az adattömörítési algoritmusok egy osztálya, ami a veszteségmentes tömörítéssel ellentétben nem teszi lehetővé a tömörített adatból az eredeti adatok pontos rekonstrukcióját, ám egy „elég jó” rekonstrukciót igen. Az interneten használják leginkább, a telefóniás és streamelési alkalmazásokban. A veszteséges tömörítési módszerekre általában codec néven hivatkoznak.

A veszteséges tömörítés fajtái szerkesztés

Két alapkoncepció létezik veszteséges tömörítésre:

  • a veszteséges transzformációs kodekekben a forrásból (hang, kép stb.) mintavétel történik, ezt új bázistérbe transzformálják, majd kvantálják. A végeredményt entrópia-kódolásnak (például Huffman-kódolás) vetik alá.
  • a veszteséges prediktív kodekekben az adott mintát megelőző és/vagy követő minták segítségével próbálják megjósolni az aktuális hangmintát vagy képkockát. A megjósolt adat és a valós adat közti eltérést (a jóslás reprodukálásához szükséges egyéb információkkal együtt) kvantálják és kódolják.

Egyes rendszerekben a két technikát kombinálják, és transzformációs kodekkel tömörítik a prediktív kodek hibajelét.

Veszteséges és veszteségmentes tömörítés szerkesztés

A veszteséges módszerek használatának az az előnye a veszteségmentes módszerekhez képest, hogy sok esetben a veszteséges tömörítés sokkal kisebb fájlt képes előállítani, mint bármely veszteségmentes, és még így is kellően jó minőséget ér el.

A veszteséges módszereket általában a hang-, kép- és videotömörítés során használják. A tömörítési arány (tehát a tömörített fájl mérete a tömörítetlenhez képest) általában a videók esetében a legjobb (akár 300:1 is lehet látható minőségromlás nélkül), hanganyagnál ez az érték 10:1 körül mozog. A veszteségesen tömörített képeknél is gyakori a 10:1-es tömörítési arány, de a minőségromlás itt vehető észre talán a legkönnyebben.

A veszteségesen tömörített fájl bitszinten teljesen különböző lehet az eredetitől, ugyanakkor az emberi szem vagy fül számára nehéz lehet megkülönböztetni őket. A legtöbb veszteséges tömörítő figyelembe veszi az emberi test anatómiai felépítését: például, hogy az emberi szem bizonyos frekvenciájú fényt lát csak. A hangtömörítés során pedig felhasználják az emberi hallás pszichoakusztikus modelljét, ami tartalmazza, hogy az emberi fül milyen hangmagasságokra érzékenyebb, vagy hogy az egyszerre megszólaló frekvenciák hogyan maszkolják egymást.

Példa veszteséges tömörítésre szerkesztés

 
Az eredeti kép 100%-os minőséggel (méret: 38,9 KB)
 
Ugyanaz a kép tömörítve (csaknem 97%-kal kevesebb információ, 1,2 KB)
 
Ugyanaz, erős tömörítés után (csaknem 98,5%-kal kevesebb információ, 662 bájt)

A fenti képek demonstrálják, hogyan csökkenti a fájlméretet a veszteséges tömörítés. A kép egy levelibékáról készült kép 128×128 képpontnyi részlete.

  • Az első kép 39 798 bájt méretű.
  • A második kép tömörítve lett (JPEG quality 15) és csaknem 97%-kal kisebb, 1250 bájtos. Jól észrevehetően egyes részletek elvesztek.
  • A harmadik kép, erős tömörítés után (JPEG quality 5) 98,5%-kal kisebb, mindössze 662 bájtos. A tömörítési hibák (compression artifacts), a JPEG-tömörítés blokkjai sokkal észrevehetőbbek.

Bár a harmadik kép minősége nagyon rossz, a béka még mindig felismerhető. A jó veszteséges tömörítési algoritmusok képesek arra, hogy a „kevésbé fontos” információkat kidobják, a „lényeges” információkat pedig meghagyják az eredeti fájlból.

Veszteséges tömörítési módszerek szerkesztés

Képi adatok tömörítése szerkesztés

Képtömörítés szerkesztés

Videotömörítés szerkesztés

Hangtömörítés szerkesztés

Zene szerkesztés

Beszédtömörítés szerkesztés

Egyéb adattípusok szerkesztés

Technikai értelemben, egy szöveg méretének csökkentése a magánhangzók eltávolításával szintén veszteséges tömörítésnek tekinthető. A szöveg általában még így is értelmezhető marad, a mássalhangzók nyújtatta kontextus segítségével. A kutatók félig-meddig viccesen veszteséges tömörítést végeztek akkor is, amikor a hosszú szavakat a szövegben közel azonos jelentésű rövidebb szavakra cserélték [1], bár ez már inkább a veszteséges adatkonverzió kategóriájába tartozik.

Kapcsolódó szócikkek szerkesztés

Források szerkesztés

További információk szerkesztés