Magyar ékezetes karakterek kódkészletekben

A kódkészletek megalkotásánál a magyar nyelv a besorolása szerint latin2-es kódkiosztásba került. A korábban általánosan elterjedt kódkészlet a latin1 viszont nem tartalmazza az összes magyar betűt, ill. néhánynak mivel azonos a kódja a latin1-ben és latin2-ben helyettesíthető ezekkel.

A magyar ékezetes betűk, a magyar tipográfia néhány gyakran használt írásjeleit, valamint néhány nem magyar (ám tévedésből magyar szövegben gyakran szereplő) betű kódját vesszük górcső alá a legkülönfélébb karakterkészletekben.

Linux terminál szerkesztés

Az ASCII kiosztást a Linux terminálon kiadott man ascii, míg a Latin-1 és Latin-2 kiosztás ékezetes betűit a man iso-8859-1 és man iso-8859-2 paranccsal tekinthetjük meg.

Megjegyzés szerkesztés

A 256-nál kisebb értékű Unicode kódok megegyeznek a Latin-1 kódokkal, amelyik pedig, ha csak a magyar betűkre szorítkozunk, az ő és ű (valamint a megfelelő nagybetűs párjuk) kivételével megegyeznek a Latin-2-es kódokkal. A legtöbb magyar betű Latin-2 és Unicode értéke megegyezik, de az ő és ű betűké nem. UTF-.8 esetén az összes említett ékezetes karakter 2 bájt hosszú.

Összehasonlító táblázat szerkesztés

A táblázatban megtalálhatók a régi (Latin-2) és új (Unicode, UTF-8) kódérték. Ha egy karakterkészlet nem képes a magyar nyelv ékezetes betűinek támogatására, az üresen maradt.

Az Unicode oszlopban található kód értékek nem férnek el 1 byte-ban (256-nál nagyobb értékek), ezért változó - általában kettő vagy több bájttal reprezentálhatók UTF-8-as karakterekként.

Kódkészletek
Karakter CP437 CP850 CP852 CWI-2 Latin-1 Latin-2 Windows-1252 Windows-1250 Unicode (UCS-16) UTF-8
Á B5 B5 8F C1 C1 C1 C1 00 C1 C3 81
É 90 90 90 90 C9 C9 C9 C9 00 C9 C3 89
Í D6 D6 8D CD CD CD CD 00 CD C3 8D
Ó E0 E0 95 D3 D3 D3 D3 00 D3 C3 93
Ö 99 99 99 99 D6 D6 D6 D6 00 D6 C3 96
Ő 8A A7 D5 D5 01 50 C5 90
Ú E9 E9 97 DA DA DA DA 00 DA C3 9A
Ü 9A 9A 9A 9A DC DC DC DC 00 DC C3 9C
Ű EB 98 DB DB 01 70 C5 B0
Ô (kalapos) E2 E2 D4 D4 D4 D4 00 D4 C3 94
Õ (hullámos) E5 D5 D5 00 D5 C3 95
Û (kalapos) EA DB DB 00 DB C3 9B
Ũ (hullámos) 01 68 C5 A8
á A0 A0 A0 A0 E1 E1 E1 E1 00 E1 C3 A1
é 82 82 82 82 E9 E9 E9 E9 00 E9 C3 A9
í A1 A1 A1 A1 ED ED ED ED 00 ED C3 AD
ó A2 A2 A2 A2 F3 F3 F3 F3 00 F3 C3 B3
ö 94 94 94 94 F6 F6 F6 F6 00 F6 C3 B6
ő 8B 93 F5 F5 01 51 C5 91
ú A3 A3 A3 A3 FA FA FA FA 00 FA C3 BA
ü 81 81 81 81 FC FC FC FC 00 FC C3 BC
ű FB 96 FB FB 01 71 C5 B1
ô (kalapos) 93 93 93 F4 F4 F4 F4 00 F4 C3 B4
õ (hullámos) E4 F5 F5 00 F5 C3 B5
û (kalapos) 96 96 FB FB 00 FB C3 BB
ũ (hullámos) 01 69 C5 A9
– (nagykötőjel) 01 50 01 50 20 13 E2 80 93
„ (nyitó idézőjel) 01 32 01 32 20 1E E2 80 9E
’ (aposztróf) 01 46 01 46 20 19 E2 80 99

További információk szerkesztés