ISO/IEC 646
Ez a szócikk nem tünteti fel a független forrásokat, amelyeket felhasználtak a készítése során. Emiatt nem tudjuk közvetlenül ellenőrizni, hogy a szócikkben szereplő állítások helytállóak-e. Segíts megbízható forrásokat találni az állításokhoz! Lásd még: A Wikipédia nem az első közlés helye. |
Ez a szócikk vagy szakasz lektorálásra, tartalmi javításokra szorul. (2006 decemberéből) |
Az ISO 646 az ISO nemzetközi szabványa, ami a 7 bites karakter kódolást határozza meg, és amelyből számos nemzeti szabvány is származik, amelyek közül az egyik legismertebb az ASCII. Mivel az ISO 646 egyes részei minden ország részére közösek, a szabvány angol ábécéjét, míg más országok számára a latin ábécét határozták meg, kiegészítve a nemzeti ábécé (nyelv) sajátosságaival, így az ISO 646 képes kezelni a különböző nyelveket. Mivel jelenleg nincs mindenki által elfogadott 8 bites byte kódolási szabvány nemzeti nyelvekre, így a nemzeti nyelveket csak 7 bites formában lehet szabványosan kódolni, ezért néhány karakter, ami az ASCII-ben szerepel, hiányzik az ISO 646 nemzeti változataiból.
Története
szerkesztésAz ISO/IEC 646 és elődjei, az ASCII, az ANSI X3.4, jelentették a telekommunikációs iparban a meghonosodott gyakorlatot.
Az 1960-as évektől szinte állandóan felmerült a karakter kódolási szabványok egységesítésének igénye (mind a nemzeti, mind a nemzetközi szervezetek szintjén), mivel 1) a telekommunikációs ipar létező gyakorlatát követték (amely akkor még többnyire lyukszalag alapú volt, viszont általánosan használták online digitális kábeleken való átvitelek esetében), vagy esetleg 2) a szintén létező, számítógépiparban elterjedt lyukkártya gyakorlat egy részének használata, amit a 2. világháborús és későbbi elektromechanikus lyukkártya gépektől örököltek a digitális számítógépek. Néha a cégek történeti okokból folytatták a Hollerith-lyukkártyák használatát, ahogyan az IBM is beépítette az EBCDIC kódolásba a "kártyás" elemeket, valamint ehhez csatlakoztak más gyártók is, így lassan egy telekommunikációs ipari karakter kódolási szabvány alakult ki.
Az ISO 8859 sorozatú szabványok meghatározták a 8 bites karakter kódolási szabványokat, amik kiváltották az ISO 646 nemzetközi szabványt és annak nemzeti változatait. Az ISO/IEC 10646 szabvány, direkt kapcsolódva a Unicode-hoz, kiváltotta az összes ISO 646-os és ISO 8859-es kódkészletek nemzeti változatait egy egységes karakter kódkészlettel és kódolási eljárással.
Nemzeti változatok
szerkesztésAz ISO 646 néhány nemzeti változata:
|
|
A későbbi szabványok bizonyos jellemzőit nemzetközi használatra különböző szabványosítási szervezetek hagyták jóvá:
|
|
Néhány nemzeti változat specifikumait mutatja a következő táblázat:
Kódok | Minden ISO 646-os karakterkészlettel kompatibilis karakterek | ||||||||||||||||||||||||||||||
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
bináris | decimális | hexa | INV | US | T.61 | JA | JA-O | CN | IRV | GB | DK | NO | NO-2 | SE | SE-C | DE | HU | FR | FR-0 | CA-1 | CA-2 | IE | IS | ita | por | PT | esp | ES | CU | MT | YU |
010 0010 | 34 | 22 | " | " | " | " | " | " | " | " | " | " | " | " | " | " | " | " | " | " | " | " | " | " | " | " | " | " | " | " | " |
010 0011 | 35 | 23 | # | # | # | # | # | # | £ | # | # | § | # | # | # | # | £ | £ | # | # | £ | # | £ | # | £ | # | # | # | # | # | |
010 0100 | 36 | 24 | $ | ¤ | $ | $ | ¥ | $ | $ | $ | $ | $ | ¤ | ¤ | $ | ¤ | $ | $ | $ | $ | $ | $ | $ | $ | $ | $ | $ | ¤ | $ | $ | |
010 1001 | 39 | 27 | ' | ' | ' | ' | ' | ' | ’ | ’ | ’ | ’ | ’ | ’ | ’ | ’ | ’ | ’ | ’ | ’ | ’ | ’ | ’ | ’ | ’ | ’ | ’ | ’ | ’ | ’ | ’ |
010 1100 | 44 | 2C | , | , | , | , | , | , | , | , | , | , | , | , | , | , | , | , | , | , | , | , | , | , | , | , | , | , | , | , | , |
010 1101 | 45 | 2D | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - | - |
010 1111 | 47 | 2F | / | / | / | / | / | / | / | / | / | / | / | / | / | / | / | / | / | / | / | / | / | / | / | / | / | / | / | / | / |
100 0000 | 64 | 40 | @ | @ | @ | @ | @ | @ | @ | @ | @ | @ | @ | É | § | Á | à | à | à | à | Ó | Ð | § | § | ´ | § | · | @ | @ | Ž | |
101 1011 | 91 | 5B | [ | [ | [ | [ | [ | [ | [ | Æ | Æ | Æ | Ä | Ä | Ä | É | ° | ° | â | â | É | Þ | ° | Ã | Ã | ¡ | ¡ | ¡ | ġ | Š | |
101 1100 | 92 | 5C | \ | ¥ | ¥ | \ | \ | \ | Ø | Ø | Ø | Ö | Ö | Ö | Ö | ç | ç | ç | ç | Í | \ | ç | Ç | Ç | Ñ | Ñ | Ñ | ż | Đ | ||
101 1101 | 93 | 5D | ] | ] | ] | ] | ] | ] | ] | Å | Å | Å | Å | Å | Ü | Ü | § | § | ê | ê | Ú | Æ | é | Õ | Õ | ¿ | Ç | ] | ħ | Ć | |
101 1110 | 94 | 5E | ^ | ^ | ^ | ^ | ˆ | ˆ | ˆ | ˆ | ˆ | ˆ | Ü | ˆ | ˆ | ^ | ˆ | î | É | Á | Ö | ˆ | ˆ | ˆ | ˆ | ¿ | ¿ | ˆ | Č | ||
101 1111 | 95 | 5F | _ | _ | _ | _ | _ | _ | _ | _ | _ | _ | _ | _ | _ | _ | _ | _ | _ | _ | _ | _ | _ | _ | _ | _ | _ | _ | _ | _ | _ |
110 0000 | 96 | 60 | ` | ` | ` | ` | ` | ` | ` | ` | ` | é | ` | á | µ | µ | ô | ô | ó | ð | ù | ` | ` | ` | ` | ` | ċ | ž | |||
111 1011 | 123 | 7B | { | { | { | { | { | { | æ | æ | æ | ä | ä | ä | é | é | é | é | é | é | þ | à | ã | ã | ° | ´ | ´ | Ġ | š | ||
111 1100 | 124 | 7C | | | | | | | | | | | | | | | ø | ø | ø | ö | ö | ö | ö | ù | ù | ù | ù | í | | | ò | ç | ç | ñ | ñ | ñ | Ż | đ | |
111 1101 | 125 | 7D | } | } | } | } | } | } | å | å | å | å | å | ü | ü | è | è | è | è | ú | æ | è | õ | õ | ç | ç | [ | Ħ | ć | ||
111 1110 | 126 | 7E | ~ | ‾ | ~ | ˜ | ˜ | ˜ | ¯ | | | ˜ | ü | ß | ˝ | ¨ | ¨ | û | û | á | ö | ì | ° | ˜ | ˜ | ¨ | ¨ | Ċ | č |
A fenti táblázatban a nem fehér cellák jelzik a különbségeket az amerikai változat, az ISO/IEC 10646 által használt "alap latin készlet" illetve a Unicode között.
A piros cellákban lévő karakterek használhatók, mint úgynevezett "kombinált diakritikus" karakterek, azaz a karaktereket követő vagy megelőző visszalépés – backspace C0 segítségével speciális ékezetes karakterek kialakításához használhatók (ez a kódolási módszert néhány, már érvénytelen, régebbi szabvány korlátozta, illetve nem támogatta). Komplex kódolás nélkül ezek a szimbólumok nem különböznek az amerikai változatban használt szimbólumoktól (bár bizonyos eltérések lehetségesek az idézőjeleknél, a tilde, illetve a circumflex szimbólumnál).
Később, amikor a 8 bites karakter készletek előtérbe kerültek, fokozatosan az ISO 8859-1, az ISO 8859-2, és az ISO 8859-3 lettek a preferált karakter kódolási módszerek, illetve ezek nemzeti változatai.
ASCII változatok, amelyek nem tartoznak az ISO 646 alá
szerkesztésSzámos olyan 7 bites karakterkészlet van, amelyek nem hivatalos részei a ISO 646 szabványnak. Néhány példa:
- 7 bites görög, ELOT 927. A görög ábécé a 0x61–0x71 és a 0x73–0x79 pozíciókra került, a kisbetűs latin karakterkészlet "tetejére". Ez az elrendezés jelenik meg 8 bites változatban az ISO 8859-7-nél.
- 7 bites cirill, a KOI-7 vagy rövid – short – KOI. A cirill karakterek a 0x60–0x7E pozíciókba kerültek, a kisbetűs latin karakterkészlet "tetejére". A KOI-8 változat megjelenése óta jelentőségét vesztette.
- 7 bites héber, SI 960. A héber ábécé a 0x60–0x7A pozíciókba került, a kisbetűs latin karakterkészlet tetejére. A 7 bites héber mindig a megjelenítés sorrendjében van tárolva. 8 bites változata (a héber karakterek a This 0xE0–0xFA pozíciókban) a ISO 8859-8.
- 7 bites arab, ASMO 449. Az arab ábécé a 0x41–0x5A és a 0x60–0x6A pozíciókba került, a latin kis-és nagybetűk "tetejére". A 8 bites változata a ISO 8859-6.
Kapcsolódó szócikkek
szerkesztésEgyéb, idegen nyelvű hivatkozások
szerkesztés- Zeichensatz nach ISO 646 (ASCII) (in German)
- History at GNU Aspell website
- Character Tables by Koichi Yasuoka (see Domestic ISO646 Character Tables and Quasi-ISO646 Character Tables)
- Turkish Text Deasciifier a tool (based on statistical pentagram analysis of the Turkish language) which reverts an ASCII'fied Turkish text by determining the appropriate (but ambiguous) diacritics normally needed in Turkish but missing in the US-ASCII set.