ISO/IEC 2022ISO/IEC 2022, Informationstechnologie – Zeichensatzstruktur- und -erweiterungstechniken (englisch Information Technology – Character code structure and extension techniques) ist eine ISO-Norm, die eine Technik zur Kodierung mehrerer Zeichensätze sowie Sprachen, die nicht in 7 Bits kodiert werden können, definiert. Der Zeichensatz sollte das Problem unterschiedlicher zueinander inkompatibler Zeichenkodierungen lösen sowie die Kodierung ostasiatischer Schriftsysteme ermöglichen. Ein in ISO 2022 kodierter String kann problemlos durch 7-Bit-Kanäle transportiert werden, was die Verwendung des Zeichensatzes im Mail- und Usenet-Verkehr ermöglicht. Mithilfe von meist drei oder vier Byte langen Escape-Sequenzen kann zwischen mehreren Zeichensätzen geschaltet werden. Pro Escapesequenz können, abhängig von ihrer Definition, entweder 94, 8.836 (in einer 94×94-Matrix) oder 830.584 (in einer dreidimensionalen 94×94×94-Matrix) Zeichen kodiert werden. Jedoch konnte sich ISO/IEC 2022 nur im ostasiatischen Mailverkehr durchsetzen, für westliche Sprachen wurde keine Version veröffentlicht. Stattdessen wurde Unicode entwickelt, um diese Aufgabe zu erfüllen. Es gibt drei Versionen von ISO/IEC 2022 für die drei ostasiatischen Schriften, ISO-2022-JP, ISO-2022-KR und ISO-2022-CN. ISO-2022-JPISO-2022-JP kodiert die japanische Schrift. Sie wird häufig im Mailverkehr eingesetzt, ansonsten wird eher auf Shift JIS oder EUC-JP zurückgegriffen. Die ursprüngliche Version wird in RFC 1468[1] beschrieben und enthält die folgenden vier Escape-Sequenzen:
ISO-2022-JP-1 wird in RFC 2237[2] beschrieben und fügt eine weitere Escapesequenz hinzu:
ISO-2022-JP-2 wird in RFC 1554[3] beschrieben und fügt weitere Escapesequenzen zur Unterstützung weiterer Sprachen hinzu. Sie erweitert ISO-2022-JP-1 um die folgenden Escapesequenzen:
ISO-2022-JP-3 erweitert die ursprüngliche Version um folgende Escapesequenzen:
ISO-2022-JP-2004 erweitert ISO-2022-JP-3 um die folgende Escapesequenz:
ISO-2022-KRISO-2022-KR kodiert die koreanische Schrift und wird neben EUC-KR auf koreanischen Websites verwendet. Sie enthält nur eine einzige Escapesequenz:
ISO-2022-CNISO-2022-CN kodiert die chinesische Schrift (sowohl Kurz- als auch Langzeichen) und wird in RFC 1922[4] beschrieben. Sie wird fast nie verwendet, EUC-CN bzw. Big5 und im Mailverkehr HZ sind viel häufiger anzutreffen. Die Kodierung enthält die folgenden Escapesequenzen:
ISO-2022-CN-EXT erweitert den ursprünglichen Zeichensatz um die folgenden Escapesequenzen:
Weblinks
Einzelnachweise
|
Portal di Ensiklopedia Dunia