ANSI-EscapesequenzANSI-Escapesequenzen oder ANSI-Escapecodes sind Zeichenfolgen zur Bildschirmsteuerung (Escapesequenzen), die das ASCII-/ANSI-Zeichen 27 (1B hexadezimal), „Escape“, als einleitendes Steuerzeichen nutzen und auf dem Standard von ANSI X3.64 und ECMA-48 beruhen. Diese ANSI/ECMA-Norm definiert einen Standard zur Bildschirm- und Tastatursteuerung auf Terminals wie der DEC VT100 (1979). Außer auf Terminals selbst sind ANSI-Escapesequenzen in entsprechenden Terminalemulationen und in Kommandozeileninterpretern implementiert. Die 2. Ausgabe von ECMA-48 wurde 1978 als ISO 6429 und mit der 4. Ausgabe 1986 als ISO/IEC 6429 standardisiert. Der aktuelle ECMA-48-Standard entspricht der 5. Ausgabe vom Juni 1991. GeschichteIn den 1970er Jahren wurde der ASCII-Standard, der bereits 1968 festgelegt worden war, durch das American National Standards Institute (ANSI) überarbeitet. Dieser als ANSI X3.4-1977 bezeichnete Standard definiert jedoch nur die ersten 7 Bit, wurde als die ASCII-Zeichentabelle bekannt und bildet die Grundlage für weitere internationale Zeichensätze. Die ersten Arbeiten zur Standardisierung eines 8-Bit-Zeichensatzes resultierten bereits 1971 in ANSI X3.41 und ECMA-35. Gemeinsam mit der European Computer Manufacturers Association (ECMA) wurde in den Komitees mit den Bezeichnungen „X3L2“ bei ANSI und „TC 1“ bei ECMA an der Erweiterung der 8-Bit-Eingabe- und -Ausgabesteuerung gearbeitet, was u. a. die Möglichkeiten der Videoausgabe auf Terminals erweitern und gleichzeitig standardisieren sollte. Das Ergebnis dieser Arbeit ist ECMA-48 vom September 1976 sowie ANSI X3.64 von 1977. Diese Spezifikation wurde auch dem ISO-Komitee vorgelegt und 1978 als ISO 6429 akzeptiert. Die 2. Ausgabe von ANSI X3.64 und ECMA-48 von 1979 ist identisch mit der ISO-Norm. Die ersten Terminals, die ANSI X3.64-1977 umsetzten, waren der DEC-VT100-Terminal von 1978 und der Heathkit H89 von 1979.[1] Wegen ihres kommerziellen Erfolgs wurden die VT100-Terminals kontinuierlich weiterentwickelt, wobei auf Abwärtskompatibilität geachtet wurde, so dass auch die späteren Modelle im Wesentlichen dem ANSI-Standard folgten.[2] Aufbauend auf VT100 entstand außerdem im Unix-Bereich die xterm-Emulation.[3] Deren gleichnamiger Terminaltyp ist heute in gängigen Terminalemulationen quasi Standard,[4] so dass die Steuerung von Terminals und Konsolen zur Nutzung von Unix-Shells heute im Prinzip (über den Umweg Xterm und VT100) auf die ANSI-Escapesequenzen des ECMA-48/ANSI-X3.64-Standards zurückgehen. Ähnliches gilt für PCs, wo ursprünglich DOS bzw. die Eingabeaufforderung den ANSI-Standard unterstützten[5] und das Fenster für den Kommandozeileninterpreter in Windows 10 inzwischen auf xterm basiert.[6] StandardsDer Standard wurde mit minimalen Abweichungen sowohl von ANSI als auch ECMA herausgegeben und nach Einreichung auch zur ISO- und IEC-Norm. Allerdings sind nur die ECMA-Standards frei zugänglich (gratis). Der ANSI-Standard wurde zugunsten der ISO-Norm zurückgezogen, um Doppelstandardisierung zu vermeiden.
Die Standards sind aufbauend und miteinander verwoben – wurde einer der Standards angepasst, so wurde meist auch eine angepasste Version der anderen Standards veröffentlicht. Leider gibt es dennoch in unterschiedlichen Implementierungen und Dokumenten (sogar Standards und Normen) zueinander inkompatible Steuerzeichen und -sequenzen.[12] ANSI-Steuerzeichen und -SteuersequenzenDer ASCII-Standard nach ECMA-6 (ANSI X3.4) ist auf 7 Bits begrenzt und definiert die Codierung von 96 Buchstaben und Symbolen, sowie 32 so genannten C0-Steuerzeichen (im Bereich 0–31 dezimal bzw. 00–1Fhexadezimal).[8] Die Erweiterung auf 8 Bit nach ECMA-43 beinhalten fügt im Bereich von 128–159 dezimal (bzw. 80–9Fhexadezimal) Raum für 32 weitere Steuerzeichen hinzu, jedoch ohne deren Funktion konkret zu spezifizieren.[10] SteuerzeichenIm Standard ECMA-48 (ANSI X3.64) von 1977 wurden dann, aufbauend auf die in den vorherigen Standards vorgeschlagenen Code-Bereiche, die Funktion der C0- und C1-Steuerzeichen tatsächlich präzise definiert.[13] EscapesequenzenWeil jedoch der Platz für die Steuerzeichen auf 64 Funktionen begrenzt ist, wurden zusätzlich zu den Steuerzeichen weitere Befehle und Funktionen über so genannte Steuersequenzen implementiert.[14] Während nämlich ein Steuerzeichen eine Funktion direkt umsetzt, besteht eine Steuersequenz aus mehreren Zeichen. Deren Anzahl ist je nach Funktion unterschiedlich, die möglichen Kombinationen sind jedoch im Standard genau spezifiziert. Da einige der primären Steuerzeichen im C1-Bereich liegen und daher nur auf Systemen mit 8-Bit-Zeichensätzen verfügbar sind, legt der ECMA-48 Standard für meisten Steuerzeichen im C1-Bereich auch Kombination aus 7 Bit Zeichen fest (s. u.). Durch die mögliche Kombination von mehreren Zeichen zu eine Sequenz ergibt sich die Möglichkeit weit mehr als 64 Steuerfunktionen festzulegen, bzw. diese Funktionen zu parametrisieren (z. B. einer Funktion einen Wiederholungsfaktor beizufügen). Dementsprechend beschreibt der Standard insgesamt 162[13] Steuercodes und Sequenzen, die teilweise komplexe Funktionen ausführen, wie z. B. Cursor-Steuerung, Bildschirm-Befehle (Lösch-, Attribut-, Modus-Befehle) und Tastatur-Befehle.[13][15] Diese wurden als „ANSI-Escapesequenzen“ (englisch ANSI escape sequences, manchmal auch ANSI escape codes) bekannt.[14] ZeichensätzeIn den meisten Zeichensätzen sind die C0- und C1-Steuerzeichen an den normierten Positionen enthalten. Außer auf emulierten VT100-Terminals finden jedoch fast nur C0-Steuerzeichen Verwendung.[16] Bei der Entwicklung von Unicode wurden diese ebenfalls übernommen, sodass in Unicode die Steuerzeichen gem. ANSI X3.64 und ECMA-48 innerhalb der ersten 256 Positionen abgebildet sind. ANSI-Escapesequenzen sind bei Unicode zwar ohne Funktion, jedoch wurden einige der Funktionen an anderer Unicode-Position ähnlich umgesetzt (z. B. ein geschütztes Leerzeichen). SteuerzeichenDie über eine Escapesequenz aufgerufene Funktion eines C1-Steuerzeichens hat gemäß Spezifikation genau die gleiche Funktion wie das einzelne Steuerzeichen. Als Escapesequenz bleiben Steuerzeichen innerhalb des 7-Bit-C0-Bereichs von ASCII und sind somit mit Systemen, die nur 7-Bit unterstützen oder in diesen Modus geschaltet wurden, kompatibel. C1-Steuerzeichen im ANSI ECMA-48 StandardDies ist ein Auszug von C1-Steuerzeichen aus dem 8-Bit-„ANSI“-Zeichensatz, die mittels Escapesequenzen (C0-Steuerzeichen an ASCII-Position 27) im 7-Bit-ASCII-Zeichensatz zugänglich sind. Die genaue Funktion dieser Steuerzeichen, z. B. welche Funktion ein Reverse Line Feed genau ausführt, ist im Kapitel 8.3 des EMCA-48 Standards festgelegt.[13]
Zur Berechnung der Escapesequenz wird vom C1-Steuerzeichen 40h, 64 dezimal oder 100 oktal abgezogen. So hat beispielsweise das Steuerzeichen Der einzige Nachteil der Escapesequenz ist, dass ein zusätzliches Zeichen pro Steuerbefehl verarbeitet werden muss, was auf langsamen Terminals zu Geschwindigkeitseinbußen führen konnte – zumindest theoretisch und wenn ein ANSI-Script sehr lang war. Nach der Spezifikation können alle 8-Bit-fähigen Geräte auch die 7-Bit-Escapefunktion nutzen, sodass sich die Escapesequenzen durchgesetzt haben. SteuersequenzenEine Steuersequenz wird immer durch ein Steuerzeichen eingeleitet und besteht mindestens aus zwei Zeichen. Bei variabler Größe wird die Steuersequenz durch ein definiertes abschließendes Zeichen oder durch ein Trennzeichen abgeschlossen. Eine Steuersequenz wird wie ein einzelnes Steuerzeichen behandelt, mit dem Unterschied, dass die gesamte Steuersequenz gelesen werden muss, bevor deren Umsetzung erfolgen kann. Im Wesentlichen gibt es drei Steuerzeichen, die eine Steuersequenz einleiten:
Nur das Steuerzeichen Die Steuerzeichen Single Character IntroducerDas Steuerzeichen „Single Character Introducer“ (SCI) leitet eine Steuersequenz mit nur einem einzigen darauffolgenden Zeichen ein und benötigt daher auch kein Trennzeichen. Da jedoch die Funktionen dieses Steuerzeichens nicht standardisiert wurden, bedeuten sie auf jedem System etwas anderes. Die jeweilige proprietäre Funktion wird mit der Escapesequenz Control Sequence IntroDas Steuerzeichen „Control Sequence Intro“ (CSI) ist das meist genutzte Steuerzeichen, da es eine Vielzahl weiterer Funktionen bietet, die sonst nicht mehr in den verfügbaren Rahmen von nur 8 Bit gepasst hätten. Es wird mit dem Zeichen 9Bhex im 8-Bit-Modus, meist jedoch als Escapesequenz Eine <ESC> [ 0 ; 1 ; 4 m | | | | | +---+--+ +-----+-----+ | | | | Steuerzeichen | abschließendes Zeichen Parameterteil In diesem Beispiel ist Wird der Parameterteil weggelassen, so sieht die Steuersequenz so aus: <ESC>[m Diese Steuersequenz ist gleichbedeutend mit BeispieleDer ECMA-48 Standard definiert auf S. 61 die Funktion SGR “Set Graphic Rendition” (Darstellungsformat) als Da die Shells in moderne Computersystemen oft noch auf ANSI-Sequenzen basieren, lässt sich dies unter Unix bzw. Windows folgendermaßen demonstrieren: UnixIn einer Unix-Shell kann man das echo -e "Der folgende Text ist \e[5;31m rot blinkend \e[0m." WindowsIn einer Eingabeaufforderung (DOS Fenster) unter Windows wird Beispielsweise würde PROMPT=$E[5;31m Bitte Befehl eingeben $E[0m : ein Prompt erzeugen, das rot blinkenden Text anzeigt, der den Benutzer auffordert einen Befehl einzugeben. DOSIn DOS muss der ANSI.SYS-Treiber geladen sein, um ANSI-Escapesequenzen nutzen zu können. Die ANSI-Escapesequenz wird durch die Eingabe des ASCII-Zeichens 27 (0x1B) eröffnet. Das ASCII-Zeichen 27 ist ein nicht druckbares Steuerzeichen und kann daher als Beispiel nicht angegeben werden. Die Eingabe des Zeichen kann aber bspw. mit der Tastenkombination Alt Gr+2+7 erfolgen, manche Texteditoren bieten auch eine spezielle Eingabemaske für ASCII-Zeichen, in der dann ASCII-Zeichen 27 ausgewählt werden kann. SicherheitDa die Steuerzeichen auch dazu verwendet werden können, Tastatureingaben zu simulieren und umzudefinieren, kann eine Datei mit ANSI-Escapesequenzen auf einem Computer auch Schaden anrichten. Dabei ist es lediglich nötig, die Datei von einem voll ANSI-fähigen Programm anzeigen zu lassen, welches dann die enthaltenen Escapesequenzen ungefiltert ausführt. Diese Art der Schadfunktion wird auch als ANSI-Bombe bezeichnet.[22][23] Zu Zeiten von MS-DOS konnte sogar mit einer manipulierten Laufwerksbezeichnung eine ANSI-Bombe realisiert werden, sodass ein ImplementierungenHardware:
Software:
Weblinks
Einzelnachweise
|
Portal di Ensiklopedia Dunia