ISO/CEI 8859-15
L'ISO/CEI 8859-15 (aussi connue comme Latin-9 et non officiellement comme Latin-0, mais jamais comme Latin-15) est la 15e partie de la norme de codage de caractères ISO/CEI 8859 de l'Organisation internationale de normalisation (ISO). Cette norme donne un code numérique tenant sur 8 bits aux caractères de l'alphabet latin utilisés en allemand, anglais, basque, catalan, danois, espagnol, finnois, français, italien, néerlandais, norvégien, portugais et suédois (parmi d'autres langues européennes). Différences avec ISO/CEI 8859-1Le jeu de caractères ISO/CEI 8859-15 peut être considéré comme une mise à jour de la norme ISO/CEI 8859-1, avec laquelle il est identique à l'exception de huit caractères[1].
Note : les codes numériques sont donnés en base hexadécimale. Le symbole de l’euro est devenu nécessaire dans la perspective de l’introduction imminente de la monnaie unique. Š, š, Ž et ž s’utilisent dans des mots d’emprunt et dans la translittération de noms russes en finnois et en estonien. Œ et œ sont des digrammes soudés français, et le Ÿ est nécessaire pour l’écriture tout-en-capitales des noms propres comme celui de la ville de l'Haÿ-les-Roses et celui du poète et écrivain Pierre Louÿs. Étant donné que les diacritiques sur les majuscules sont souvent (mais improprement[2],[3]) omis en français, on a cru pouvoir faire l’économie d’un point de code pour l’Ÿ dans ISO-8859-1, bien que sa minuscule ÿ y soit bien représentée (à 0xFF). En revanche, quelques caractères peu utilisés ont été exclus. Caractères supportésLe jeu de caractères complet est présenté dans le tableau ci-après.
Dans la table ci-dessus, 0x20 est l'espace standard, 0xA0 est l'espace insécable. Les valeurs 0x00 à 0x1F, 0x7F, et 0x80 à 0x9F ne sont pas assignées à des caractères par l'ISO/CEI 8859-15. Carte complète de l'ISO 8859-15 avec les différences par rapport à l'ISO/CEI 8859-1 marquées par un fond jaune :
NormalisationLe jeu de caractères ISO/CEI 8859-15 a été normalisé le 16 septembre 1998 sous le nom officiel de « Jeu supplémentaire latin pour l’Europe (« latin 9 ») », sous la direction et la plume d’Alain LaBonté[4]. Il définit 96 caractères graphiques. Ce jeu de caractères est utilisable avec l’International Reference Version (IRV) de l’ISO/CEI 646 (ISO-IR 6) que ce soit dans un contexte 8 bits ou 7 bits, au travers de la technologie de l’ISO/CEI 2022. Il dérive du «latin no 1 (ISO-IR 100)» dont certains caractères ont été remplacés pour le français, le finnois, et le symbole Euro (€). La normalisation du définit trois séquences d'échappement[5]:
En mode 8 bits, il est plus ou moins interopérable avec le windows-1252, dans la mesure où certains caractères sont affectés identiquement. Usages et applicationsAvec l'arrivée de l'Euro, ce jeu s'est imposé en Europe comme le standard Unix/Linux, avant l'arrivée d'UTF-8. La plupart des logiciels fonctionnant avec des caractères mono-octets et ne dépendant pas d'un ordre spécifique des caractères ont pu continuer à fonctionner à l'identique. Aujourd'hui, son usage s'efface au profit de l'UTF-8. Aspects économiques et sociauxLa norme a été sponsorisée par le Canada (Conseil canadien des normes), le Danemark (Dansk Standard), la Finlande (SFS – STY/Tieke), la France (Association française de normalisation), et l'Irlande (National Standards Authority of Ireland (en)). La norme est disponible en langues française et anglaise[6]. La coexistence de normes de codages partiellement incompatibles conduit à la disparition du symbole euro de certains documents. En informatique, il n’est pas exceptionnel de rencontrer un usage fautif du code 128 de Windows-1252 là où les normes stipulent que le codage Unicode ou ISO/CEI 8859-1 est utilisé. En particulier, en HTML et XML, l’entité numérique Notes et références
AnnexesArticles connexesLiens externes |