ISO/IEC 10646ISO/IEC 10646, eller Universal Coded Character Set eller Universal Multiple-Octet Coded Character Set är en internationell standard för teckenkodning. Arbetet med ISO/IEC 10646 började synkroniseras 1991 med Unicode-standarden som gjorts av ett antal datorleverantörer sammanslutna i Unicode-konsortiet. Den första publicerade versionen var färdig 1993 och ett antal nya utgåvor av standarden har publicerats sedan dess. Arbetet med både Unicode och ISO/IEC 10646 är synkroniserat och ISO-standarden har samma teckenuppsättning, teckenkoder och teckennamn som Unicode. ISO/IEC 10646 definierar en grundläggande teckenuppsättning, Universal Coded Character Set, UCS, och ett antal kodningar av denna. Kodningen UCS-4 omfattar hela UCS och där varje tecken representeras av ett 32-bitars tal (i praktiken samma som Unicodes UTF-32). UCS-2 omfattar endast de första 65536 tecknen i UCS och som representeras av ett 16-bitars tal. UCS-2 är föråldrad, då tecken allokerats som har fått kodpunkter större än 65535. UTF-16 är en utvidgning av UCS-2, och täcker i praktiken in hela UCS. UTF-8 är en multibyte-utvidgning av ASCII. Förkortningen av Universal Coded Character Set är ”UCS” med ett C, inte ”UCCS”, trots att ordet ”Coded” nu ingår i det officiella namnet.[1] Unicode- (och ISO/IEC 10646) kodningar
Unicode 4.1 (och ISO/IEC 10646:2003 plus Amd 1 och 2) i siffrorDet finns 237 299 tilldelade kodpositioner in Unicode version 4.1. Av dessa är:
Man använder beteckningen "kodpunkt" (code point) istället för tecken i Unicode, eftersom ett antal av dem inte representerar tecken. Det kan vara bland annat styrkoder för datorn, för presentation, för att uttrycka UTF-16 samt förbjudna kodpunkter. Skillnader mellan Unicode och ISO/IEC 10646Unicode standardiserar teckenegenskaper, vilket ISO/IEC 10646 inte gör. Teckenegenskaper är bl.a. "generell kategori" (bokstav, siffra, m.m.), radbrytningsegenskaper, egenskaper för bidirektionalitet, och mycket mer. ISO/IEC 10646 har formaliserade "delmängder", vilket Unicode inte har. Referenser
|