Плоскость (Юникод)В стандарте Юникод плоскость — непрерывный диапазон из 65 536 (216) кодовых позиций. Существует 17 плоскостей, обозначенных числами от 0 до 16, что соответствует возможным значениям 00—1016 первых двух шестнадцатеричных цифр в шестизначном формате номера кодовой позиции (U+hhhhhh). Последняя кодовая позиция в Юникоде — последняя кодовая позиция в плоскости 16, U+10FFFF. Плоскость 0 называется Основная многоязычная плоскость (англ. Basic Multilingual Plane, BMP), она содержит наиболее часто используемые символы. Остальные плоскости (1—16) называются «дополнительными»[1]. В версии Юникода 14.0 задействованы кодовые позиции семи плоскостей, при этом две из них предназначены для частного использования. Ограничение в 17 плоскостей обусловлено кодировкой UTF-16, в которой могли быть закодированы 220 (1 048 576) кодовых позиций (16 плоскостей) и BMP[2]. Кодировка UTF-8 была разработана с гораздо большим лимитом в 231 (2 147 483 648) кодовых позиций (32 768 плоскостей) и могла задействовать 221 (2 097 152) кодовых позиций (32 плоскости) даже при лимите в 4 байта[3]. Плоскости Юникода:
Основная многоязычная плоскостьПлоскость 0 (Основная многоязычная плоскость, англ. Basic Multilingual Plane, BMP) отведена для символов большинства современных письменностей и большого числа специальных символов. Большая часть таблицы занята идеограммами ККЯ и корейскими слогами. В Юникоде 15.0 в этой плоскости представлены следующие блоки: Дополнительная многоязычная плоскостьПлоскость 1 (Дополнительная многоязыковая плоскость, англ. Supplementary Multilingual Plane, SMP) отведена преимущественно для исторических письменностей, но включает также символы условных обозначений, такие как музыкальные и математические символы. В Юникоде 15.0 в этой плоскости представлены следующие наборы символов: Дополнительная идеографическая плоскостьПлоскость 2 (Дополнительная идеографическая плоскость, англ. Supplementary Ideographic Plane, SIP) отведена для редко используемых иероглифов ККЯ. В Юникоде 15.0 в этой плоскости представлены следующие наборы иероглифов:
Третичная идеографическая плоскостьПлоскость 3 (Третичная идеографическая плоскость, англ. Tertiary Ideographic Plane, TIP) содержит редко используемые китайские иероглифы, в неё также предполагается внести исторические формы китайского письма. В Юникоде 15.0 в этой плоскости представлены следующие блоки:
Оставшаяся часть Третичной идеографической плоскости разделена на следующие диапазоны[4]:
В будущем также предполагается включить иероглифы эпох Шан и Чжоу (цзиньвэнь, 金文), встречающиеся в ритуальных надписях на бронзовых сосудах и музыкальных инструментах, и наборы иероглифов Периода Сражающихся царств[4]. Специализированная дополнительная плоскостьПлоскость 14 (Специализированная дополнительная плоскость, англ. Supplementary Special-purpose Plane, SSP) отведена для символов, используемых по особому назначению. В Юникоде 15.0 в этой плоскости представлены следующие блоки:
Области для частного использованияНекоторые диапазоны Юникода отведены для частного использования и экспериментов. Они включают:
См. такжеПримечания
Ссылки |