基本ラテン文字 (きほんラテンもじ、英語 : Basic Latin )は、Unicode の1つ目のブロック である。ASCII 文字コードの全ての文字(基本ラテン文字 と制御文字 )が、同じ順番・同じコードで収録されている。C0制御文字及び基本ラテン文字 (C0 Controls and Basic Latin)ともいう。UTF-8 において、収録されたキャラクタ が1バイトで表現できる唯一のブロックである。
基本ラテン文字ブロックはUnicode バージョン1.0.0から最新のバージョンまでの全てに含まれ、その間文字の追加・変更が行われていない[ 3] 。
収録文字
コード
文字
文字名(英語)
説明
略号
C0制御文字
U+0000
Null character
ヌル文字
NUL
U+0001
Start of Heading
ヘッディング開始
SOH
U+0002
Start of Text
テキスト開始
STX
U+0003
End-of-text character
テキスト終結
ETX
U+0004
End-of-transmission character
伝送終了
EOT
U+0005
Enquiry character
問い合わせ文字
ENQ
U+0006
Acknowledge character
肯定応答文字
ACK
U+0007
Bell character
ベル文字
BEL
U+0008
Backspace
後退
BS
U+0009
Horizontal tab
水平タブ
HT
U+000A
Line feed
改行
LF
U+000B
Vertical tab
垂直タブ
VT
U+000C
Form feed
書式送り
FF
U+000D
Carriage return
復帰
CR
U+000E
Shift Out
シフトアウト
SO
U+000F
Shift In
シフトイン
SI
U+0010
Data Link Escape
伝送制御拡張
DLE
U+0011
Device Control 1
装置制御1
DC1
U+0012
Device Control 2
装置制御2
DC2
U+0013
Device Control 3
装置制御3
DC3
U+0014
Device Control 4
装置制御4
DC4
U+0015
Negative-acknowledge character
否定応答
NAK
U+0016
Synchronous Idle
同期文字
SYN
U+0017
End of Transmission Block
伝送ブロック終結
ETB
U+0018
Cancel character
キャンセル文字
CAN
U+0019
End of Medium
媒体終結
EM
U+001A
Substitute character
置換文字
SUB
U+001B
Escape character
エスケープ文字
ESC
U+001C
File Separator
ファイル分離文字
FS
U+001D
Group Separator
グループ分離文字
GS
U+001E
Record Separator
レコード分離文字
RS
U+001F
Unit Separator
ユニット分離文字
US
ASCIIの約物と記号
U+0020
Space
スペース
SP
U+0021
!
Exclamation mark
感嘆符
U+0022
"
Quotation mark
引用符
U+0023
#
Number sign
番号記号
U+0024
$
Dollar sign
ドル記号
U+0025
%
Percent sign
パーセント記号
U+0026
&
Ampersand
アンパサンド
U+0027
'
Apostrophe
アポストロフィー
U+0028
(
Left parenthesis
開き丸括弧
U+0029
)
Right parenthesis
閉じ丸括弧
U+002A
*
Asterisk
アスタリスク
U+002B
+
Plus sign
プラス記号
U+002C
,
Comma
コンマ
U+002D
-
Hyphen-minus
ハイフンマイナス
U+002E
.
Full stop or period
終止符
U+002F
/
Solidus or Slash
スラッシュ
ASCIIの数字
U+0030
0
Digit Zero
0
U+0031
1
Digit One
1
U+0032
2
Digit Two
2
U+0033
3
Digit Three
3
U+0034
4
Digit Four
4
U+0035
5
Digit Five
5
U+0036
6
Digit Six
6
U+0037
7
Digit Seven
7
U+0038
8
Digit Eight
8
U+0039
9
Digit Nine
9
ASCIIの約物と記号
U+003A
:
Colon
コロン
U+003B
;
Semicolon
セミコロン
U+003C
<
Less-than sign
不等号(より小)
U+003D
=
Equal sign
等号
U+003E
>
Greater-than sign
不等号(より大)
U+003F
?
Question mark
疑問符
U+0040
@
At sign or Commercial at
単価記号
大文字のラテン文字
U+0041
A
Latin Capital letter A
ラテン文字の大文字のA
U+0042
B
Latin Capital letter B
ラテン文字の大文字のB
U+0043
C
Latin Capital letter C
ラテン文字の大文字のC
U+0044
D
Latin Capital letter D
ラテン文字の大文字のD
U+0045
E
Latin Capital letter E
ラテン文字の大文字のE
U+0046
F
Latin Capital letter F
ラテン文字の大文字のF
U+0047
G
Latin Capital letter G
ラテン文字の大文字のG
U+0048
H
Latin Capital letter H
ラテン文字の大文字のH
U+0049
I
Latin Capital letter I
ラテン文字の大文字のI
U+004A
J
Latin Capital letter J
ラテン文字の大文字のJ
U+004B
K
Latin Capital letter K
ラテン文字の大文字のK
U+004C
L
Latin Capital letter L
ラテン文字の大文字のL
U+004D
M
Latin Capital letter M
ラテン文字の大文字のM
U+004E
N
Latin Capital letter N
ラテン文字の大文字のN
U+004F
O
Latin Capital letter O
ラテン文字の大文字のO
U+0050
P
Latin Capital letter P
ラテン文字の大文字のP
U+0051
Q
Latin Capital letter Q
ラテン文字の大文字のQ
U+0052
R
Latin Capital letter R
ラテン文字の大文字のR
U+0053
S
Latin Capital letter S
ラテン文字の大文字のS
U+0054
T
Latin Capital letter T
ラテン文字の大文字のT
U+0055
U
Latin Capital letter U
ラテン文字の大文字のU
U+0056
V
Latin Capital letter V
ラテン文字の大文字のV
U+0057
W
Latin Capital letter W
ラテン文字の大文字のW
U+0058
X
Latin Capital letter X
ラテン文字の大文字のX
U+0059
Y
Latin Capital letter Y
ラテン文字の大文字のY
U+005A
Z
Latin Capital letter Z
ラテン文字の大文字のZ
ASCIIの約物と記号
U+005B
[
Left Square Bracket
開き角括弧
U+005C
\
Backslash
バックスラッシュ [A]
U+005D
]
Right Square Bracket
閉じき角括弧
U+005E
^
Circumflex accent
サーカムフレックス
U+005F
_
Low line
アンダースコア
U+0060
`
Grave accent
グレイヴ・アクセント
小文字のラテン文字
U+0061
a
Latin Small Letter A
ラテン文字の小文字のA
U+0062
b
Latin Small Letter B
ラテン文字の小文字のB
U+0063
c
Latin Small Letter C
ラテン文字の小文字のC
U+0064
d
Latin Small Letter D
ラテン文字の小文字のD
U+0065
e
Latin Small Letter E
ラテン文字の小文字のE
U+0066
f
Latin Small Letter F
ラテン文字の小文字のF
U+0067
g
Latin Small Letter G
ラテン文字の小文字のG
U+0068
h
Latin Small Letter H
ラテン文字の小文字のH
U+0069
i
Latin Small Letter I
ラテン文字の小文字のI
U+006A
j
Latin Small Letter J
ラテン文字の小文字のJ
U+006B
k
Latin Small Letter K
ラテン文字の小文字のK
U+006C
l
Latin Small Letter L
ラテン文字の小文字のL
U+006D
m
Latin Small Letter M
ラテン文字の小文字のM
U+006E
n
Latin Small Letter N
ラテン文字の小文字のN
U+006F
o
Latin Small Letter O
ラテン文字の小文字のO
U+0070
p
Latin Small Letter P
ラテン文字の小文字のP
U+0071
q
Latin Small Letter Q
ラテン文字の小文字のQ
U+0072
r
Latin Small Letter R
ラテン文字の小文字のR
U+0073
s
Latin Small Letter S
ラテン文字の小文字のS
U+0074
t
Latin Small Letter T
ラテン文字の小文字のT
U+0075
u
Latin Small Letter U
ラテン文字の小文字のU
U+0076
v
Latin Small Letter V
ラテン文字の小文字のV
U+0077
w
Latin Small Letter W
ラテン文字の小文字のW
U+0078
x
Latin Small Letter X
ラテン文字の小文字のX
U+0079
y
Latin Small Letter Y
ラテン文字の小文字のY
U+007A
z
Latin Small Letter Z
ラテン文字の小文字のZ
ASCIIの約物と記号
U+007B
{
Left Curly Bracket
開き中括弧
U+007C
|
Vertical bar
バーティカルバー
U+007D
}
Right Curly Bracket
閉じ中括弧
U+007E
~
Tilde
チルダ
制御文字
U+007F
Delete
削除文字
DEL
A U+005C(\ )は、日本語フォントでは円記号 、韓国語フォントではウォン記号 として表示される場合がある[ 4] 。この表ではこれらのフォントでもバックスラッシュとして表示されるようにしてある。
小分類
このブロックには6つの小分類(subheading)がある[ 5] 。
C0制御文字
C0制御文字 (英語版 ) は、Unicodeバージョン1.0では「C0 ASCII制御文字(C0 ASCII control codes)」と呼ばれ、ASCII や他の7ビット・8ビット文字コードから継承されている。英語の文字名はISO/IEC 6429 :1992から取られている[ 5] 。
ASCIIの約物と記号
この小分類には、英文における標準的な約物 、単純な数学記号 、ドル記号・パーセント・アンパサンド・アンダースコア・パイプなどの記号が含まれている[ 5] 。
ASCIIの数字
この小分類には、1-9および0のアラビア数字 が含まれている[ 5] 。
大文字のラテン文字
この小分類には、標準的な26文字のアクセントのない大文字のラテン文字が含まれている[ 5] 。
小文字のラテン文字
この小分類には、標準的な26文字のアクセントのない小文字のラテン文字が含まれている[ 5] 。
制御文字
「制御文字」小分類には削除文字 (DEL)のみが含まれている[ 5] 。
文字コード表
C0制御文字及び基本ラテン文字 (C0 Controls and Basic Latin)[1] Official Unicode Consortium code chart (PDF)
0
1
2
3
4
5
6
7
8
9
A
B
C
D
E
F
U+000x
NUL
SOH
STX
ETX
EOT
ENQ
ACK
BEL
BS
HT
LF
VT
FF
CR
SO
SI
U+001x
DLE
DC1
DC2
DC3
DC4
NAK
SYN
ETB
CAN
EM
SUB
ESC
FS
GS
RS
US
U+002x
SP
!
"
#
$
%
&
'
(
)
*
+
,
-
.
/
U+003x
0
1
2
3
4
5
6
7
8
9
:
;
<
=
>
?
U+004x
@
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
U+005x
P
Q
R
S
T
U
V
W
X
Y
Z
[
\
]
^
_
U+006x
`
a
b
c
d
e
f
g
h
i
j
k
l
m
n
o
U+007x
p
q
r
s
t
u
v
w
x
y
z
{
|
}
~
DEL
備考
1.^ Unicode バージョン 9.0 現在
絵文字
基本ラテン文字ブロックには、U+0023, U+002A, U+0030–U+0039の12文字の絵文字 が含まれている[ 6] [ 7] 。これらは、U+20E3 ⃣ combining enclosing keycap と組み合わせて電話機の押しボタンを表す(例: #️⃣ (U+0023 NUMBER SIGN U+FE0F VS16 U+20E3 COMBINING ENCLOSING KEYCAP) )
この12文字に対し2種類の異体字セレクタ 、絵文字表示(U+FE0F VS16)かテキスト表示(U+FE0E VS15)が適用できる。いずれも、デフォルトはテキスト表示である[ 8] 。
絵文字の異体字シーケンス
U+
0023
002A
0030
0031
0032
0033
0034
0035
0036
0037
0038
0039
base code point
#
*
0
1
2
3
4
5
6
7
8
9
base+VS15 (text)
#︎
*︎
0︎
1︎
2︎
3︎
4︎
5︎
6︎
7︎
8︎
9︎
base+VS16 (emoji)
#️
*️
0️
1️
2️
3️
4️
5️
6️
7️
8️
9️
履歴
以下の表に挙げられているUnicode関連のドキュメントには、このブロックの特定の文字を定義する目的とプロセスが記録されている。
バージョン
コードポイント[ a]
文字数
L2 ID
WG2 ID
ドキュメント
1.0.0
U+0000..007F
128
(to be determined)
L2/04-145
Starner, David (2004-04-30), C with stroke character examples from BAE report 1884 (Dorsey)
L2/04-202
Anderson, Deborah (2004-06-07), Slashed C Feedback
L2/11-043
Freytag, Asmus; Karlsson, Kent (2011-02-02), Proposal to correct mistakes and inconsistencies in certain property assignments for super and subscripted letters
L2/11-160
PRI #181 Changing General Category of Twelve Characters , (2011-05-02)
L2/11-438 [ b] [ c]
N4182
Edberg, Peter (2011-12-22), Emoji Variation Sequences (Revision of L2/11-429)
L2/15-268
Beeton, Barbara; Freytag, Asmus; Iancu, Laurențiu; Sargent, Murray (2015-10-30), Proposal to Represent the Slashed Zero Variant of Empty Set
L2/15-301 [ d] [ c]
Pournader, Roozbeh (2015-11-01), A proposal for 278 standardized variation sequences for emoji
関連項目
出典
^ “Unicode character database ”. The Unicode Standard . 2016年7月9日 閲覧。
^ “Enumerated Versions of The Unicode Standard ”. The Unicode Standard . 2016年7月9日 閲覧。
^ The Unicode Standard Version 1.0, Volume 1 . Addison-Wesley Publishing Company, Inc.. (1990). ISBN 0-201-56788-1
^ Sorting it all Out : When is a backslash not a backslash?
^ a b c d e f g “Unicode 6.2 code charts ”. The Unicode Standard . 1 April 2013 閲覧。
^ “UTR #51: Unicode Emoji ”. Unicode Consortium (2016年11月22日). 2016年12月16日 閲覧。
^ “UCD: Emoji Data for UTR #51 ”. Unicode Consortium (2016年11月14日). 2016年12月16日 閲覧。
^ “Unicode Character Database: Standardized Variation Sequences ”. The Unicode Consortium. 2016年12月16日 閲覧。
外部リンク