カイティー文字(カイティーもじ、英語: Kaithi)は、Unicodeのブロックの一つ。
解説
20世紀初頭まで現在のインド北部のビハール州およびウッタル・プラデーシュ州東部にあたる、イギリス領インド帝国の同地域で用いられた[1]、いずれもインド・ヨーロッパ語族インド・イラン語派インド語群に属するボージュプリー語及びマガヒー語[1]、また同地域で話されたマイティリー語及びアワディー語[1]、ウルドゥー語[1]、また稀にベンガル語及びマールワーリー語[1]を表記するために用いられたカイティー文字を収録している。現在これらの言語の多くの記述にはデーヴァナーガリーが用いられている[2]。
カイティー文字はブラーフミー文字から派生した所謂ブラーフミー系文字(インド系文字)の一つであり、音素文字のうち子音字単独では暗黙の随伴母音/-a/を伴って発音され、別の母音にする際に母音記号を付加することで発音を切り替えるアブギダに分類される。ラテン文字などと同様に左から右への横書き(左横書き)であり、単語毎に分かち書きをする。
数字についてはデーヴァナーガリーのものとほぼ同形のものを用いるため個別には符号化されていない[3]。ただし、様式的にはやや異なっており、特に8と9については形状がやや異なっている。
符号位置の順序はおおむね伝統的なカイティー文字の順序に従っている。
Unicodeのバージョン5.2において初めて追加された。
収録文字
「ラテン文字転写」の列はブラーフミー系文字のラテン文字への翻字方式の一つであるISO 15919(及び一部はIAST)に従う。
コード
|
文字
|
文字名(英語)
|
用例・説明
|
ラテン文字転写
|
各種記号
|
U+11080
|
𑂀
|
KAITHI SIGN CANDRABINDU
|
アヌナーシカ。
母音字や母音記号に付き、母音を鼻母音で発音することを表す。
|
m̐
|
U+11081
|
𑂁
|
KAITHI SIGN ANUSVARA
|
アヌスヴァーラ。
直後に音節が後続する子音字に付き、直後の子音と同じ調音点の鼻音が挿入されることを表す。日本語における「ん」に相当する。
|
ṁ
|
U+11082
|
𑂂
|
KAITHI SIGN VISARGA
|
ヴィサルガ。
音節末に[h]を伴うことを表す。
|
ḥ
|
独立母音字
|
U+11083
|
𑂃
|
KAITHI LETTER A
|
短母音[a]を表す。
|
a
|
U+11084
|
𑂄
|
KAITHI LETTER AA
|
長母音[aː]を表す。
|
ā
|
U+11085
|
𑂅
|
KAITHI LETTER I
|
短母音[i]を表す。
|
i
|
U+11086
|
𑂆
|
KAITHI LETTER II
|
長母音[iː]を表す。
|
ī
|
U+11087
|
𑂇
|
KAITHI LETTER U
|
短母音[u]を表す。
|
u
|
U+11088
|
𑂈
|
KAITHI LETTER UU
|
長母音[uː]を表す。
|
ū
|
U+11089
|
𑂉
|
KAITHI LETTER E
|
長母音[eː]を表す。
|
e
|
U+1108A
|
𑂊
|
KAITHI LETTER AI
|
長母音二重母音[ai̯]を表す。
|
ai
|
U+1108B
|
𑂋
|
KAITHI LETTER O
|
長母音[oː]を表す。
|
o
|
U+1108C
|
𑂌
|
KAITHI LETTER AU
|
二重母音[au̯]を表す。
|
au
|
子音字
|
U+1108D
|
𑂍
|
KAITHI LETTER KA
|
子音[k]を表す。
|
k
|
U+1108E
|
𑂎
|
KAITHI LETTER KHA
|
子音[kʰ]を表す。
|
kh
|
U+1108F
|
𑂏
|
KAITHI LETTER GA
|
子音[ɡ]を表す。
|
g
|
U+11090
|
𑂐
|
KAITHI LETTER GHA
|
子音[ɡʱ]を表す。
|
gh
|
U+11091
|
𑂑
|
KAITHI LETTER NGA
|
子音[ŋ]を表す。
|
ṅ
|
U+11092
|
𑂒
|
KAITHI LETTER CA
|
子音[c]を表す。
|
c
|
U+11093
|
𑂓
|
KAITHI LETTER CHA
|
子音[cʰ]を表す。
|
ch
|
U+11094
|
𑂔
|
KAITHI LETTER JA
|
子音[ɟ]を表す。
|
j
|
U+11095
|
𑂕
|
KAITHI LETTER JHA
|
子音[ɟʱ]を表す。
|
jh
|
U+11096
|
𑂖
|
KAITHI LETTER NYA
|
子音[ɲ]を表す。
|
ñ
|
U+11097
|
𑂗
|
KAITHI LETTER TTA
|
子音[ʈ]を表す。
|
ṭ
|
U+11098
|
𑂘
|
KAITHI LETTER TTHA
|
子音[ʈʰ]を表す。
|
ṭh
|
U+11099
|
𑂙
|
KAITHI LETTER DDA
|
子音[ɖ]を表す。
|
ḍ
|
U+1109A
|
𑂚
|
KAITHI LETTER DDDHA
|
子音[ɽ]を表す。
|
ṛ
|
U+1109B
|
𑂛
|
KAITHI LETTER DDHA
|
子音[ɖʱ]を表す。
|
ḍh
|
U+1109C
|
𑂜
|
KAITHI LETTER RHA
|
子音[ɽʱ]を表す。
|
ṛh
|
U+1109D
|
𑂝
|
KAITHI LETTER NNA
|
子音[ɳ]を表す。
|
ṇ
|
U+1109E
|
𑂞
|
KAITHI LETTER TA
|
子音[t]を表す。
|
t
|
U+1109F
|
𑂟
|
KAITHI LETTER THA
|
子音[tʰ]を表す。
|
th
|
U+110A0
|
𑂠
|
KAITHI LETTER DA
|
子音[d]を表す。
|
d
|
U+110A1
|
𑂡
|
KAITHI LETTER DHA
|
子音[dʱ]を表す。
|
dh
|
U+110A2
|
𑂢
|
KAITHI LETTER NA
|
子音[n]を表す。
|
n
|
U+110A3
|
𑂣
|
KAITHI LETTER PA
|
子音[p]を表す。
|
p
|
U+110A4
|
𑂤
|
KAITHI LETTER PHA
|
子音[pʰ]を表す。
|
ph
|
U+110A5
|
𑂥
|
KAITHI LETTER BA
|
子音[b]を表す。
|
b
|
U+110A6
|
𑂦
|
KAITHI LETTER BHA
|
子音[bʱ]を表す。
|
bh
|
U+110A7
|
𑂧
|
KAITHI LETTER MA
|
子音[m]を表す。
|
m
|
U+110A8
|
𑂨
|
KAITHI LETTER YA
|
子音[j]を表す。
|
y
|
U+110A9
|
𑂩
|
KAITHI LETTER RA
|
子音[r]を表す。
|
r
|
U+110AA
|
𑂪
|
KAITHI LETTER LA
|
子音[l]を表す。
|
l
|
U+110AB
|
𑂫
|
KAITHI LETTER VA
|
子音[ʋ]を表す。
|
v
|
U+110AC
|
𑂬
|
KAITHI LETTER SHA
|
子音[ɕ]を表す。
|
ś
|
U+110AD
|
𑂭
|
KAITHI LETTER SSA
|
子音[ʂ]を表す。
|
ṣ
|
U+110AE
|
𑂮
|
KAITHI LETTER SA
|
子音[s]を表す。
|
s
|
U+110AF
|
𑂯
|
KAITHI LETTER HA
|
子音[h]を表す。
|
h
|
従属母音記号
|
U+110B0
|
𑂰
|
KAITHI VOWEL SIGN AA
|
長母音[aː]を表す。
|
ā
|
U+110B1
|
𑂱
|
KAITHI VOWEL SIGN I
|
短母音[i]を表す。
|
i
|
U+110B2
|
𑂲
|
KAITHI VOWEL SIGN II
|
長母音[iː]を表す。
|
ī
|
U+110B3
|
𑂳
|
KAITHI VOWEL SIGN U
|
短母音[u]を表す。
|
u
|
U+110B4
|
𑂴
|
KAITHI VOWEL SIGN UU
|
長母音[uː]を表す。
|
ū
|
U+110B5
|
𑂵
|
KAITHI VOWEL SIGN E
|
長母音[eː]を表す。
|
e
|
U+110B6
|
𑂶
|
KAITHI VOWEL SIGN AI
|
長母音二重母音[ai̯]を表す。
|
ai
|
U+110B7
|
𑂷
|
KAITHI VOWEL SIGN O
|
長母音[oː]を表す。
|
o
|
U+110B8
|
𑂸
|
KAITHI VOWEL SIGN AU
|
二重母音[au̯]を表す。
|
au
|
ヴィラーマ
|
U+110B9
|
𑂹
|
KAITHI SIGN VIRAMA
|
ヴィラーマ。殺母音記号。母音/-a/を発音せず子音のみが読まれることを表す。
レンダー上は、子音連続を表す場合次の文字と縦に並べて繋がったような合字を形成するための不可視の制御文字として機能する。文字によってはただこの記号が子音字の下に付けられるだけの場合もある。
|
|
各種記号
|
U+110BA
|
𑂺
|
KAITHI SIGN NUKTA
|
ヌクター。外来語の発音などのために子音字を拡張して新たな発音を表す際に用いられる。
例えば字母ja(U+11094 𑂔 )に付くとアラビア文字などの転写において/z/を表す。
|
|
U+110BB
|
𑂻
|
KAITHI ABBREVIATION SIGN
|
省略記号。略語を表す際に用いられる[4]。
|
|
U+110BC
|
𑂼
|
KAITHI ENUMERATION SIGN
|
字母na(U+110A2 𑂢 )が様式化された記号で、英語の単語「number」の音訳であるnambarに由来する[4]。欧文などにおける番号符号(#)に相当する。
U+110BD の下線部分にも文字幅があるもの。
|
№[4]
|
U+110BD
|
|
KAITHI NUMBER SIGN
|
数値参照などに用いられる[5]。
後続する数字の下にこの記号の下部の線が伸びる。
|
|
約物
|
U+110BE
|
𑂾
|
KAITHI SECTION MARK
|
文末を表す。
|
|
U+110BF
|
𑂿
|
KAITHI DOUBLE SECTION MARK
|
大きなテキストのセクションの終わりを表す。
|
|
U+110C0
|
𑃀
|
KAITHI DANDA
|
ダンダ。句点やラテン文字などにおけるピリオド(.)に相当する。韻文では半詩節の終わり(パダ)を表す。
|
.
|
U+110C1
|
𑃁
|
KAITHI DOUBLE DANDA
|
段落の終わりを表す記号。韻文においてスタンザ(詩節)の終わりを表す。
|
|
母音記号
|
U+110C2
|
𑃂
|
KAITHI VOWEL SIGN VOCALIC R
|
音節主音化した短母音としてのR(IPA:[ɹ̩])を表す。
手書き写本、入門書、印刷本などの文書においてサンスクリット語に由来する単語に用いられる[6]。
|
r̥[7]
|
記号
|
U+110CD
|
|
KAITHI NUMBER SIGN ABOVE
|
U+110BD と同形の記号が数字の上に書かれるもの。番号付きリストの箇条書きの数字を表す[5]。
|
|
小分類
このブロックの小分類は「各種記号」(Various signs)、「独立母音字」(Independent vowels)、「子音字」(Consonants)、「従属母音記号」(Dependent vowel signs)、「ヴィラーマ」(Virama)、「約物」(Punctuation)、「母音記号」(Vowel sign)、「記号」(Sign)の8つとなっている[8]。本ブロックでは、Unicodeのバージョン更新時の文字追加が隙間を埋める形で行われた影響で、同一の小分類に属する文字が飛び飛びの符号位置に割り当てられていることがある。
各種記号(Various signs)
この小分類にはカイティー文字のうち、母音字や子音字に結合する発音記号などの様々な記号が収録されている。
独立母音字(Independent vowels)
この小分類にはカイティー文字のうち、頭子音のない母音の音節を表す際に用いられる独立した母音字が収録されている。
子音字(Consonants)
この小分類にはカイティー文字のうち、基本的な子音字が収録されている。
従属母音記号(Dependent vowel signs)
この小分類にはカイティー文字のうち、子音字に結合する母音記号が収録されている。
ヴィラーマ(Virama)
この小分類にはカイティー文字のうち、ヴィラーマ(殺母音記号)と呼ばれる、子音字の持つ暗黙の随伴母音/-a/を読まずに子音のみを発音することを表す記号が収録されている。
約物(Punctuation)
この小分類にはカイティー文字で用いられる句読点などの約物類が収録されている。
母音記号(Vowel sign)
この小分類にはカイティー文字のうち、子音字に結合する母音記号が収録されている。
記号(Sign)
この小分類にはカイティー文字のうち、様々な記号類が収録されている。
文字コード
履歴
以下の表に挙げられているUnicode関連のドキュメントには、このブロックの特定の文字を定義する目的とプロセスが記録されている。
バージョン
|
コードポイント[a]
|
文字数
|
L2 ID
|
ドキュメント
|
5.2
|
U+11080..110C1
|
66
|
L2/05-343
|
Anshuman Pandey (26 October 2005), Proposal to Encode the Kaithi Script in Plane 1 (英語)
|
L2/05-368
|
Michael Everson (10 November 2005), Towards an encoding of the Kaithi script (英語)
|
L2/07-199
|
Anshuman Pandey (6 June 2007), Proposal to Encode the Kaithi Script in Plane 1 (replaces L2/05-343) (英語)
|
L2/07-418
|
Anshuman Pandey (17 December 2007), Proposal to Encode the Kaithi Script (WG2 N3389) (英語)
|
L2/08-156
|
Deborah Anderson; Anshuman Pandey (14 April 2008), Request for removal of digits from Kaithi proposal (WG2 N3438) (英語)
|
L2/08-194
|
Anshuman Pandey (6 May 2008), Proposal to Encode the Kaithi Script (WG 2 N3389; replaces L2/07-418) (英語)
|
L2/08-370
|
Deborah Anderson / SEI (21 October 2008), Proposal to add three Kaithi punctuation marks (WG2 N3544) (英語)
|
L2/08-400
|
Deborah Anderson / SEI (30 October 2008), Information on KAITHI NUMBER SIGN 110BD (英語)
|
11.0
|
U+110CD
|
1
|
L2/16-097
|
SEI / Benjamin Yang (11 May 2016), Proposal to encode Kaithi Number Sign Above (revised) (英語)
|
14.0
|
U+110C2
|
1
|
L2/20-151
|
Srinidhi A; Sridatta A (24 June 2020), Proposal to encode the KAITHI VOWEL SIGN VOCALIC R (英語)
|
- ^ 提案されたコードポイントと文字の名前は、最終決定と異なる場合がある。
|
出典
- ^ a b c d e Anshuman Pandey (2007年6月6日). “Proposal to Encode the Kaithi Script in Plane 1 (replaces L2/05-343)” (英語). Unicode. 2025年6月1日閲覧。
- ^ ただし、ウルドゥー語はアラビア文字のナスタアリーク体、ベンガル語はベンガル文字である。
- ^ Deborah Anderson and Anshuman Pandey (2008年4月14日). “Request for removal of digits from Kaithi proposal (WG2 N3438)” (英語). Unicode. 2025年6月1日閲覧。
- ^ a b c Anshuman Pandey (2007年12月17日). “Proposal to Encode the Kaithi Script (WG2 N3389)” (英語). Unicode. 2025年6月1日閲覧。
- ^ a b SEI / Benjamin Yang (2016年5月11日). “Proposal to encode Kaithi Number Sign Above (revised)” (英語). Unicode. 2025年6月1日閲覧。
- ^ “Proposal to encode the KAITHI VOWEL SIGN VOCALIC R” (英語) (2020年6月24日). 2025年6月1日閲覧。
- ^ IASTではṛと表記される。
- ^ “The Unicode Standard, Version 15.1 - U11080.pdf” (PDF). The Unicode Standard (英語). 2025年6月1日閲覧.
関連項目