KOI8-R

KOI8-R è un sistema di codifica di caratteri a 8-bit progettato per essere adoperato con il russo e con tutte quelle lingue che utilizzano l'alfabeto cirillico. Il sistema originale, il KOI8, il cui nome sta per Kod Obmena Informaciej, 8 bit (in russo Код Обмена Информацией, 8 бит, Codice per lo scambio di informazioni, 8 bit), fu progettato dalle autorità sovietiche nel 1974 e da allora ne sono stati creati vari derivati, tra cui il KOI8-U, che aggiunge al KOI8 i caratteri dell'ucraino. Il KOI8-R rimase il sistema di codifica più utilizzato anche per il bulgaro fino a che per quest'ultimo non fu universalmente accettato l'uso del CP-1251.

Il KOI8-R ed il CP-1251 sono ancora molto più utilizzati dell'ISO 8859-5, che in effetti non ha mai trovato grande utilizzo, anche se oggi, ormai, nella stragrande maggioranza degli utilizzi moderni, viene loro preferito l'Unicode.

Il KOI8 ed i sistemi da lui derivati hanno la particolarità di avere le lettere cirilliche disposte in ordine pseudo-latino piuttosto che nel comune ordine dell'alfabeto cirillico come hanno per esempio l'ISO 8859-5 e l'Unicode. Sebbene questo possa sembrare anti intuitivo, questa caratteristica risulta utile per il fatto che se l'ottavo bit viene eliminato, il testo è parzialmente leggibile utilizzando il sistema ASCII e può essere convertito in un testo in KOI7 sintatticamente corretto. Per esempio se dalla scritta in KOI8-R "Русский Текст" viene eliminato l'ottavo bit, essa diventa rUSSKIJ tEKST ("Testo russo") ed un tentativo di interpretare tale stringa con il KOI7 porta a "РУССКИЙ ТЕКСТ". Il KOI8 fu creato basandosi sul codice Morse russo (che a sua volta fu creato dal codice Morse internazionale basandosi sulle assonanze) e la connessione riguardante l'ordine delle lettere tra il codice Morse russo e quello internazionale è la stessa che esiste tra il KOI8 e l'ASCII.

Nel sistema operativo Microsoft Windows, il numero di code page assegnato al sistema KOI8-R è 20866, nei sistemi di IBM è invece il numero 878.[1]

Tabella

La seguente tabella mostra il sistema di codifica KOI8-R.[1] Ogni carattere è rappresentato al centro della cella con il suo equivalente Unicode in alto e il suo codice decimale in basso.

Legenda
      Caratteri di controllo       Punteggiatura
      Cifre numeriche       Caratteri alfabetici
      Caratteri internazionali       Caratteri non definiti
      Caratteri grafici       Punteggiatura estesa
KOI8-R
-0 -1 -2 -3 -4 -5 -6 -7 -8 -9 -A -B -C -D -E -F
0-

0


1


2


3


4


5


6


7


8


9


10


11


12


13


14


15
1-

16


17


18


19


20


21


22


23


24


25


26


27


28


29


30


31
2- 0020
SP
32
0021
!
33
0022
"
34
0023
#
35
0024
$
36
0025
%
37
0026
&
38
0027
'
39
0028
(
40
0029
)
41
002A
*
42
002B
+
43
002C
,
44
002D
-
45
002E
.
46
002F
/
47
3- 0030
0
48
0031
1
49
0032
2
50
0033
3
51
0034
4
52
0035
5
53
0036
6
54
0037
7
55
0038
8
56
0039
9
57
003A
:
58
003B
;
59
003C
<
60
003D
=
61
003E
>
62
003F
?
63
4- 0040
@
64
0041
A
65
0042
B
66
0043
C
67
0044
D
68
0045
E
69
0046
F
70
0047
G
71
0048
H
72
0049
I
73
004A
J
74
004B
K
75
004C
L
76
004D
M
77
004E
N
78
004F
O
79
5- 0050
P
80
0051
Q
81
0052
R
82
0053
S
83
0054
T
84
0055
U
85
0056
V
86
0057
W
87
0058
X
88
0059
Y
89
005A
Z
90
005B
[
91
005C
\
92
005D
]
93
005E
^
94
005F
_
95
6- 0060
`
96
0061
a
97
0062
b
98
0063
c
99
0064
d
100
0065
e
101
0066
f
102
0067
g
103
0068
h
104
0069
i
105
006A
j
106
006B
k
107
006C
l
108
006D
m
109
006E
n
110
006F
o
111
7- 0070
p
112
0071
q
113
0072
r
114
0073
s
115
0074
t
116
0075
u
117
0076
v
118
0077
w
119
0078
x
120
0079
y
121
007A
z
122
007B
{
123
007C
|
124
007D
}
125
007E
~
126


127
8- 2500

128
2502

129
250C

130
2510

131
2514

132
2518

133
251C

134
2524

135
252C

136
2534

137
253C

138
2580

139
2584

140
2588

141
258C

142
2590

143
9- 2591

144
2592

145
2593

146
2320

147
25A0

148
2219

149
221A

150
2248

151
2264

152
2265

153
00A0
NBSP
154
2321

155
00B0
°
156
00B2
²
157
00B7
·
158
00F7
÷
159
A- 2550

160
2551

161
2552

162
0451
ё
163
2553

164
2554

165
2555

166
2556

167
2557

168
2558

169
2559

170
255A

171
255B

172
255C

173
255D

174
255E

175
B- 255F

176
2560

177
2561

178
0401
Ё
179
2562

180
2563

181
2564

182
2565

183
2566

184
2567

185
2568

186
2569

187
256A

188
256B

189
256C

190
00A9
©
191
C- 044E
ю
192
0430
а
193
0431
б
194
0446
ц
195
0434
д
196
0435
е
197
0444
ф
198
0433
г
199
0445
х
200
0438
и
201
0439
й
202
043A
к
203
043B
л
204
043C
м
205
043D
н
206
043E
о
207
D- 043F
п
208
044F
я
209
0440
р
210
0441
с
211
0442
т
212
0443
у
213
0436
ж
214
0432
в
215
044C
ь
216
044B
ы
217
0437
з
218
0448
ш
219
044D
э
220
0449
щ
221
0447
ч
222
044A
ъ
223
E- 042E
Ю
224
0410
А
225
0411
Б
226
0426
Ц
227
0414
Д
228
0415
Е
229
0424
Ф
230
0413
Г
231
0425
Х
232
0418
И
233
0419
Й
234
041A
К
235
041B
Л
236
041C
М
237
041D
Н
238
041E
О
239
F- 041F
П
240
042F
Я
241
0420
Р
242
0421
С
243
0422
Т
244
0423
У
245
0416
Ж
246
0412
В
247
042C
Ь
248
042B
Ы
249
0417
З
250
0428
Ш
251
042D
Э
252
0429
Щ
253
0427
Ч
254
042A
Ъ
255
-0 -1 -2 -3 -4 -5 -6 -7 -8 -9 -A -B -C -D -E -F

Note

  1. ^ a b CPGID 00878 - Code page identifiers, su ibm.com, IBM. URL consultato il 22 ottobre 2019.

Voci correlate

Altri progetti

Collegamenti esterni

  Portale Informatica: accedi alle voci di Wikipedia che trattano di informatica