Tracé
Trait |
aucun |
Chasse |
aucune |
modifier
Le diacritique invisible bloquant (en anglais Combining grapheme joiner, abrégé CGJ) est, en informatique et en typographie, un caractère sans chasse Unicode (U+034F), qui est utilisé pour indiquer qu’une séquence de caractères ne peut pas être considérée comme un seul graphème comme dans certaines langues, ou encore pour indiquer qu’une séquence de diacritiques ne doit pas être réordonnée selon l’algorithme habituel. Son nom en anglais (combining grapheme joiner – jointeur combinant de graphème) n’est pas représentatif de sa fonction, il ne sert pas à joindre les graphèmes. Ce n’est pas non plus un caractère de contrôle en tant que tel, mais plutôt un diacritique invisible, d’où son nom en français.
Exemples
Blocage de tri en slovaque
chaîne de caractères |
valeur |
résultat
|
c + h (U+0063 U+0068)
|
digraphe ‹ ch ›
|
ch
|
c + CGJ + h (U+0063 U+034F U+0068)
|
lettre ‹ c › et lettre ‹ h ›
|
c͏h
|
Blocage de réordonnancement de diacritiques
chaîne de caractères initiale |
chaîne de caractères réordonnée |
résultat |
image
|
t + ◌͡ + ◌̇ + s (U+0074 U+0361 U+0307 U+0073)
|
t + ◌̇ + ◌͡ + s (U+0074 U+0307 U+0361 U+0073)
|
ṫ͡s |
|
t + ◌͡ + CGJ + ◌̇ + s (U+0074 U+0361 U+034F U+0307 U+0073)
|
t͡͏̇s |
|
[he ה] + [metheg ◌ֽ] + [pathah ◌ַ] (U+05D4 U+05BD U+05B7)
|
[he ה] + [pathah ◌ַ] + [metheg ◌ֽ] (U+05D4 U+05B7 U+05BD)
|
הַֽ
|
|
[he ה] + [metheg ◌ֽ] + CGJ + [pathah ◌ַ] (U+05D4 U+05BD U+034F U+05B7)
|
הֽ͏ַ
|
|
Sécurité
Le diacritique invisible bloquant peut être utilisé pour l’offuscation de faux noms de domaine dans les URL ou les pourriels. Sous Windows, plusieurs fontes affichent un caractère visible à sa place, celui-ci est formé d’un carré et d’un cercle.
Voir aussi
Liens externes
|
Jeux de caractères de base |
|
|
Codification de fichiers et protocoles |
|
Adaptations de référence |
|
Équivalences standards |
- NFC (forme précomposée, recommandée)
- NFD (forme décomposée)
- NFKC (forme précomposée de compatibilité)
- NFKD (forme décomposée de compatibilité)
|
Propriétés et algorithmes |
|
Transformations |
|
Standards et normes liés |
- BCP 47 (étiquettes IETF d’identification de langues)
- ISO 639 (codes pour la représentation des noms de langues ou groupes de langues)
- ISO 15924 (codes pour la représentation des noms d’écritures)
- ISO 3166-1 (codes pour la représentation des noms de pays ou régions du monde)
- ISO 4217 (codes pour la représentation des noms de devises monétaires)
|
Mises en œuvre et applications |
|