Vérificateur de conformité Unicode
Collez (ou saisissez) du texte en grec polytonique ci-dessous pour vérifier sa conformité avec les quatre modes Unicode pris en charge par GreekTranscoder 2.
Note : pour des résultats fiables, collez votre texte directement depuis Microsoft Word ou une autre application qui en préserve elle aussi la mise en forme : Safari conforme le texte brut au format NFC, ce qui peut altérer l’encodage original des caractères.
Référence
Caractères composés savants
- Voyelles avec oxia : ά έ ή ί ό ύ ώ (U+1F71, 1F73, 1F75, 1F77, 1F79, 1F7B, 1F7D…)
- Point en haut : · (U+0387)
- Point d’interrogation grec : ; (U+037E)
- Signe numéral grec : ʹ (U+0374)
Caractères de composition savants
- Diacritiques grecs : U+0340 (varia), U+0341 (oxia), U+0342 (perispomeni), U+0343 (psili), U+0314 (dasia)
- Ponctuation grecque (identique aux composés savants)
Caractères composés NFC
- Voyelles avec tonos : ά έ ή ί ό ύ ώ (U+03AC, 03AD, 03AE, 03AF, 03CC, 03CD, 03CE…)
- Point médian : · (U+00B7)
- Point-virgule : ; (U+003B)
- Lettre modificative prime : ʹ (U+02B9)
Caractères de composition TLG
- Diacritiques génériques : U+0300 (grave), U+0301 (aigu), U+0303 (tilde), U+0313 (psili), U+0314 (dasia)
- Ponctuation NFC (identique aux composés NFC)
Diacritiques de composition :
Une note technique
- Problèmes de saisie
- Normalisation automatique de l’ordre canonique
- GreekTranscoder 2 : une solution élégante
- Récapitulatif
Problèmes de saisie
Les systèmes d’exploitation modernes, en particulier macOS, normalisent automatiquement le texte Unicode lors de la saisie. Lorsque vous tapez du texte grec en utilisant une configuration clavier quelle qu’elle soit (y compris celles qui produisent nominalement des diacritiques de composition), le système d’exploitation convertit automatiquement et sans vous en avertir la saisie, avant même qu’elle n’atteigne l’application, en caractères composés conformes au standard NFC.
Par exemple, lors de la saisie de la séquence :
- α (U+03B1) + esprit rude de composition (U+0314) + iota souscrit de composition (U+0345)
macOS substitue automatiquement l’équivalent composé :
- ᾁ (U+1F81 : Lettre minuscule grecque alpha esprit rude iota souscrit)
Cette normalisation s’effectue de manière transparente, quelle que soit la configuration de clavier utilisée ou les réglages de votre méthode de saisie.
Normalisation automatique de l’ordre canonique
Fait encore plus remarquable, macOS corrige automatiquement les signes de composition saisis dans le mauvais ordre. Selon la norme Unicode, les diacritiques de composition doivent apparaître dans un ordre canonique spécifique fondé sur la valeur de leur « classe combinatoire ». Si un utilisateur saisit les diacritiques en employant une séquence incorrecte — par exemple en tapant l’iota souscrit avant l’esprit rude —, macOS les réordonne automatiquement et produit malgré tout le caractère composé correct.
Ce mode de fonctionnement, pratique au demeurant, signifie que la plupart des applications conçues pour macOS ne peuvent pas accueillir de véritables diacritiques de composition saisis au clavier. Le système d’exploitation les intercepte et les normalise avant qu’ils n’atteignent Microsoft Word ou toute autre application faisant appel à macOS pour composer du texte.
Quelques applications possédant leur propre système de composition, comme BBEdit, Sublime Text ou Terminal, n’utilisent pas les services proposés par macOS et peuvent recevoir des caractères de composition « bruts ». Toutefois, un texte créé dans ces applications devra ensuite être copié puis collé dans Word où les problèmes décrits précédemment resurgiront aussitôt.
GreekTranscoder 2 : une solution élégante
GreekTranscoder 2 contourne la normalisation effectuée par le système d’exploitation en travaillant directement sur le contenu du document. Lorsque vous sélectionnez l’option « Caractères de composition », GreekTranscoder 2 :
- lit les caractères grecs précomposés de votre document ;
- les décompose en lettres de base accompagnées de signes diacritiques de composition ;
- écrit les séquences décomposées dans le document.
Parce que GreekTranscoder 2 travaille sur le document lui-même plutôt que par le biais de la méthode de saisie, il peut produire facilement de véritables diacritiques de composition sans recourir à des procédés compliqués exigeant l’emploi de logiciels tierces.
Récapitulatif
| Méthode de saisie | Caractères obtenus | Diacritiques de composition ? |
|---|---|---|
| Clavier grec polytonique macOS | Composés (NFC) | Non |
| Toute disposition de clavier tierce | Composés (NFC) | Non |
| Saisie directe de signes de composition | Composés (NFC) | Non |
| Saisie dans le mauvais ordre canonique | Composés (NFC) | Non |
| Applications possédant leur propre système de composition (BBEdit, etc.) | Décomposés | Oui, mais en dehors de Word |
| GreekTranscoder avec « Caractères de composition » | Décomposés (savants ou TLG) | Oui |
Note sur l’ordre canonique NFD : le strict respect de l’ordre canonique des caractères prévu par le standard NFD rangerait les signes de composition selon la valeur croissante de leurs points de code (lettre, puis accent U+0301, puis esprit U+0313, puis iota souscrit U+0345), plaçant ainsi l’accent avant l’esprit. Toutefois, cet ordre contredit la convention savante employée dans les études grecques (esprit avant accent) et observée dans l’encodage Beta Code, dans le corpus du TLG et jusque dans le nom officiel des caractères Unicode eux-mêmes (par exemple, « ALPHA AVEC PSILI ET OXIA »), rendant ainsi un ordre strictement conforme au standard NFD correct d’un point de vue technique, mais inutile en pratique (la normalisation d’un texte décomposé au standard NFC produira des caractères composés identiques quel que soit l’ordre initial des diacritiques).
Soutien au projet
Si vous trouvez cet outil utile, vous pouvez contribuer par un don au soutien du projet. Développer et tenir à jour des logiciels gratuits est une occupation coûteuse et votre aide est la bienvenue.
