Unicode

Logo Unicode.
. Alphabetique
  •      Latin
  •      Cyrillique
  •      Grec
  •      Armenién
  •      Georgién
  •      Hangul a
  • . [L]ogographique
    et [S]yllabique
  •      Hanzi [L]
  •      Kana [S]
    Asie orientale [L]
  •      Hanjab [L]
  • . Abjad
    (langues
    sémites)
  •      Arabe
  •      Hebreuxw
  • . Abugida
  •      Indic du nord
  •      Indic du Sud
  •      Ethiopien
  •      Thaana
  •      syllabique
    canadien
  • a. comme alphabetique; b. Limité.

    Unicode est un standard informatique qui permet des échanges de textes dans différentes langues, à un niveau mondial. Il est développé par le Consortium Unicode, qui vise au codage de texte écrit en donnant à tout caractère de n'importe quel système d'écriture un nom et un identifiant numérique, et ce de manière unifiée, quelle que soit la plate-forme informatique ou le logiciel utilisés.

    Ce standard est lié à la norme ISO/CEI 10646 qui décrit une table de caractères équivalente. La dernière version, Unicode 11.0, a été publiée en [1].

    Totalement compatible avec le jeu universel de caractères (JUC) de l'ISO/CEI 10646, le standard Unicode l'étend en lui ajoutant un modèle complet de représentation et de traitement de textes, en conférant à chaque caractère un jeu de propriétés normalisées ou informatives[Quoi ?], en décrivant avec précision les relations sémantiques qui peuvent exister entre plusieurs caractères successifs d'un texte[Quoi ?], et en normalisant des algorithmes de traitement qui préservent au maximum la sémantique des textes transformés. Unicode a pour objet de rendre un même texte utilisable à l'identique sur des systèmes informatiques totalement différents.

    Le standard Unicode est constitué d'un répertoire de 137 374 caractères, couvrant une centaine d’écritures, d'un ensemble de tableaux de codes pour référence visuelle, d'une méthode de codage et de plusieurs codages de caractères standard, d'une énumération des propriétés de caractère (lettres majuscules, minuscules, symboles, ponctuation, etc.) d'un ensemble de fichiers de référence des données informatiques, et d'un certain nombre d'éléments liés, tels que des règles de normalisation, de décomposition, de tri, de rendu et d'ordre d'affichage bidirectionnel (pour l'affichage correct de texte contenant à la fois des caractères d'écritures droite à gauche, comme l'arabe et l'hébreu, et de gauche à droite).

    En pratique, Unicode reprend intégralement la norme ISO/CEI 10646, puisque cette dernière ne normalise que les caractères individuels en leur assignant un nom et un numéro normatif (appelé point de code) et une description informative très limitée, mais aucun traitement ni aucune spécification ou recommandation pour leur emploi dans l'écriture de langues réelles, ce que seul le standard Unicode définit précisément. L'ISO/CEI 10646 fait normativement référence à certaines parties du standard Unicode (notamment l'algorithme bidirectionnel et les propriétés des caractères (en)) ; Unicode est également une norme de facto pour le traitement du texte et sert de base à de nombreuses autres normes.

    Other Languages
    Afrikaans: Unicode
    Alemannisch: Unicode
    አማርኛ: ዩኒኮድ
    العربية: يونيكود
    অসমীয়া: ইউনিক’ড
    asturianu: Unicode
    azərbaycanca: Unicode
    Boarisch: Unicode
    беларуская: Унікод
    беларуская (тарашкевіца)‎: Юнікод
    български: Уникод
    বাংলা: ইউনিকোড
    brezhoneg: Unicode
    bosanski: Unicode
    català: Unicode
    Mìng-dĕ̤ng-ngṳ̄: Unicode
    ᏣᎳᎩ: ᏳᏂᎪᏛ
    کوردی: یوونیکۆد
    čeština: Unicode
    Чӑвашла: Юникод
    Cymraeg: Unicode
    dansk: Unicode
    Deutsch: Unicode
    Ελληνικά: Unicode
    English: Unicode
    Esperanto: Unikodo
    español: Unicode
    eesti: Unicode
    euskara: Unicode
    فارسی: یونی‌کد
    suomi: Unicode
    Gaeilge: Unicode
    galego: Unicode
    ગુજરાતી: યુનિકોડ
    客家語/Hak-kâ-ngî: Unicode
    עברית: יוניקוד
    हिन्दी: यूनिकोड
    hrvatski: Unikod
    magyar: Unicode
    հայերեն: Յունիկոդ
    interlingua: Unicode
    Bahasa Indonesia: Unicode
    Ilokano: Unicode
    íslenska: Unicode
    italiano: Unicode
    日本語: Unicode
    Basa Jawa: Unicode
    ქართული: უნიკოდი
    қазақша: Юникод
    ಕನ್ನಡ: ಯುನಿಕೋಡ್
    한국어: 유니코드
    कॉशुर / کٲشُر: यूनिकोड
    kurdî: Unicode
    Кыргызча: Юникод
    Lingua Franca Nova: Unicode
    lietuvių: Unikodas
    latviešu: Unikods
    मैथिली: युनिकोड
    олык марий: Unicode
    മലയാളം: യൂണികോഡ്
    монгол: Юникод
    मराठी: युनिकोड
    Bahasa Melayu: Unicode
    မြန်မာဘာသာ: ယူနီကုဒ်
    Plattdüütsch: Unicode
    नेपाली: युनिकोड
    नेपाल भाषा: युनिकोड
    Nederlands: Unicode
    norsk nynorsk: Unicode
    norsk: Unicode
    occitan: Unicode
    ਪੰਜਾਬੀ: ਯੂਨੀਕੋਡ
    polski: Unikod
    português: Unicode
    română: Unicode
    русский: Юникод
    संस्कृतम्: युनिकोड
    саха тыла: Юникод
    Scots: Unicode
    srpskohrvatski / српскохрватски: Unikod
    සිංහල: යුනිකෝඩ්
    Simple English: Unicode
    slovenčina: Unicode
    slovenščina: Unicode
    shqip: Unicode
    српски / srpski: Unikod
    Basa Sunda: Unicode
    svenska: Unicode
    తెలుగు: యూనికోడ్
    тоҷикӣ: Юникод
    Tagalog: Unikodigo
    Türkçe: Unicode
    ئۇيغۇرچە / Uyghurche: Unicode
    українська: Юнікод
    اردو: یونیکوڈ
    Tiếng Việt: Unicode
    walon: Unicôde
    吴语: Unicode
    მარგალური: იუნიკოდი
    ייִדיש: יוניקאד
    Yorùbá: Unicode
    中文: Unicode
    文言: 萬國碼
    Bân-lâm-gú: Unicode
    粵語: 統一碼