Unicode

Unicode (pronunțat în engleză  /ˈjuːnɪˌkəʊd/) este un format definit de către Unicode Consortium pentru codarea, stocarea și interpretarea textelor pe suporturi informatice. Unicode este formatul standard de facto de codificare și interpretare a datelor binare în format text, având drept țel final să cuprindă toate caracterele din toate limbile globului. Este proiectat pentru ca oricărei litere (caracter) din orice limbă, de pe orice platformă de hardware sau software (program) să îi corespundă un număr unic și neechivoc. Standardul Unicode reprezintă implementarea specificațiilor ISO/IEC 10646, publicate prima dată în 1993 de către organizația ISO.

Fiind adoptat de majoritatea producătorilor de software ( Microsoft, Apple, HP, Oracle), Unicode a început să fie folosit pe scară largă și să fie oferit de cele mai diverse aplicații de larg interes, începând de la cele mai răspândite sisteme de operare și până la sisteme de baze de date și servere de Internet. Totuși încă nu se poate vorbi de o accepție și un suport intergrat al acestei codificări la scară globală.

Până la Unicode au existat diverse metode de a se defini caracterele naționale ale diverselor țări, începând cu „ ANSI extins” pentru l. engleză și terminând cu ultima alternativă standard, ISO-8859, trecând prin diverse variante cu răspândire mai largă sau mai restrânsă. Practic toate alternativele acceptate au fost bazate pe ideea că un text trebuie în mod necesar să fie scris de la început și până la sfârșit în aceeași limbă. Dar, odată cu globalizarea accentuată inclusiv a sistemelor informatice, a apărut din ce în ce mai mult necesitatea unui sistem de codificare care să accepte mai multe limbi în unul și același document scris.

Toate sistemele de codificare premergătoare lui Unicode se bazau pe același principiu ca și „ANSI extins”: din cele 256 de combinații posibile în cadrul unui octet, prima jumătate era folosită de un set comun de caractere – ASCII – iar cealaltă jumătate era dedicată codificării specifice, dependente de limbă. Având în vedere nu numai multitudinea de limbi posibile dar și numărul de caractere uriaș din unele limbi (un exemplu relevant este limba chineză), Unicode a introdus un număr arbitrar de octeți pe caracter. Din acest motiv implementarea acestui sistem de codificare este mai greu de realizat decât pentru sistemele tradiționale, însă cum utilitatea acestuia depășește cu mult dificultatea implementării, acest format a devenit unicul standard acceptat practic de către toate sistemele informatice curente.

Exemple de Unicode-uri

  • Derivate din alfabetul latin: Č, ĝ, ı, ą, Ŝ, ǔ, Þ, Ə
  • Derivate din abugidaul telugu: ౢ, ౣ, ౘ, ౙ, ఽ, ౸, ౹, ౺, ౻, ౼, ౽, ౾, ౿
Alte limbi
Afrikaans: Unicode
Alemannisch: Unicode
አማርኛ: ዩኒኮድ
العربية: يونيكود
অসমীয়া: ইউনিক’ড
asturianu: Unicode
azərbaycanca: Unicode
Boarisch: Unicode
беларуская: Унікод
беларуская (тарашкевіца)‎: Юнікод
български: Уникод
বাংলা: ইউনিকোড
brezhoneg: Unicode
bosanski: Unicode
català: Unicode
ᏣᎳᎩ: ᏳᏂᎪᏛ
کوردی: یوونیکۆد
čeština: Unicode
Чӑвашла: Юникод
Cymraeg: Unicode
dansk: Unicode
Deutsch: Unicode
Ελληνικά: Γιούνικοντ
English: Unicode
Esperanto: Unikodo
español: Unicode
eesti: Unicode
euskara: Unicode
فارسی: یونی‌کد
suomi: Unicode
français: Unicode
Gaeilge: Unicode
galego: Unicode
ગુજરાતી: યુનિકોડ
עברית: יוניקוד
हिन्दी: यूनिकोड
hrvatski: Unikod
magyar: Unicode
Հայերեն: Յունիկոդ
interlingua: Unicode
Bahasa Indonesia: Unicode
Ilokano: Unicode
íslenska: Unicode
italiano: Unicode
日本語: Unicode
Basa Jawa: Unicode
ქართული: უნიკოდი
қазақша: Юникод
ಕನ್ನಡ: ಯುನಿಕೋಡ್
한국어: 유니코드
कॉशुर / کٲشُر: यूनिकोड
Kurdî: Unicode
Кыргызча: Юникод
lietuvių: Unikodas
latviešu: Unikods
олык марий: Unicode
മലയാളം: യൂണികോഡ്
монгол: Юникод
मराठी: युनिकोड
Bahasa Melayu: Unicode
မြန်မာဘာသာ: ယူနီကုဒ်
Plattdüütsch: Unicode
नेपाली: युनिकोड
नेपाल भाषा: युनिकोड
Nederlands: Unicode
norsk nynorsk: Unicode
norsk: Unicode
occitan: Unicode
ਪੰਜਾਬੀ: ਯੂਨੀਕੋਡ
polski: Unikod
português: Unicode
русский: Юникод
संस्कृतम्: युनिकोड
саха тыла: Юникод
Scots: Unicode
srpskohrvatski / српскохрватски: Unikod
සිංහල: යුනිකෝඩ්
Simple English: Unicode
slovenčina: Unicode
slovenščina: Unicode
shqip: Unicode
српски / srpski: Unikod
Basa Sunda: Unicode
svenska: Unicode
తెలుగు: యూనికోడ్
тоҷикӣ: Юникод
Tagalog: Unikodigo
Türkçe: Unicode
ئۇيغۇرچە / Uyghurche: Unicode
українська: Юнікод
اردو: یونیکوڈ
Tiếng Việt: Unicode
walon: Unicôde
吴语: Unicode
მარგალური: იუნიკოდი
ייִדיש: יוניקאד
Yorùbá: Unicode
中文: Unicode
Bân-lâm-gú: Unicode
粵語: 統一碼