Unicode

Unicode — istənilən simvol üçün platformadan, proqramdan, dildən asılı olmayan unikal bir koddur.

Unicode logo.svg

UNICODE <yunikod> – bütün milli əlifbaların simvollarını kodlaşdırmaq üçün ISO 10646 standartı. Bu kodda hər bir simvolu göstərmək üçün 16-bitlik (2-baytlıq) bənzərsiz kombinasiyadan istifadə olunur. Standartları təsdiq edilməsi ilə Unicode konsorsiumu məşğul olur. Yunikod’da simvolları kodlaşdırmaq üçün 1 112 064 (= 220 + 216 − 211) yer ayrılıb ki, hazırda onlardan 100 mindən çoxu istifadə olunur. Kod fəzası hər birində 65 536 (= 216) simvol olmaqla 17 “müstəviyə” bölünüb:


• 0 müstəvisi (0000–FFFF): Təməl çoxdilli müstəvi (Basic Multilingual Plane, BMP)

• 1 müstəvisi (10000–1FFFF): Əlavə çoxdilli müstəvi (Supplementary Multilingual Plane, SMP)

• 2 müstəvisi (20000–2FFFF): Əlavə heroqlif müstəvisi (Supplementary Ideographic Plane, SIP)

• 3 müstəvisi (30000–3FFFF): Üçüncü heroqlif müstəvisi (Tertiary Ideographic Plane, TIP)

• 4 – 13 müstəviləri (40000–DFFFF) istifadə olunmur

• 14 müstəvisi (E0000–EFFFF): Xüsusi təyinatlı əlavə müstəvi (Supplementary Special-purpose Plane, SSP)

• 15 müstəvisi (F0000–FFFFF) Xüsusi istifadəli əlavə A-sahəsi (Supplementary Private Use Area-A, SPUA-A)

• 16 müstəvisi (100000–10FFFF) Xüsusi istifadəli əlavə B-sahəsi (Supplementary Private Use Area-B, SPUA-B)


0 müstəvisində hazırda istifadə olunan bütün əlifbaların simvolları və çoxlu sayda xüsusi simvollar yerləşir. Cədvəlin böyük bir hissəsini Çin-yapon heroqlifləri və Koreya hərfləri tutur. Azərbaycan (Türk) əlifbasının özəl simvollarının Unicode qarşılıqları bunlardır:


ğ U+011f

Ğ U+011e

ı U+0131

İ U+0130

ö U+00f6

Ö U+00d6

ü U+00fc

Ü U+00dc

ş U+015f

Ş U+015e

ç U+00e7

Ç U+00c7

ə U+0259

Ə U+018F


Mahiyyətinə görə kompüterlər yalnız rəqəmlərlə işləyə bilir. Kompüterlərin yaddaşlarında hərfləri saxlamaq üçün hər bir hərfə (və ya simvola) müəyyən bir ədəd qarşı qoyulur. Unicode yaranmamışdan əvvəl dünyada müxtəlif növ simvol kodlaşdırmaları var idi. Lakin onlardan heç biri bütün simvolları əhatə edə bilmirdi. Məsələn, Avropa Birliyi dillərinin əlifbalarına daxil olan hərflərin kodlaşdırılması üçün müxtəlif kodlaşdırmalardan istifadə edilirdi. Hətta ayrıca bir dili təyin etmək üçün də (məs. İngilis dilini) müəyyən bir standart kodlaşdırma sistemi yox idi ki, o adi hərfləri, işarə simvollarını və texniki simvolları özündə cəmləşdirsin. Bundan başqa, çox vaxt da bu kodlaşdırmalar arasında uyğunluq yox idi. Misal üçün, iki müxtəlif kodlaşdırma sistemi bir-birindən fərqli olan iki simvola eyni bir kod və ya eyni bir simvola müxtəlif kodlar verirdi. Belə vəziyyətdə istənilən bir kompüterdə, əsasən də, server kompüterlərdə müxtəlif kodlaşdırma sistemlərini saxlamaq lazım gəlirdi. Lakin bu halda da informasıyanın digər patformaya ötürülməsi və ya digər kodlaşdırmaya çevrilməsi müəyyən risk tələb edirdi.


Unicode-un tətbiqi bütün bu problemləri həll edir. Unicode sistemi dildən, platformadan, proqramdan asılı olamayaraq istənilən simvola unikal bir kod mənimsədir. Unicode Apple, HP, IBM, JustSystem, Microsoft, Oracle, SAP, Sun, Sybase, Unisys kimi böyük kompüter şirkətləri (və digər başqaları) tərəfindən kodlaşdırma standartı kimi qəbul edilmişdir. XML, Java, ECMAScript (JavaScript), LDAP, CORBA 3.0, WML və s. kimi müasir texnologiyalar tərəfindən yalnız Unicode kodlaşdırması istifadə olunur. Unicode ISO/IEC 10646-nın rəsmi realizə sxemidir. Nəhayət ki, bu kodlaşdırma demək olar ki, bütün əməliyyat sistemləri (platformaları), bütün İnternet proqramları və digər proqramlar tərəfindən dəstəklənir. Unicode standartlarının hər yerdə tətbiq edilməsi və onu dəstəkləyən vasitələrin əldə olunmasının mümkünlüyü hal-hazırda proqram təminatlarının inkişafının ən vacib istiqamətlərindən biridir.

Client-Server strukturunda olan çoxtəbəqəli proqram təminatlarında və proqram paketlərində, eyni zamanda İnternet şəbəkəsində informasiyanın təqdim edilməsində Unicode-dan istifadə köhnə kodlaşmalardan fərqli olaraq proqram məhsullarının dəstəklənməsinə çəkilən xərclərin azaldılmasına gətirib çıxarır. Döğrudan da Unicode müxtəlif platformalar üçün vahid proqram təminatı və ya İnternet səhifəsi hazırlamağa imkan verir. Informasiya ötürülməsində Unicode-dan istifadə informasiyanın tam dəqiq və itkisiz ötürülməsinə zəmanət verir.

  • Ədəbiyyat

Ədəbiyyat

  • İsmayıl Calallı (Sadıqov), “İnformatika terminlərinin izahlı lüğəti”, 2017, “Bakı” nəşriyyatı, 996 s.
Digər dillərdə
Afrikaans: Unicode
Alemannisch: Unicode
አማርኛ: ዩኒኮድ
العربية: يونيكود
অসমীয়া: ইউনিক’ড
Boarisch: Unicode
беларуская: Унікод
беларуская (тарашкевіца)‎: Юнікод
български: Уникод
বাংলা: ইউনিকোড
brezhoneg: Unicode
bosanski: Unicode
català: Unicode
ᏣᎳᎩ: ᏳᏂᎪᏛ
کوردی: یوونیکۆد
čeština: Unicode
Чӑвашла: Юникод
Cymraeg: Unicode
dansk: Unicode
Deutsch: Unicode
Ελληνικά: Γιούνικοντ
English: Unicode
Esperanto: Unikodo
español: Unicode
eesti: Unicode
euskara: Unicode
فارسی: یونی‌کد
suomi: Unicode
français: Unicode
Gaeilge: Unicode
galego: Unicode
ગુજરાતી: યુનિકોડ
עברית: יוניקוד
हिन्दी: यूनिकोड
hrvatski: Unikod
magyar: Unicode
Հայերեն: Յունիկոդ
interlingua: Unicode
Bahasa Indonesia: Unicode
Ilokano: Unicode
íslenska: Unicode
italiano: Unicode
日本語: Unicode
Basa Jawa: Unicode
ქართული: უნიკოდი
қазақша: Юникод
ಕನ್ನಡ: ಯುನಿಕೋಡ್
한국어: 유니코드
कॉशुर / کٲشُر: यूनिकोड
Kurdî: Unicode
Кыргызча: Юникод
lietuvių: Unikodas
latviešu: Unikods
олык марий: Unicode
മലയാളം: യൂണികോഡ്
монгол: Юникод
मराठी: युनिकोड
Bahasa Melayu: Unicode
မြန်မာဘာသာ: ယူနီကုဒ်
Plattdüütsch: Unicode
नेपाली: युनिकोड
नेपाल भाषा: युनिकोड
Nederlands: Unicode
norsk nynorsk: Unicode
norsk: Unicode
occitan: Unicode
ਪੰਜਾਬੀ: ਯੂਨੀਕੋਡ
polski: Unikod
português: Unicode
română: Unicode
русский: Юникод
संस्कृतम्: युनिकोड
саха тыла: Юникод
Scots: Unicode
srpskohrvatski / српскохрватски: Unikod
සිංහල: යුනිකෝඩ්
Simple English: Unicode
slovenčina: Unicode
slovenščina: Unicode
shqip: Unicode
српски / srpski: Unikod
Basa Sunda: Unicode
svenska: Unicode
తెలుగు: యూనికోడ్
тоҷикӣ: Юникод
Tagalog: Unikodigo
Türkçe: Unicode
ئۇيغۇرچە / Uyghurche: Unicode
українська: Юнікод
اردو: یونیکوڈ
Tiếng Việt: Unicode
walon: Unicôde
吴语: Unicode
მარგალური: იუნიკოდი
ייִדיש: יוניקאד
Yorùbá: Unicode
中文: Unicode
Bân-lâm-gú: Unicode
粵語: 統一碼