Юникод

Unicode Consortium

Юнико́д, ёки Унико́д ( англисӣ: Unicode) — стандарти кодгузории рамзҳо мебошад, ки аломатҳоро қариб ба ҳаммаи алифбоҳои забонҳои дунё тасвир менамояд.

Стандарт дар соли 1991 аз тарафи ширкати «Консортсиум Юникод» ( англисӣ: Unicode Consortium), пешниҳод шуда буд.Истифодаи ин стандарт ба имкон медиҳад, ки миқдори зиёди рамзҳоро аз хатҳои гуногун кодгузорӣ намоем: дар ҳуҷҷатҳои Unicode метавонанд иероглифи чинӣ , аломатҳои математикӣ,ҳарфҳои алифбои юнонӣ, лотинӣ ва кириллӣ якҷоя биёянд, дар ин ҳолат саҳифаи кодӣ бекор карда мешавад.

Стандарт аз ду қисми асосӣ иборат мебошад: маҷмӯи универсалии рамзҳо (UCS, Universal Character Set) ва оилаи кодгузории (UTF, Unicode Transformation Format).

Кодҳо дар стандарти Unicode ба якчанд соҳа тақсим шудаанд. Соҳаи кодҳои аз U+0000 то U+007F рамзҳои маҷмӯи ASCIIро бо кодҳои мувофиқашон дар бар мегиранд. Баъд аз он соҳаи ҳарфҳои алифбоҳои гуногун,аломатҳои китобат, рамзҳои техникӣ меоянд. Як қисми кодҳо барои дар оянда истифода шудан, нигоҳ дошта шудаанд. Ҳарфҳои алифбои крилик аз U+0400 то U+052F доранд (нигаред Кириллӣ дар Юникод).

Фазои кодӣ

Ҳарчанд ки тарзи навишти UTF-8 ва UTF-32 имкон медиҳанд, ки то 231 (2,147,483,648) мавқеи кодӣ истифода шавад , вале барои UTF-16 мувофиқ будан танҳо 220+216 (1,114,112) тои он истифода мешавад. Ва ин хеле зиёд ҳам мебошад- дар айни ҳол (дар версияи 5.0) тақрибан зиёда аз 99,000 мавқеи кодӣ истифода мешаванд.

Фазои кодӣ ба 17 ҷузъи 216 (65536) рамз дошта ҷудо шудааст. Ҷузъи нулӣ асосӣ буда, дар он алифбоҳои маъмултарин ҷой шудаанд. Ҷузъи аввал асосан барои хатҳои таърихӣ истифода мешаванд. Ҷузъҳои 16 ва 17 барои истифодаи шахсӣ ҷудо шудаанд.

Барои ифодаи рамзҳои Unicode намуди «U+xxxx» (барои кодҳои 0...FFFF) ёки «U+xxxxx» (барои кодҳои 10000...FFFFF) ёки «U+xxxxxx» (барои кодҳои 100000...10FFFF) истифода мешавад, ки , дар ин ҷо xxx — рақамҳои системаи шонздаҳиӣ мебошанд. Мисол, рамзи«я» коди (U+044F)ро дорост, 044F 16 = 1103 10.

Other Languages
Afrikaans: Unicode
Alemannisch: Unicode
አማርኛ: ዩኒኮድ
العربية: يونيكود
অসমীয়া: ইউনিক’ড
asturianu: Unicode
azərbaycanca: Unicode
Boarisch: Unicode
беларуская: Унікод
беларуская (тарашкевіца)‎: Юнікод
български: Уникод
বাংলা: ইউনিকোড
brezhoneg: Unicode
bosanski: Unicode
català: Unicode
ᏣᎳᎩ: ᏳᏂᎪᏛ
کوردی: یوونیکۆد
čeština: Unicode
Чӑвашла: Юникод
Cymraeg: Unicode
dansk: Unicode
Deutsch: Unicode
Ελληνικά: Γιούνικοντ
English: Unicode
Esperanto: Unikodo
español: Unicode
eesti: Unicode
euskara: Unicode
فارسی: یونی‌کد
suomi: Unicode
français: Unicode
Gaeilge: Unicode
galego: Unicode
ગુજરાતી: યુનિકોડ
עברית: יוניקוד
हिन्दी: यूनिकोड
hrvatski: Unikod
magyar: Unicode
Հայերեն: Յունիկոդ
interlingua: Unicode
Bahasa Indonesia: Unicode
Ilokano: Unicode
íslenska: Unicode
italiano: Unicode
日本語: Unicode
Basa Jawa: Unicode
ქართული: უნიკოდი
қазақша: Юникод
ಕನ್ನಡ: ಯುನಿಕೋಡ್
한국어: 유니코드
कॉशुर / کٲشُر: यूनिकोड
Kurdî: Unicode
Кыргызча: Юникод
lietuvių: Unikodas
latviešu: Unikods
олык марий: Unicode
മലയാളം: യൂണികോഡ്
монгол: Юникод
मराठी: युनिकोड
Bahasa Melayu: Unicode
မြန်မာဘာသာ: ယူနီကုဒ်
Plattdüütsch: Unicode
नेपाली: युनिकोड
नेपाल भाषा: युनिकोड
Nederlands: Unicode
norsk nynorsk: Unicode
norsk: Unicode
occitan: Unicode
ਪੰਜਾਬੀ: ਯੂਨੀਕੋਡ
polski: Unikod
português: Unicode
română: Unicode
русский: Юникод
संस्कृतम्: युनिकोड
саха тыла: Юникод
Scots: Unicode
srpskohrvatski / српскохрватски: Unikod
සිංහල: යුනිකෝඩ්
Simple English: Unicode
slovenčina: Unicode
slovenščina: Unicode
shqip: Unicode
српски / srpski: Unikod
Basa Sunda: Unicode
svenska: Unicode
తెలుగు: యూనికోడ్
Tagalog: Unikodigo
Türkçe: Unicode
ئۇيغۇرچە / Uyghurche: Unicode
українська: Юнікод
اردو: یونیکوڈ
Tiếng Việt: Unicode
walon: Unicôde
吴语: Unicode
მარგალური: იუნიკოდი
ייִדיש: יוניקאד
Yorùbá: Unicode
中文: Unicode
Bân-lâm-gú: Unicode
粵語: 統一碼