Unikod

Unicode® je standard za razmjenu podataka usmjeren na prikaz slova na način neovisan o jeziku, računalnom programu ili računalnoj platformi.

Unicode je naišao na široku podršku što se vidi i iz broja članova Unicode konzorcija.

Unicode svaki simbol predstavlja jednom kodnom točkom, što je jednostavno cijeli broj. Taj broj se tada može zapisati na različite načine. Trenutna verzija standarda omogućava kodne točke u opsegu 0x0 - 0x10FFFF ( hex.), s tim da neke vrijednosti unutar tog opsega nisu moguće.

Opseg kodnih točaka 0x0 - 0xFFFF se naziva Basic Multilingual Plane (BMP).

Načini kodiranja

Da bi se i dosadašnjim sustavima omogućilo da bez većih teškoća usvoje Unicode način predstavljanja znakova, razvijeno je više načina kodiranja, poput:

  • UTF-7 — dosta nepopularno i uglavnom se smatra zastarjelim
  • UTF-8 — 8-bitno kodiranje, s promjenjvim brojem bajtova po znaku, vrlo popularno
  • UCS-2 — 16-bitno kodiranje, s nepromjenjivim brojem bajtova po znaku, ali podržava samo Basic Multilingual Plane
  • UTF-16 — 16-bitno kodiranje, s promjenjvim brojem bajtova po znaku
  • UCS-4 i UTF-32 — 32-bitna kodirajna, za svaki znak zauzimaju svih 32 bita, functionalno su isti
  • UTF-EBCDIC - nepopularno kodiranje orijentirano na sustave koji koriste samo EBCDIC kodnu shemu

Wikipedija koristi Unicode, i s web-pretraživačima koji sada koristite podatke razmjenjuje kroz UTF-8 način kodiranja.

Other Languages
Afrikaans: Unicode
Alemannisch: Unicode
አማርኛ: ዩኒኮድ
العربية: يونيكود
অসমীয়া: ইউনিক’ড
asturianu: Unicode
azərbaycanca: Unicode
Boarisch: Unicode
беларуская: Унікод
беларуская (тарашкевіца)‎: Юнікод
български: Уникод
বাংলা: ইউনিকোড
brezhoneg: Unicode
bosanski: Unicode
català: Unicode
ᏣᎳᎩ: ᏳᏂᎪᏛ
کوردی: یوونیکۆد
čeština: Unicode
Чӑвашла: Юникод
Cymraeg: Unicode
dansk: Unicode
Deutsch: Unicode
Ελληνικά: Γιούνικοντ
English: Unicode
Esperanto: Unikodo
español: Unicode
eesti: Unicode
euskara: Unicode
فارسی: یونی‌کد
suomi: Unicode
français: Unicode
Gaeilge: Unicode
galego: Unicode
ગુજરાતી: યુનિકોડ
עברית: יוניקוד
हिन्दी: यूनिकोड
magyar: Unicode
Հայերեն: Յունիկոդ
interlingua: Unicode
Bahasa Indonesia: Unicode
Ilokano: Unicode
íslenska: Unicode
italiano: Unicode
日本語: Unicode
Basa Jawa: Unicode
ქართული: უნიკოდი
қазақша: Юникод
ಕನ್ನಡ: ಯುನಿಕೋಡ್
한국어: 유니코드
कॉशुर / کٲشُر: यूनिकोड
Kurdî: Unicode
Кыргызча: Юникод
lietuvių: Unikodas
latviešu: Unikods
олык марий: Unicode
മലയാളം: യൂണികോഡ്
монгол: Юникод
मराठी: युनिकोड
Bahasa Melayu: Unicode
မြန်မာဘာသာ: ယူနီကုဒ်
Plattdüütsch: Unicode
नेपाली: युनिकोड
नेपाल भाषा: युनिकोड
Nederlands: Unicode
norsk nynorsk: Unicode
norsk: Unicode
occitan: Unicode
ਪੰਜਾਬੀ: ਯੂਨੀਕੋਡ
polski: Unikod
português: Unicode
română: Unicode
русский: Юникод
संस्कृतम्: युनिकोड
саха тыла: Юникод
Scots: Unicode
srpskohrvatski / српскохрватски: Unikod
සිංහල: යුනිකෝඩ්
Simple English: Unicode
slovenčina: Unicode
slovenščina: Unicode
shqip: Unicode
српски / srpski: Unikod
Basa Sunda: Unicode
svenska: Unicode
తెలుగు: యూనికోడ్
тоҷикӣ: Юникод
Tagalog: Unikodigo
Türkçe: Unicode
ئۇيغۇرچە / Uyghurche: Unicode
українська: Юнікод
اردو: یونیکوڈ
Tiếng Việt: Unicode
walon: Unicôde
吴语: Unicode
მარგალური: იუნიკოდი
ייִדיש: יוניקאד
Yorùbá: Unicode
中文: Unicode
Bân-lâm-gú: Unicode
粵語: 統一碼