Unicode

Unicode er et tegnsett som har som formål å skape et standard tegnsett for alle datamaskiner som støtter alle språk som er i praktisk bruk. Unicode blir utviklet av en privat organisasjon kalt Unicode Consortium. Organisasjonen ble stiftet i 1991 med det Unicode-standarden inneholdt i versjon 3.1 95221 skrifttegn, og standarden har senere blitt utvidet.

Unicode bruker forskjellige metoder for å representere tegnene i filer. I UTF-32 brukes 32 bit per tegn for å representere hele dagens Unicode-tegnsett, mens i UTF-16, som brukes i nyere versjoner av Windows, deles tegnene opp i porsjoner på 16 bit. UTF-8 bruker sekvenser på 8 bit, og er gjort bakoverkompatibelt med 7-biters ASCII tegnsettet som brukes i en stor andel av verdens datasystemer, slik at det enkelt kan benyttes i en rekke operativsystemer og kommunikasjon over Internett.

Fordelen med Unicode er at det tillater flerspråklig kommunikasjon. Mens ASCII-baserte tegnsett hindrer brukeren i å skrive på flere språk innenfor ett og samme dokument, støtter Unicode de fleste språk en innenfor rimelighetens grenser kan tenkes å bruke i et datasystem. Dermed gjør Unicode det mulig å enkelt representere flerspråklig data elektronisk. For mange språk er det uten Unicode vanskelig eller umulig å finne applikasjoner som støtter det.

Kritikk

Unicode har mottatt en del kritikk for sin implementasjon av kinesiske tegn. Tegnene har varierende utseende i forskjellige asiatiske skriftspråk, mens Unicode har gitt samme kode til flere av disse variantene. Samtidig inkluderer Unicode flere tegn som ser relativt like ut på flere plasser, for å bevare kompatibilitet med eldre tegnsett. Eldre versjoner av Unicode manglet også en del kinesiske tegn, men dette har blitt korrigert i senere revisjoner. Kina har sågar brukt Unicode som basis for sitt nye nasjonale tegnsett GB18030, som kombinerer det eldre kinesiske tegnsettet GB2312 med Unicode. GB18030 kan anses å være en kinesisk ekvivalent av UTF-8.

Andre språk
norsk nynorsk: Unicode
dansk: Unicode
svenska: Unicode
íslenska: Unicode
Afrikaans: Unicode
Alemannisch: Unicode
አማርኛ: ዩኒኮድ
العربية: يونيكود
অসমীয়া: ইউনিক’ড
azərbaycanca: Unicode
বাংলা: ইউনিকোড
Bân-lâm-gú: Unicode
беларуская: Унікод
беларуская (тарашкевіца)‎: Юнікод
български: Уникод
Boarisch: Unicode
bosanski: Unicode
brezhoneg: Unicode
català: Unicode
Чӑвашла: Юникод
čeština: Unicode
Cymraeg: Unicode
Deutsch: Unicode
eesti: Unicode
Ελληνικά: Γιούνικοντ
English: Unicode
español: Unicode
Esperanto: Unikodo
euskara: Unicode
فارسی: یونی‌کد
français: Unicode
Gaeilge: Unicode
galego: Unicode
ગુજરાતી: યુનિકોડ
한국어: 유니코드
Հայերեն: Յունիկոդ
हिन्दी: यूनिकोड
hrvatski: Unikod
Ilokano: Unicode
Bahasa Indonesia: Unicode
interlingua: Unicode
italiano: Unicode
עברית: יוניקוד
Basa Jawa: Unicode
ಕನ್ನಡ: ಯುನಿಕೋಡ್
ქართული: უნიკოდი
कॉशुर / کٲشُر: यूनिकोड
қазақша: Юникод
Kurdî: Unicode
Кыргызча: Юникод
latviešu: Unikods
lietuvių: Unikodas
magyar: Unicode
മലയാളം: യൂണികോഡ്
मराठी: युनिकोड
მარგალური: იუნიკოდი
Bahasa Melayu: Unicode
монгол: Юникод
မြန်မာဘာသာ: ယူနီကုဒ်
Nederlands: Unicode
नेपाली: युनिकोड
नेपाल भाषा: युनिकोड
日本語: Unicode
occitan: Unicode
олык марий: Unicode
ਪੰਜਾਬੀ: ਯੂਨੀਕੋਡ
Plattdüütsch: Unicode
polski: Unikod
português: Unicode
română: Unicode
русский: Юникод
саха тыла: Юникод
संस्कृतम्: युनिकोड
Scots: Unicode
shqip: Unicode
සිංහල: යුනිකෝඩ්
Simple English: Unicode
slovenčina: Unicode
slovenščina: Unicode
کوردی: یوونیکۆد
српски / srpski: Unikod
srpskohrvatski / српскохрватски: Unikod
Basa Sunda: Unicode
suomi: Unicode
Tagalog: Unikodigo
తెలుగు: యూనికోడ్
тоҷикӣ: Юникод
ᏣᎳᎩ: ᏳᏂᎪᏛ
Türkçe: Unicode
українська: Юнікод
اردو: یونیکوڈ
ئۇيغۇرچە / Uyghurche: Unicode
Tiếng Việt: Unicode
walon: Unicôde
吴语: Unicode
ייִדיש: יוניקאד
Yorùbá: Unicode
粵語: 統一碼
中文: Unicode