Unicode

Unicode er eit teiknsett som blir vidareutvikla av organisasjonen The Unicode Consortium. Organisasjonen vart stifta i 1991 med det føremål å skape eit standard teiknsett for alle datamaskiner og som støtter alle språk som er i praktisk bruk. Unicode-standarden hadde i versjon 3.1 95221 skriftteikn. Standarden har seinare vorte utvida.

Unicode har fleire kodesett som har sin måte å framstille teikna. I UTF-32 blir det brukt 32 bit per teikn for å representere dagens Unicode-teiknsett, medan teikna i UTF-16, som blir brukt i nyare versjonar av Windows, vert delt opp i porsjoner på 16 bit. I UTF-8 blir Unicodeverdiane overført til ein- eller fleirbyte-sekvensar, etter ein matematisk algoritme. I og med at mange operativsystem (t.d. UNIX) krev 8-bits bytes, er UTF-8 kanskje det viktigaste Unicode-formatet i dag. I tillegg vil ein med UTF-8 kunne spare mykje minne ved handsaming av store mengder tekst, som inneheld hovudsakleg teikn som passar inn i første byten.

Det store fortrinnet med Unicode er at det gjer fleirspråkleg kommunikasjon mogleg. Medan ANSI-teiknsetta hindrar brukaren i å skrive på fleire språk innanfor eitt og same dokument, støttar Unicode dei fleste språk.

Redigeringsprinsipp

Det sentrale prinisppet i Unicode er at standarden skal vere kompatibel med tidlegare versjonar. Unicode har dermed berre ein redigeringsmetode, og det er å leggje til teikn. Viss eit teikn står i Unicode-standarden, blir det ståande der til evig tid. I startfasen vart det lagt til ein ein del teikn som ikkje ville ha komme med i dag.

Unicode er identisk med ISO/IEC-standarden ISO/IEC 10646, og han blir redigert av to ulike komitear, UTC (Unicode Technical committee, med representantar frå dataindustrien, og ulike lingvistar og skriftekspertar), og ISO/IEC JT1 SC2, komiteen for teiknsett. Prosessen å få eit nytt teikn inn i Unicode tar fleire år.

Other Languages
norsk: Unicode
svenska: Unicode
dansk: Unicode
Afrikaans: Unicode
Alemannisch: Unicode
አማርኛ: ዩኒኮድ
العربية: يونيكود
অসমীয়া: ইউনিক’ড
asturianu: Unicode
azərbaycanca: Unicode
বাংলা: ইউনিকোড
Bân-lâm-gú: Unicode
беларуская: Унікод
беларуская (тарашкевіца)‎: Юнікод
български: Уникод
Boarisch: Unicode
bosanski: Unicode
brezhoneg: Unicode
català: Unicode
Чӑвашла: Юникод
čeština: Unicode
Cymraeg: Unicode
Deutsch: Unicode
eesti: Unicode
Ελληνικά: Γιούνικοντ
English: Unicode
español: Unicode
Esperanto: Unikodo
euskara: Unicode
فارسی: یونی‌کد
français: Unicode
Gaeilge: Unicode
galego: Unicode
ગુજરાતી: યુનિકોડ
한국어: 유니코드
Հայերեն: Յունիկոդ
हिन्दी: यूनिकोड
hrvatski: Unikod
Ilokano: Unicode
Bahasa Indonesia: Unicode
interlingua: Unicode
íslenska: Unicode
italiano: Unicode
עברית: יוניקוד
Basa Jawa: Unicode
ಕನ್ನಡ: ಯುನಿಕೋಡ್
ქართული: უნიკოდი
कॉशुर / کٲشُر: यूनिकोड
қазақша: Юникод
Kurdî: Unicode
Кыргызча: Юникод
latviešu: Unikods
lietuvių: Unikodas
magyar: Unicode
മലയാളം: യൂണികോഡ്
मराठी: युनिकोड
მარგალური: იუნიკოდი
Bahasa Melayu: Unicode
монгол: Юникод
မြန်မာဘာသာ: ယူနီကုဒ်
Nederlands: Unicode
नेपाली: युनिकोड
नेपाल भाषा: युनिकोड
日本語: Unicode
occitan: Unicode
олык марий: Unicode
ਪੰਜਾਬੀ: ਯੂਨੀਕੋਡ
Plattdüütsch: Unicode
polski: Unikod
português: Unicode
română: Unicode
русский: Юникод
саха тыла: Юникод
संस्कृतम्: युनिकोड
Scots: Unicode
shqip: Unicode
සිංහල: යුනිකෝඩ්
Simple English: Unicode
slovenčina: Unicode
slovenščina: Unicode
کوردی: یوونیکۆد
српски / srpski: Unikod
srpskohrvatski / српскохрватски: Unikod
Basa Sunda: Unicode
suomi: Unicode
Tagalog: Unikodigo
తెలుగు: యూనికోడ్
тоҷикӣ: Юникод
ᏣᎳᎩ: ᏳᏂᎪᏛ
Türkçe: Unicode
українська: Юнікод
اردو: یونیکوڈ
ئۇيغۇرچە / Uyghurche: Unicode
Tiếng Việt: Unicode
walon: Unicôde
吴语: Unicode
ייִדיש: יוניקאד
Yorùbá: Unicode
粵語: 統一碼
中文: Unicode