യൂണികോഡ്

ലോകഭാഷകളിലെ ലിപികളുടെ കമ്പ്യൂട്ടറുകളിലുള്ള ആവിഷ്കാരത്തിനായി നിർമ്മിച്ചിരിക്കുന്ന ഒരു മാനദണ്ഡമാണ് യൂണികോഡ്. ഇംഗ്ലീഷ് അറിയുന്നവർക്കുള്ളതാണ് കമ്പ്യൂട്ടറെന്ന അബദ്ധധാരണ പൊളിച്ചെഴുതിയതാണ് യൂണീകോഡിന്റെ നേട്ടം. പുതിയ പല ഓപ്പറേറ്റിങ്ങ് സിസ്റ്റങ്ങളും, എക്സ്.എം.എൽ., ജാവാ തുടങ്ങിയ സാങ്കേതിക വിദ്യകളും യൂണീകോഡിനെ പിന്തുണക്കുന്നുണ്ട്. യൂണികോഡ് കൺസോർഷ്യം എന്ന ലാഭരഹിത സംഘടനയാണ് യൂണീകോഡിന്റെ നിർമ്മാണത്തിനു പിന്നിൽ. ലോകത്ത് നിലനിൽക്കുന്ന എല്ലാഭാഷകളേയും ഒരുമിച്ചവതരിപ്പിക്കുക എന്നതാണ് ഈ സംഘടനയുടെ പ്രഖ്യാപിത ലക്ഷ്യം. എല്ലാ പ്രാദേശിക ഭാഷാ ഉപയോക്താക്കൾക്കും അവരവരുടെ ഭാഷകളിൽ കമ്പ്യൂട്ടർ ഉപയോഗിക്കാനുള്ള അവസരം സൃഷ്ടിച്ചതാണ് യൂണീകോഡിന് പിന്നിൽ പ്രവർത്തിക്കുന്ന യൂണീകോഡ് കൺ‌സോർഷ്യത്തിന്റെ സംഭാവന. ഈ സംഘടനയുടെ ഔദ്യോഗിക സൈറ്റാണ് യൂണീകോഡ് ഡോട്ട് ഓർഗ്. കാലാകാലങ്ങളിൽ യൂണിക്കോഡിനെ യൂണികോഡ് കൺസോർഷ്യം പരിഷ്ക്കരിക്കാറുണ്ട്. പുതിയ അക്ഷരങ്ങൾ കൂട്ടിച്ചേർത്തും നിലവിലുള്ള പ്രശ്നങ്ങൾ പരിഹരിക്കുകയുമാണ് അവർ ചെയ്തുവരുന്നത്. ഇപ്പോൾ യൂണിക്കോഡിന്റെ വെർഷൻ 6.3 ആണ്.

ചരിത്രം

അക്ഷരങ്ങളും അക്കങ്ങളും ചിഹ്നങ്ങളും പൂജ്യത്തിന്റേയും ഒന്നിന്റേയും കൂട്ടങ്ങളായി മാറ്റിയാണ് കമ്പ്യൂട്ടറിൽ ശേഖരിച്ചു വയ്ക്കുന്നത്. ഇങ്ങനെ ശേഖരിക്കുന്നതിന് ഓരോന്നിനും അതി‍ന്റേതായ കോഡുകൾ ഉണ്ടായിരിക്കണം. ഇപ്പോൾ ഇത് കൂടുതലായും ASCII (അമേരിക്കൻ സ്റ്റാൻഡാർഡ് കോഡ് ഫോർ ഇൻഫർമേഷൻ ഇന്റർചേഞ്ച്) കോഡുപയോഗിച്ചാണ് നിർവ്വഹിച്ചു വരുന്നത്. ഇതുപയോഗിച്ചുണ്ടാക്കാവുന്ന അക്ഷരാദികളുടെ എണ്ണം (256) പരിമിതമായതുകൊണ്ട് രണ്ടു ഭാഷകളിലെ അക്ഷരങ്ങളേ ഒരേ സമയം ഉപയോഗിക്കാൻ സാധിക്കുകയുള്ളു. ഇതില്‌ ആദ്യത്തെ 128 എണ്ണം ഇംഗ്ളീഷിനും അടുത്ത 128 എണ്ണം വേറെ ഏതെങ്കിലും ഭാഷക്കും ഉപയോഗിക്കാം.

ലോകമാസകലം കമ്പ്യുട്ടറുകൾ വരുകയും അവയെയെല്ലാം ബന്ധിപ്പിക്കുന്ന ഇന്റർനെറ്റ് സംജാതമാകുകയും ചെയ്തതോടെ ലോകഭാഷകൾ എല്ലാം അടങ്ങുന്ന ഒരു കോഡിംഗ് സിസ്റ്റം ആവശ്യമായിവന്നു. ഇതിലേക്കായി ഇന്റർനാഷണൽ സ്റ്റാൻഡാർഡ് ISO/IEC 106461, ഒരു പദ്ധതി തയ്യാറാക്കി. ഈ പദ്ധതിയിൽ ഉൾപ്പെടുത്തിയ എല്ലാ അക്ഷരാദികളേയും സ്വാംശീകരിച്ചുകൊണ്ട് കുറച്ചു കൂടി ബൃഹത്തായതും ലോകഭാഷകളാകമാനം ഉൾക്കൊള്ളാനാവുന്നതും ഭാവി വികസനങ്ങൾക്ക് പഴുതുള്ളതുമായ ഒരു കോഡിംഗ് സമ്പ്രദായം വേണമെന്ന് കമ്പ്യൂട്ടർ ലോകത്തിനു തോന്നി. അങ്ങനെയാണ് കമ്പ്യൂട്ടർ കോർപ്പറേഷനുകളും സോഫ്റ്റ്‌വേർ ഡാറ്റാബേസ് കച്ചവടക്കാരും, അന്താരാഷ്ട്ര ഏജൻസികളും ഉപയോക്താക്കളും ചേർന്ന് 1991-ൽ ദി യുണിക്കോഡ് കണ്‌സോർഷ്യം എന്ന ഒരു സംഘടന രൂപവത്കരിച്ചത്. ഇന്ത്യാ ഗവൺമെന്റിന്റെ ഇൻഫർമേഷൻ ടെക്നോളജി ഡിപ്പാർട്ട്മെന്റ് ഇതിലെ ഒരു മുഴുവൻ സമയ അംഗമാണ് .

ലോകഭാഷകളെല്ലാം പിന്തുണയ്ക്കുന്ന ഒരു ഇന്റർ‌നാഷണൽ സ്റ്റാൻഡേർഡ് വികസിപ്പിച്ചെടുക്കാനും ഇതിനായുള്ള വിവിധതലങ്ങളിലെ പ്രവർത്തനങ്ങൾ ഏകോപിപ്പിക്കാനും ഉണ്ടാക്കിയ സംഘടനയാണ് യൂണീകോഡ് കൺ‌സോർഷ്യം. ഈ സംഘടനയുടെ കാര്യപ്രവർത്തനങ്ങൾ ജനങ്ങളെ അറിയിക്കുന്നതിനായാണ് യൂണീകോഡ് ഡോട്ട് ഓർഗ് എന്ന സൈറ്റ് നിലവിൽ വന്നത്.

ഇന്റർനാഷണൽ സ്റ്റാന്റേർഡ് ഓർഗനൈസേഷനും യുണിക്കോഡും ചേർന്ന് 1992ല്‌ യൂണിക്കോഡ് വേർഷന്‌ 1.0 പുറത്തിറക്കി. ഇതു പരിഷ്കരിച്ച് 2.0യും 2000 ഫെബ്രുവരിയിൽ 3.0യും പുറത്തിറങ്ങി. ISO 10646 -ൽ 32 ബിറ്റുപയോഗിച്ചിരുന്നിടത്ത് 16 ബിറ്റു മാത്രമേ യൂണിക്കോഡ് ഉപയോഗിക്കുന്നുള്ളൂ. അതായത് 16 സ്ഥാനങ്ങളിലായി ഒന്നും പൂജ്യവും നിരത്തി 65536 അക്ഷരാദികളുടെ കോഡുകള്‌ നിർമ്മിക്കാം. ഇവ 500 ഓളം ഭാഷകൾക്കു മതിയാകും. പുരാതന ലിപികളും ഭാവിയിൽ ഉണ്ടാകുന്ന ലിപികളും ഇതിൽ ഉൾക്കൊള്ളിക്കാൻ തക്കവിധത്തിൽ ഇതിനെ വിപുലപ്പെടുത്താനും സാധിക്കുന്നതാണ്‌ . പ്രധാനപ്പെട്ട ലോകഭാഷകൾ മിക്കവാറും എല്ലാം തന്നെ ഉൾപ്പെട്ടുത്തി 49194 അക്ഷരാദികൾക്ക് ഇതിനകം കോഡുകൾ നല്കിക്കഴിഞ്ഞു. ഇതിൽ ചൈനീസും ജാപ്പനീസും ഉൾപ്പെടും. അടുത്തുതന്നെ ബർമീസ്, സിൻഹാളീസ്, സിറിയക് മുതലായ ഭാഷകളും ഇതിന്റെ കീഴിൽ കൊണ്ടു വരുന്നതാണ്.

ആഗോളമായി നടക്കുന്ന സകല ഭാഷാ കമ്പ്യൂട്ടിംഗ് പ്രവർത്തനങ്ങളുടെയും മൂലക്കല്ലാണ് യൂണീകോഡ്. പ്രാദേശിക ഭാഷകളിലേക്ക് വിവിധ സോഫ്റ്റ്‌വെയറുകൾ പ്രാദേശികവൽക്കരിക്കാൻ (ലോക്കലൈസ് ചെയ്യാൻ) ഇതല്ലാതെ മറ്റൊരു ഉത്തരമില്ലതന്നെ.

യൂണിക്കോഡ് ഭാഷയിലെ അക്ഷരങ്ങൾക്ക് കോഡുകൾ നല്‌കിയെങ്കിലും അവ എങ്ങനെ സ്ക്രീനിൽ കാണണമെന്ന് ഹാർഡ്‍വേറും സോഫ്‍റ്റ്വേറും ഇറക്കുന്നവരാണ് തീരുമാനിക്കുന്നത്. ലോക ഭാഷകൾ ഒരേ സ്ക്രീനിൽ പ്രത്യക്ഷപ്പെടേണ്ടി വരുമ്പോൾ ലോക പ്രശസ്തരായ IBM, മൈക്രോസോഫ്റ്റ്, ഒറാക്കിൾ, ആപ്പിൾ എന്നിത്യാദി വമ്പൻമാരെല്ലാം യൂണിക്കോഡിനെ വാരിപ്പുണരുന്നതിൽ അത്ഭുതപ്പെടാനില്ല. ഇന്റർനെറ്റിന്റേ ലോകവ്യാപകമായ പ്രചാരത്തോടുകൂടി യൂണിക്കോഡും ഒരു ആഗോളലിപികളുടെ കോഡായിമാറിക്കഴിഞ്ഞു.

9 ഇന്ത്യൻ ഭാഷകൾക്കായി 128 X 9 = 1152 കോഡുകൾ (2304 മുതൽ 3455 വരെ) അലോട്ടുചെയ്തിരിക്കുന്നതിൽ 3328 മുതൽ 3455 വരെയുള്ള 128 എണ്ണം മലയാള ലിപികൾക്കാണ് തന്നിരിക്കുന്നത്.

Other Languages
Afrikaans: Unicode
Alemannisch: Unicode
አማርኛ: ዩኒኮድ
العربية: يونيكود
অসমীয়া: ইউনিক’ড
asturianu: Unicode
azərbaycanca: Unicode
Boarisch: Unicode
беларуская: Унікод
беларуская (тарашкевіца)‎: Юнікод
български: Уникод
বাংলা: ইউনিকোড
brezhoneg: Unicode
bosanski: Unicode
català: Unicode
ᏣᎳᎩ: ᏳᏂᎪᏛ
کوردی: یوونیکۆد
čeština: Unicode
Чӑвашла: Юникод
Cymraeg: Unicode
dansk: Unicode
Deutsch: Unicode
Ελληνικά: Unicode
English: Unicode
Esperanto: Unikodo
español: Unicode
eesti: Unicode
euskara: Unicode
فارسی: یونی‌کد
suomi: Unicode
français: Unicode
Gaeilge: Unicode
galego: Unicode
ગુજરાતી: યુનિકોડ
עברית: יוניקוד
हिन्दी: यूनिकोड
hrvatski: Unikod
magyar: Unicode
Հայերեն: Յունիկոդ
interlingua: Unicode
Bahasa Indonesia: Unicode
Ilokano: Unicode
íslenska: Unicode
italiano: Unicode
日本語: Unicode
Basa Jawa: Unicode
ქართული: უნიკოდი
қазақша: Юникод
ಕನ್ನಡ: ಯುನಿಕೋಡ್
한국어: 유니코드
कॉशुर / کٲشُر: यूनिकोड
kurdî: Unicode
Кыргызча: Юникод
lietuvių: Unikodas
latviešu: Unikods
मैथिली: युनिकोड
олык марий: Unicode
монгол: Юникод
मराठी: युनिकोड
Bahasa Melayu: Unicode
မြန်မာဘာသာ: ယူနီကုဒ်
Plattdüütsch: Unicode
नेपाली: युनिकोड
नेपाल भाषा: युनिकोड
Nederlands: Unicode
norsk nynorsk: Unicode
norsk: Unicode
occitan: Unicode
ਪੰਜਾਬੀ: ਯੂਨੀਕੋਡ
polski: Unikod
português: Unicode
română: Unicode
русский: Юникод
संस्कृतम्: युनिकोड
саха тыла: Юникод
Scots: Unicode
srpskohrvatski / српскохрватски: Unikod
සිංහල: යුනිකෝඩ්
Simple English: Unicode
slovenčina: Unicode
slovenščina: Unicode
shqip: Unicode
српски / srpski: Unikod
Basa Sunda: Unicode
svenska: Unicode
తెలుగు: యూనికోడ్
тоҷикӣ: Юникод
Tagalog: Unikodigo
Türkçe: Unicode
ئۇيغۇرچە / Uyghurche: Unicode
українська: Юнікод
اردو: یونیکوڈ
Tiếng Việt: Unicode
walon: Unicôde
吴语: Unicode
მარგალური: იუნიკოდი
ייִדיש: יוניקאד
Yorùbá: Unicode
中文: Unicode
文言: 萬國碼
Bân-lâm-gú: Unicode
粵語: 統一碼