યુનિકોડ


યુનિકોડ મુદ્રા


યુનિકોડ સતત સંકેતો, રજૂઆત અને વિશ્વના લેખન સિસ્ટમો મોટા ભાગના વ્યક્ત લખાણ સંભાળવા માટે કોમ્પ્યુટીંગ ઉદ્યોગ મૂળભૂત છે. યુનિવર્સલ કેરેક્ટર સેટ સાથે સંકલ્પના પ્રમાણભૂત અને યુનિકોડ સ્ટાન્ડર્ડ તરીકે પુસ્તક સ્વરૂપે પ્રકાશિત, યુનિકોડ ની તાજેતરની આવૃત્તિ 109.000 કરતાં વધુ 93 સ્ક્રિપ્ટો આવરી અક્ષરો એક તરીકેનું, દ્રશ્ય સંદર્ભ, એક એન્કોડિંગ પદ્ધતિ અને કોડ ચાર્ટમાં સમૂહ સમાવે છે પ્રમાણભૂત અક્ષર એન્કોડીંગ્સ, ઉપલા અને નીચલા કિસ્સામાં, સંદર્ભ માહિતી કમ્પ્યુટર ફાઈલોની સેટ, અને પાત્ર ગુણધર્મો નાર્મલાઝેશન માટે નિયમો, વિઘટન, સરખામણી, રેન્ડરીંગ અને દ્રીમાર્ગી જેમ કે સંબંધિત વસ્તુઓ, સંખ્યા, જેમ કે પાત્ર ગુણધર્મો એક ગણતરી સમૂહ પ્રદર્શન ક્રમ (લખાણ યોગ્ય પ્રદર્શન અરબી અને હીબ્રૂ, જેમ કે બંને અધિકાર-થી-ડાબી સ્ક્રિપ્ટો, અને ડાબી-થી-અધિકાર સ્ક્રિપ્ટો સમાવતી માટે). [1] 2011 માં, એકદમ યુનિકોડ મુખ્ય આવૃત્તિ 6.0 યુનિકોડ છે . યુનિકોડ કોન્સોર્ટિયમ, તો બિનનફાકારક સંસ્થા કે યુનિકોડ વિકાસ કોઓર્ડિનેટ્સ, આખરે યુનિકોડ અને તેના સ્ટાન્ડર્ડ યુનિકોડ ટ્રાન્સફોર્મેશન (UTF) બંધારણ યોજનાઓ છે, કારણ કે હાલની યોજનાઓ ઘણા કદ અને અવકાશ મર્યાદિત છે હાલની અક્ષર માટેના સંકેતો યોજનાઓ બદલી ના મહત્વાકાંક્ષી ધ્યેય છે અને છે બહુભાષી પર્યાવરણો સાથે સુસંગત. Unifying અક્ષર સમૂહો પર માતાનો યુનિકોડ સફળતા અને કોમ્પ્યુટર સોફ્ટવેર આંતરરાષ્ટ્રિયકરણ સ્થાનિકીકરણ તેની વ્યાપક અને આગવા ઉપયોગ તરફ દોરી જાય છે. પ્રમાણભૂત XML, જાવા પ્રોગ્રામીંગ ભાષા, Microsoft નેટ. ફ્રેમવર્ક અને આધુનિક ઓપરેટિંગ સિસ્ટમો ઘણી તાજેતરના ટેકનોલોજી છે, અમલીકરણ કરી દેવામાં આવ્યુ છે. યુનિકોડ વિવિધ પાત્ર એન્કોડીંગ્સ દ્વારા અમલમાં કરી શકાય છે. સૌથી સામાન્ય રીતે વાપરવામાં એન્કોડીંગ્સ UTF-8 છે (જે ASCII અક્ષરો છે, કે જે બંને UTF-8 અને ASCII સંકેતો, અને અન્ય અક્ષરો માટે ચાર બાઈટમાં જ કોડ કિંમતો માટે એક બાઈટ વાપરે છે), હવે-કાલગ્રસ્ત UCS- 2 (કે જે દરેક અક્ષર માટે બે બાઇટ્સ વાપરે છે પરંતુ તે વર્તમાન યુનિકોડ સ્ટાન્ડર્ડ દરેક પાત્ર સાંકેતિક લિપિમાં સંદેશ કરી શકો છો), અને UTF-16 (કે જે UCS-2 વિસ્તારે માટે UCS-2 તક બહાર કોડ પોઈન્ટ નિયંત્રિત).

મૂળ વંશજ અને વિકાસ

યુનિકોડ ISO 8859 પ્રમાણભૂત છે, કે જે વિશ્વના વિવિધ દેશોમાં વ્યાપી વપરાશ શોધવા દ્વારા વ્યાખ્યાયિત તે, જેમ કે પરંપરાગત પાત્ર એન્કોડીંગ્સ, મર્યાદાઓ transcending ની સ્પષ્ટ હેતુ છે, પરંતુ મોટે ભાગે એકબીજા સાથે સુસંગત રહે છે. ઘણા પરંપરાગત પાત્ર એન્કોડીંગ્સ એ સામાન્ય સમસ્યા છે કે તેઓ દ્વિભાષી કોમ્પ્યુટર (સામાન્ય રીતે લેટિન પાત્રો અને સ્થાનિક સ્ક્રિપ્ટ મદદથી) પ્રક્રિયા છે, પરંતુ કોમ્પ્યુટર (આર્બીટરી એકબીજા સાથે મિશ્રિત સ્ક્રિપ્ટો કમ્પ્યુટર પ્રોસેસિંગ) બહુભાષી નથી પ્રક્રિયા માટે પરવાનગી આપે છે શેર કરે છે. યુનિકોડ, ઉદ્દેશ છે, અક્ષરો-graphemes નીચે અને આવા અક્ષરો માટે ચલ ગ્લાયફ્સ (રેન્ડરીંગ) કરતા એકમો-બદલે ગ્રાફિમ જેવા encodes. ચિની અક્ષરો કિસ્સામાં, આ ક્યારેક તેના ચલ ગ્લાયફ્સ (હેન એકીકરણ જુઓ) પાસેથી નીચે અક્ષર વિશિષ્ટ પર વિવાદો પરિણમે છે. લખાણ પર પ્રક્રિયા માં, યુનિકોડ એક અનન્ય કોડ બિંદુ-સંખ્યા પૂરી પાડે છે ભૂમિકા લે છે, glyph માટે નથી દરેક પાત્રને. બીજા શબ્દોમાં કહીએ તો, યુનિકોડ એક અમૂર્ત રીતે એક પાત્ર રજૂ કરે છે અને અન્ય સોફ્ટવેર દ્રશ્ય (કદ, આકાર, ફોન્ટ, અથવા શૈલી) વેબ બ્રાઉઝર અથવા વર્ડ પ્રોસેસર, જેમ કે રેન્ડરીંગ, નહીં. આ સરળ હેતુ જટિલ બને છે, જોકે યુનિકોડ વધુ ઝડપી દત્તક પ્રોત્સાહન ના આશા માં યુનિકોડ ડિઝાઇનરો દ્વારા કરવામાં રાહતો કારણે. પ્રથમ 256 કોડ પોઈન્ટ 8859-1 ISO ની સામગ્રી, જેથી તે હાલના પશ્ચિમી લખાણ કન્વર્ટ તુચ્છ કરવા સરખા કરવામાં આવી હતી. ઘણા જરૂરી-સરખા અક્ષરો વિવિધ કોડ પોઈન્ટ ઘણી વખત એનકોડ હતા લીગસી એન્કોડીંગ્સ છે અને તેથી દ્વારા વાપરવામાં તફાવત સાચવી કોઈપણ માહિતી ખોયા વિના તે એન્કોડીંગ્સ થી યુનિકોડ (અને પાછા) રૂપાંતરણ પરવાનગી આપે છે. ઉદાહરણ તરીકે, કોડ પોઈન્ટ "Fullwidth ફોર્મ" વિભાગ સંપૂર્ણ લેટિન મૂળાક્ષર છે કે જે મુખ્ય લેટિન મૂળાક્ષર વિભાગ અલગ છે સમાવે છે. ચિની, જાપાની, અને કોરિયાઈ ફોન્ટ્સ (CJK), આ અક્ષરો CJK આઇડિયોગ્રાફ્સ જ પહોળાઈ પર રેન્ડર કરવામાં આવે છે અડધા પહોળાઈ પર જગ્યાએ. અન્ય ઉદાહરણો માટે, યુનિકોડ પાત્રો નકલી જુઓ.

Other Languages
Afrikaans: Unicode
Alemannisch: Unicode
አማርኛ: ዩኒኮድ
العربية: يونيكود
অসমীয়া: ইউনিক’ড
asturianu: Unicode
azərbaycanca: Unicode
Boarisch: Unicode
беларуская: Унікод
беларуская (тарашкевіца)‎: Юнікод
български: Уникод
বাংলা: ইউনিকোড
brezhoneg: Unicode
bosanski: Unicode
català: Unicode
ᏣᎳᎩ: ᏳᏂᎪᏛ
کوردی: یوونیکۆد
čeština: Unicode
Чӑвашла: Юникод
Cymraeg: Unicode
dansk: Unicode
Deutsch: Unicode
Ελληνικά: Γιούνικοντ
English: Unicode
Esperanto: Unikodo
español: Unicode
eesti: Unicode
euskara: Unicode
فارسی: یونی‌کد
suomi: Unicode
français: Unicode
Gaeilge: Unicode
galego: Unicode
עברית: יוניקוד
हिन्दी: यूनिकोड
hrvatski: Unikod
magyar: Unicode
Հայերեն: Յունիկոդ
interlingua: Unicode
Bahasa Indonesia: Unicode
Ilokano: Unicode
íslenska: Unicode
italiano: Unicode
日本語: Unicode
Basa Jawa: Unicode
ქართული: უნიკოდი
қазақша: Юникод
ಕನ್ನಡ: ಯುನಿಕೋಡ್
한국어: 유니코드
कॉशुर / کٲشُر: यूनिकोड
Kurdî: Unicode
Кыргызча: Юникод
lietuvių: Unikodas
latviešu: Unikods
олык марий: Unicode
മലയാളം: യൂണികോഡ്
монгол: Юникод
मराठी: युनिकोड
Bahasa Melayu: Unicode
မြန်မာဘာသာ: ယူနီကုဒ်
Plattdüütsch: Unicode
नेपाली: युनिकोड
नेपाल भाषा: युनिकोड
Nederlands: Unicode
norsk nynorsk: Unicode
norsk: Unicode
occitan: Unicode
ਪੰਜਾਬੀ: ਯੂਨੀਕੋਡ
polski: Unikod
português: Unicode
română: Unicode
русский: Юникод
संस्कृतम्: युनिकोड
саха тыла: Юникод
Scots: Unicode
srpskohrvatski / српскохрватски: Unikod
සිංහල: යුනිකෝඩ්
Simple English: Unicode
slovenčina: Unicode
slovenščina: Unicode
shqip: Unicode
српски / srpski: Unikod
Basa Sunda: Unicode
svenska: Unicode
తెలుగు: యూనికోడ్
тоҷикӣ: Юникод
Tagalog: Unikodigo
Türkçe: Unicode
ئۇيغۇرچە / Uyghurche: Unicode
українська: Юнікод
اردو: یونیکوڈ
Tiếng Việt: Unicode
walon: Unicôde
吴语: Unicode
მარგალური: იუნიკოდი
ייִדיש: יוניקאד
Yorùbá: Unicode
中文: Unicode
Bân-lâm-gú: Unicode
粵語: 統一碼