Unicode

Unicode, he̍k-chiá kiò thong-iōng-bé (通用碼), bān-kok-bé (萬國碼; Hôa-gí ho͘-im: Wanguoma) sī 1-chióng pian-bé piau-chún. Unicode ji̍t jī sī Eng-gí uni kap code 2-jī cho͘-ha̍p--khí-lâi-ê. Uni ū "thong-iōng" ê ì-sù; code sī " hû-bé" ê ì-sù. Unicode ê 1-ê tiōng-iàu ê lí-liām sī beh siat-kè 1-thò ē-sài chhú-lí sè-kài kok-chióng bûn-jī ê pian-bé.

Kán-tan kóng, thong-iōng-bé sī 1-ê kok-chè piau-chún. I ê bo̍k-piau sī kā chhú-lí sè-kài kok-chióng gí-giân ê bûn-jī ê jī-tô͘ chòe-pian-bé. Kā múi 1-ê jī-tô͘ tùi-èng kàu 1-ê chéng-sò͘. Chit-ê chéng-sò͘ kiò-chòe chit-ê jī-tô͘ ê bé-ūi. Án-ne ē-sài kā bûn-jī choán-hoà choè sò͘-jī, chiah ū-hoat-tō iōng tiān-náu chhú-lí kah pó-chûn.

Thong-iōng-bé ū chi̍t-koá ki-su̍t siōng ê hān-chè kap būn-tê. Mā-ū chi̍t-kóa phoe-phêng. M̄-koh, thong-iōng-bé chiām-chiām piàn-chòe nńg-thé kok-chè-hòa kap nńg-thé to-gí-giân khoân-kéng chit 2-hāng sū-kang siōng chú-liû ê pian-bé. Microsoft Windows NT kap āu-lâi ê Microsoft Windows 2000, Microsoft Windows XP iōng UTF-16 lâi pó-chûn hē-thóng lāi-pō͘ iōng ê bûn-jī. UNIX-lūi ê hē-thóng, chhiūⁿ Linux, BSD ( OpenBSD, FreeBSD) kap Mac OS X iōng UTF-8 lâi piáu-hiān to-gí-giân ê bûn-jī.

Khí-goân

Chá-kî tiān-náu iōng ê pian-bé chú-iàu chiam-tùi Eng-gí lâi siat-kè. Ka-na sek-ha̍p chhú-lí Eng-bûn. Āu-lâi chiām-chiām cheng-ka Au-chiu kî-tha chú-iàu gí-giân iōng ê jī-bó. M̄-koh, bô-kâng kok-ka só͘ su-iàu kap chin-ka ê jī-bó lóng bô-kâng. Kiat-kó sī chhut-hiān chin-chē bô-hoat-tō͘ sio kau-thong ê pian-bé. Iōng Hoat-gí pian-bé hē-thóng pó-chûn ê chu-liāu, nā iōng Tek-gí pian-bé hē-thóng lâi tha̍k kap chhú-lí ē têng-tâⁿ--khì. Chiam-tùi 1-chióng gí-giân ê pian-bé hē-thóng siat-kè ê nńg-thé ka-na ē-sài chhú-lí hit chióng gí-giân. Beh kā chit-ê nńg-thé kái kah ē-sài chhú-lí pa̍t chióng gí-giân sī chin hùi-khì ê tāi-chì. Beh iōng tiān-náu chhú-lí 1-chóng í-siōng ê gí-giân ē-sài kóng chin khùn-lân. Nā sī khó-lū sè-kài kî-tha ê gí-giân kap bûn-jī, chit-ê būn-tê ka-na ē lú-lâi lú siong-tiōng.

Nā-sī ū 1-thò pian-bé ē-sài chhú-lí sè-kài kok-chióng bûn-jī. Bô kâng gí-giân ê chu-liāu kau-thong tio̍h piàn kán-tan. Tông-sî chhú-lí to-gí-giân mā piàn kán-tan. Nā-sī 1-thò nńg-thé lī-iōng chit chióng pian-bé lâi siat-kè, chit-ê nńg-thé, tiō sǹg-kóng khai-sí sī chiam-tùi bó͘ 1-chóng gí-giân lâi siat-kè, mā ē-sài khah kán-tan tio̍h kái lâi chi-oān pa̍t-chóng gí-giân kap bûn-jī. Chia-ê lī-ek ē-sài kóng sī chá-kî khai-sí thui-sak thong-iōng-bé ê tōng-ki.

Beh liáu-kái thui-sak thong-iōng-bé chit-chióng pian-bé piau-chún ê tōng-ki, su-iàu seng liáu-káu siáⁿ-mi̍h sī pian-bé. Iōng Eng-gí chòe lē. Eng-gí su-iàu 26 ê tōa-siá ê jī (ABC...XYZ), 26 ê sió-siá ê jī (abc...xyz), Arabic sò͘-jī (0123456789), kap 1-kóa piau-tiám (jī). Beh iōng tiān-náu chhú-lí Eng-gí, su-iàu 1-ê tùi-chiàu-pió, chit-ê pió ka múi 1-ê jī tùi-èng 1-ê to̍k-it ê 2-chìn-ūi sò͘-jī. M̄-koh, tiòng-iàu ê sī, ta̍k-ê lâng lóng ài iōng kāng-khóan ê tùi-chiàu-pió. Án-ne ta̍k-ke chia ū hoat-tō ko͘-thong, beh ka chia-ê 2-chìn-ūi sò͘-jī hoan-e̍k tńg lâi chòe Eng-gí chiah bôe têng-tâⁿ.

ASCII

Siông-sè: ASCII

1-ê pian-bé hē-thóng ē-sài tùi-èng kàu gōa-chē ê jī-tô͘ ài khòaⁿ chit-ê pian-bé iōng kui-ê bit lâi pó-chûn pian-bé-pió. 1-ê 7-bit ê 2-chìn-ūi sò͘-jī tùi-èng ê hoàn-ûi sī àn 0 kàu 2^7-1=127(thak chòe 2 ê 7 chhù-hong). So-í, 1-ê 7-bit ê pian-bé ē-sài siōng-chē tùi-èng kàu 128 ê jī-tô͘. Kāng-khoán ê tō-lí, 1-ê 8-bit ê pian-bé ē-sài tùi-èng kàu 256 ê jī-tô͘. 1-ê 16 bit ê pian-bé ē-sài tùi-èng kàu ??? ê jī-tô͘. Iōng lú-chē bit ê pian-bé ē-sài tùi-èng kàu lú-chē ê jī-tô͘, m̄-koh, beh pó-chûn 1-ê jī su-iàu ê RAM mā lú-chē.

Chá-kî ê tiān-náu, RAM sī chin tin-kùi ê chu-goân. In-ùi án-ne, ta̍k-ke ē iōng sè ê pian-bé. Chhú-lí Eng-gí ê sī, sǹg-sǹg 7-bit ê pian-bé tio̍h ū-kàu. Che chò-sêng 7-bit ê ASCII pian-bé piau-chú. M̄-koh, kî-thaⁿ iōng lô-má-jī bûn-jī hē-thóng ê Europe gí-gian, chia-chia sū-iàu 1-koa ū ka phiat-im hū-ho ê jī, chhiūⁿ 'å', he̍k-chiá-sī 1-koá liân-jī, chhiūⁿ 'œ'. Chia-ê jī(jī-tô͘) bô pau-koah tī ASCII pian-bé. Europe kok-ka, khai-sí chè-têng 8-bit ê pian-bé. Chia-ê 8-bit pian-bé, tùi 0 kàu 128 ê bé-ūi kap ASCII oân-choân sio-siâng.

Other Languages
Afrikaans: Unicode
Alemannisch: Unicode
አማርኛ: ዩኒኮድ
العربية: يونيكود
অসমীয়া: ইউনিক’ড
azərbaycanca: Unicode
Boarisch: Unicode
беларуская: Унікод
беларуская (тарашкевіца)‎: Юнікод
български: Уникод
বাংলা: ইউনিকোড
brezhoneg: Unicode
bosanski: Unicode
català: Unicode
ᏣᎳᎩ: ᏳᏂᎪᏛ
کوردی: یوونیکۆد
čeština: Unicode
Чӑвашла: Юникод
Cymraeg: Unicode
dansk: Unicode
Deutsch: Unicode
Ελληνικά: Γιούνικοντ
English: Unicode
Esperanto: Unikodo
español: Unicode
eesti: Unicode
euskara: Unicode
فارسی: یونی‌کد
suomi: Unicode
français: Unicode
Gaeilge: Unicode
galego: Unicode
ગુજરાતી: યુનિકોડ
עברית: יוניקוד
हिन्दी: यूनिकोड
hrvatski: Unikod
magyar: Unicode
Հայերեն: Յունիկոդ
interlingua: Unicode
Bahasa Indonesia: Unicode
Ilokano: Unicode
íslenska: Unicode
italiano: Unicode
日本語: Unicode
Basa Jawa: Unicode
ქართული: უნიკოდი
қазақша: Юникод
ಕನ್ನಡ: ಯುನಿಕೋಡ್
한국어: 유니코드
कॉशुर / کٲشُر: यूनिकोड
Kurdî: Unicode
Кыргызча: Юникод
lietuvių: Unikodas
latviešu: Unikods
олык марий: Unicode
മലയാളം: യൂണികോഡ്
монгол: Юникод
मराठी: युनिकोड
Bahasa Melayu: Unicode
မြန်မာဘာသာ: ယူနီကုဒ်
Plattdüütsch: Unicode
नेपाली: युनिकोड
नेपाल भाषा: युनिकोड
Nederlands: Unicode
norsk nynorsk: Unicode
norsk: Unicode
occitan: Unicode
ਪੰਜਾਬੀ: ਯੂਨੀਕੋਡ
polski: Unikod
português: Unicode
română: Unicode
русский: Юникод
संस्कृतम्: युनिकोड
саха тыла: Юникод
Scots: Unicode
srpskohrvatski / српскохрватски: Unikod
සිංහල: යුනිකෝඩ්
Simple English: Unicode
slovenčina: Unicode
slovenščina: Unicode
shqip: Unicode
српски / srpski: Unikod
Basa Sunda: Unicode
svenska: Unicode
తెలుగు: యూనికోడ్
тоҷикӣ: Юникод
Tagalog: Unikodigo
Türkçe: Unicode
ئۇيغۇرچە / Uyghurche: Unicode
українська: Юнікод
اردو: یونیکوڈ
Tiếng Việt: Unicode
walon: Unicôde
吴语: Unicode
მარგალური: იუნიკოდი
ייִדיש: יוניקאד
Yorùbá: Unicode
中文: Unicode
粵語: 統一碼