www.lilicat.com

Kaleidoscope

Un site utilisant WordPress

有關漢字編碼專有名詞

1 Sep 2009

專有名詞介紹

* 內碼(Internal Code)
電腦系統或其應用程式所使用的碼,侷限在該系統或該程式使用,會隨系統之不同而異。

* 交換碼(Interchange Code)
不同系統間通訊或作資料交換所使用的碼。

* 字集(Characters Set)
由不同字元所組合成之有限集合,它們係一完整且已被認同的字元集。一般均採用已具共識地相同字集,再依不同需求訂定不同的字碼;例如:BIG5、EUC碼都採用CNS 11643中文標準交換碼的字集。

* CNS 11643
中文標準交換碼(Chinese National Standard Code),於民國75年8月4日公布為國家標準。為二位元組(byte)之編碼,編碼區共十六個字面,各字面字集之排列,以使用頻率為序,字集及字體係以教育部〈國字標準字體表〉為基準。

* Big5
指PC系統五大模組,即:系統公用程式、字的組成、狀態列設定、字形及列印設定等模組。1985年制定,為二位元組(byte)編碼,目前PC系統中,Windows95/98/ME內碼即為BIG5碼,共編13,053個字。

* EUC
UNIX作業系統上使用的內碼(Extend Unix Code,簡稱EUC),為四位元組(byte)編碼,編碼區間龐大,足以容納全國人民戶籍登記的姓名用字,故內政部以之做為全國戶役政作業的中文內碼。

* Unicode
Universal Code;簡稱Unicode,由美國萬國碼制訂委員會於1988-1991年間訂定,故亦稱萬國碼,目前已成為ISO認證之標準,故字集與ISO 10646完全相容;是目前個人電腦(PC)中,WindowsNT/2000/XP的內碼。

* GBK
大陸的漢字編碼標準,GB 即“國標”,K 是“擴展”的漢語拼音第一個字母。全稱《漢字內碼擴展規範》(GBK),英文名稱 Chinese Internal Code Specification。

* ISO 10646
Universal Multiple-Octet Coded Character Set (簡稱 UCS,廣用多八位元組編碼字元集),為國際標準化組織ISO所編的全球文字碼標準,與Unicode組織的Unicode編碼完全相容,是一個包括世界上各種語言的書面形式以及附加符號的編碼體系。

* 字形(Glyph)
字元表現的形態,也就是以電腦能懂的方式,將字的形體表現在週邊設備上。例如:DOS多使用點矩陣字形,視窗環境則多使用向量外框字形

* 自造字(User Fonts)
電腦基本字集以外的字,不論是使用造字程式造的字,還是自字庫下載的字,均稱為自造字。

* 位元組(Byte)
是電腦儲存資料的基本單位,由於位元只有0或1兩種,故電腦是以「二進制」運算。一個位元組等於8個位元,而電腦中一個英文字母或數字是由8個位元所組成的,例:01000001代表’A’,01000010代表’B’等,所以如果儲存的資料是100個位元組,便相當於100個英文字母或數字的資料。中文字的編碼較為繁複,故通常以兩至三個位元組來代表一個中文字(例:Big5碼)。

* RGB
為Red(紅)、Green(綠)、Blue(藍)的縮寫,是光的三原色,在電腦顯示的色彩中,就是利用這三原色來混和出各種顏色。如果紅色、綠色和藍色都可以產生256種變化,那麼組合起來就有256×256×256=16,777,216種色彩,這就是目前電腦最接近自然界的色彩數目,也就是所謂的「全彩」(Full Color)。設定成全彩之後,每個顏色需要8×3=24個位元,也就是3個位元組來儲存。

* 機關團體
有二台以上電腦的機關、學校、公司、企業。

* 一般使用者
不屬於「機關團體」的單機使用者。

* 自造字管理者(造字Server端)
機關團體內負責集中管理電腦自造字的人。

* 使用端(Client端)
機關團體「自造字管理者」以外的電腦使用者。

* 共用字集
機關團體內共同使用的自造字檔。

* 罕用字檔
自造或購買的自造字檔。

* 外字檔
向廠商購買的自造字檔,或他人所提供的自造字檔。


Copyright © 2018 Kaleidoscope
CMS par WordPress et conçu par Lilicat