字元

字元

在計算機和電信技術中,一個字元是一個單位的字形、類字形單位或符號的基本信息。

基本介紹

  • 中文名:字元
  • 外文名:Character
  • 套用:計算機和電信技術
  • 定義:類字形單位或符號的基本信息
  • 英文字母:1個位元組
含義,表達,作用,

含義

字元是指計算機中使用的字母、數字符號,包括:1、2、3、A、B、C、~!·#¥%……—*()——+等等。在 ASCII 編碼中,一個英文字母字元存儲需要1個位元組。在 GB 2312 編碼或 GBK 編碼中,一個漢字字元存儲需要2個位元組。在UTF-8編碼中,一個英文字母字元存儲需要1個位元組,一個漢字字元儲存需要3到4個位元組。在UTF-16編碼中,一個英文字母字元或一個漢字字元存儲都需要2個位元組(Unicode擴展區的一些漢字存儲需要4個位元組)。在UTF-32編碼中,世界上任何字元的存儲都需要4個位元組。

表達

字元是可使用多種不同字元方案或代碼頁來表示的抽象實體。例如,Unicode UTF-16 編碼將字元表示為 16 位整數序列,而 Unicode UTF-8 編碼則將相同的字元表示為 8 位位元組序列。微軟的公共語言運行庫使用 Unicode UTF-16(Unicode 轉換格式,16 位編碼形式)表示字元。

作用

針對微軟公共語言運行庫應用程式使用編碼將字元表示形式從本機字元方案映射至其他方案。應用程式使用解碼將字元從非本機方案映射至本機方案。
電腦和通訊設備會使用字元編碼的方式來表達字元。意思是會將一個字元指定給某個東西。傳統上,是代表整數量的位元序列,如此,則可透過網路來傳輸,同時亦便於儲存。兩個常用的例子是ASCII和用於統一碼的UTF-8。根據谷歌的統計,UTF-8是目前最常用於網頁的編碼方式。相較於大部分的字元編碼把字元對應到數字或位元串,摩斯密碼則是使用不定長度的電子脈衝的序列來表現字元。

相關詞條

熱門詞條

聯絡我們