私人使用區

私人使用區

在Unicode中, 私人使用區指其解釋未在Unicode標準中指定,而是由合作用戶之間的私人協定決定其用途的一系列碼位。Unicode定義了三個私人使用區:一個在基本多文種平面(U+E000-U+F8FF)中,另外兩個幾乎包含了整個第15和第16平面(分別為U+F0000-U+FFFFD,U+100000-U+10FFFD)。

私人使用區字元的分配,可不由字面意義上的私人決定;一些組織已經發布了一些分配計畫。但根據其定義,私人使用區相同的代碼點可被分配為不同的字元,因此用戶可能因安裝了某種字型,看到其顯示為一種形態,但使用了其他字型的用戶可能看到完全不同的字元。

基本介紹

  • 中文名:私人使用區
  • 外文名:Private Use Areas
  • 所屬學科IT
  • 中文簡稱:私用區
  • 外文縮寫:PUA
使用實例,處理規則,編碼分配,

使用實例

中國國家標準GB/T 20542-2006(“藏文編碼字元集擴展A”)和GB / T 22238-2008(“藏文編碼字元集擴展B”)使用私人使用區存放藏文連字。
GB18030GBK使用私人使用區臨時編碼Unicode標準之外的字元
愛沙尼亞語言研究院使用私人使用區編碼Unicode標準未收錄的拉丁字母西里爾字母
機讀編目格式標準MARC 21使用私人使用區編碼未被Unicode收錄的東亞字元。
美國國際語言暑期學院使用私人使用區編碼Unicode標準未收錄的語言中的字元。

處理規則

私人使用區的訂定只是權宜之計,讓尚無統一碼標準之前的字元可以臨時使用。若日後被官方正式收錄,那該從補充字應被剔除,移入正式字區。空下的碼位被回收利用,再定義為其他新的補充字。因此每次新統一碼標準發布後,都應該立即檢查一次補充字,將已正式編碼的字進行遷碼處理。
例:【】曾經使用U+E863編碼,在Unicode 3.0正式收錄為U+4DAE後,則U+E863則不應繼續使用。

編碼分配

BMP PUA
編碼範圍
U+E000...U+F8FF
平面
基本多文種平面(BMP
字元
未知
分配
6400 個碼位
未分配
0 個保留碼位
Unicode 1.0.0
5,632 (+5,632)
Unicode 1.0.1
6,400 (+768)
說明
Unicode 1.0.0使用編碼U+E800-U+FDFF
該區段分為兩個子區段:公司用途子區段,從U+F8FF位置開始往小的編碼;終端用戶子區段,從U+E000位置開始符號位置往大的編碼。這只是一般約定,兩個子區段只有私有約定的分割點。
Supplementary PUA-A
編碼範圍
U+F0000...U+FFFFD
平面
第15輔助平面
字元
未知
分配
65534 個碼位
Unicode 2.0
65,534 (+65,534)
注意
Supplementary PUA-B
編碼範圍
U+100000...U+10FFFD
平面
第16輔助平面
字元
未知
分配
65534 個碼位
Unicode 2.0
65,534 (+65,534)
注意

相關詞條

熱門詞條

聯絡我們