通用字元集包括了其他所有字元集。它保證了與其他字元集的雙向兼容,即,如果你將任何文本字元串翻譯到UCS格式,然後再翻譯回原編碼,你不會丟失任何信息。
UCS包含了已知語言的所有字元。除了拉丁語、希臘語、斯拉夫語、希伯來語、阿拉伯語、亞美尼亞語、喬治亞語,還包括中文、日文、韓文這樣的方塊文字,UCS還包括大量的圖形、印刷、數學、科學符號。
ISO/IEC 10646定義了一個31位的字元集。
ISO/IEC 10646-1標準第一次發表於1993年,現在的公開版本是ISO/IEC 10646-1:2000。ISO/IEC 10646-2在2001年發表。
UCS不僅給每個字元分配一個代碼,而且賦予了一個正式的名字。表示一個UCS或Unicode值的十六進制數通常在前面加上“U+”,例如“U+0041”代表字元“A”。
基本介紹
- 中文名:通用字元集
- 外文名:Universal Character Set
- 別稱:通用多八位編碼字元集
- 提出者:國際標準化組織
- 提出時間:1984年
- 套用學科:計算機