字元(Character)是各種文字和符號的總稱,包括各國家文字、標點符號、圖形符號、數字等。當在表達式中輸入字母時,它們會在同一序列中與對應的字母匹配,我們可以輸入任何字母或者數字,以及某些標點符號。
基本介紹
- 中文名:標準字元
- 外文名:normal character;standard character
- 拼音:biāo zhǔn zì fú
- 輸入輸出函式:getchar()和putchar()
- 相關名詞:非標準字元
- 套用學科:計算機原理術語
字元(Character)是各種文字和符號的總稱,包括各國家文字、標點符號、圖形符號、數字等。當在表達式中輸入字母時,它們會在同一序列中與對應的字母匹配,我們可以輸入任何字母或者數字,以及某些標點符號。
字元(Character)是各種文字和符號的總稱,包括各國家文字、標點符號、圖形符號、數字等。當在表達式中輸入字母時,它們會在同一序列中與對應的字母匹配,我們可以輸入任何字母或者數字,以及某些標點符號。標準字元輸入輸出函...
GB2312又稱為GB2312-80字元集,全稱為《信息交換用漢字編碼字元集·基本集》,由原中國國家標準總局發布,1981年5月1日實施。特點 GB2312是中國國家標準的簡體中文字元集。它所收錄的漢字已經覆蓋99.75%的使用頻率,基本滿足了漢字的...
編碼是用預先規定的方法將文字、數字或其它對象編成數碼,或將信息、數據轉換成規定的電脈衝信號。為保證編碼的正確性,編碼要規範化、標準化,即需有標準的編碼格式。常見的編碼格式有ASCII、ANSI、GBK、GB2312、UTF-8、GB18030和...
為使計算機支持更多語言,通常使用 0x80~0xFFFF 範圍的 2 個位元組來表示 1 個字元。比如:漢字 '中' 在中文作業系統中,使用 [0xD6,0xD0] 這兩個位元組存儲。不同的國家和地區制定了不同的標準,由此產生了 GB2312、GBK、GB18030...
漢字編碼國家標準,分為雙位元組部分和四位元組部分;雙位元組部分和GBK基本完全相同。四位元組部分,比GBK多了6582個漢字(27484-20902)。現有漢字編碼 GB 2312-1980(信息交換用漢字編碼字元集 基本集)GBK-1995(漢字內碼擴展規範)GB13000.1-...
通用多八位編碼字元集(Universal Multiple-Octet Coded Character Set)也叫通用字元集(Universal Character Set, UCS),是由ISO制定的ISO 10646(或稱ISO/IEC 10646)標準所定義的標準字元集。簡介 通用多八位編碼字元集包括了其他所有...
標識符含有字母和數字的個數稱為標識符的長度,它的長度在具體的實現系統中一般都有限制,標準Pascal將標識符的有限長度限定在8個字元以內。在Turbo Pascal中,一個標識符的長度由行的長度127個字元所限制,但只有前63個字元有效,其中...
ASCII碼劃分為兩個集合:128個字元的標準ASCII碼和附加的128個字元的擴充和ASCII碼。比較EBCDIC。其中95個字元可以顯示。另外33個不可以顯示。 標準ASCII碼為7位,擴充為8位。目前使用最廣泛的西文字元集及其編碼是 ASCII 字元集和 ASCII...
《GB13000.1字元集漢字字序(筆畫序)規範》:GB13000.1字元集是指國家標準漢字編碼字元集,共20902個漢字。《GB13000.1字元集漢字字序(筆畫序)規範》由國家語委1999年10月1日發布、2000年1月1日實施,編號為GF3003-1999。它是按...
“GB”在計算機領域中常常表示GB 2312-80或GB 18030-2005。兩者是漢語編碼系統的標準,在中國大陸和新加坡用於簡體中文。常用編碼集 國家漢字標準代碼 較常見的國家漢字標準代碼列表 GB 2312 - 80 信息交換用漢字編碼字元集 基本集(又...
但隨著Web的廣泛套用,尤其是近年來支持多語言(如中、英、日)的套用已成為大勢所趨。這些國家標準字元集編碼也出現了範圍重疊、相互間的信息交換比較困難的情況,造成軟體各個本地化版本的維護成本較高,基於不同環境的程式編寫越來越複雜...
Unicode 標準為每個常規類別分配一個字元。例如,特定字元可以是大寫字母(由 Lu 類別表示),十進制數字(Nd 類別)、數學符號(Sm 類別)或段落分隔設定(Zl 類別)。Unicode 標準中的特定字元集也占據連續碼位的特定區域或塊。例如,可...
《信息交換用漢字編碼字元集》是由中國國家標準總局1980年發布,1981年5月1日開始實施的一套國家標準,標準號是GB/T 2312-1980。根據2017年第7號公告和強制性標準整合精簡結論,自2017年3月23日起,該標準轉化為推薦性標準,不再強制執行...
UTF,是Unicode Transformation Format的縮寫,意為Unicode轉換格式。其中,UTF-8是UTF中最常用的轉換格式,是UNICODE的一種變長字元編碼,由Ken Thompson於1992年創建。現在已經標準化為RFC 3629。UTF-8用1到6個位元組編碼UNICODE字元。簡介...
ISO-8859-1標準中0x80-0xFF為控制字元。ISO-8895-15去除了0x80-0xFF中的控制字元,在0x80-0xFF加入了œ、Œ、Ÿ 、Š、š、Ž、ž等字母和歐元(€)、單引號(‘’)、雙引號(“”)、斜體f(ƒ)、省略號(...
計算機只識別由0、1組成的代碼,ASCII碼是英文信息處理的標準編碼,漢字信息處理也必須有一個統一的標準編碼。我國國家標準局於1981年5月頒布了《信息交換用漢字編碼字元集——基本集》,代號為GB2312-80,共對6763個漢字和682個圖形字元...
nchar 是Unicode字元數據類型。Unicode字元數據類型包括Nchar、Nvarchar、Ntext三種。相關類型 ①、Nchar:其定義形式為Nchar(n)。它與Char數據類型類似,不同的是Nchar數據類型n的取值為1~4000。Nchar數據類型採用Unicode標準字元集,Unicode...
Unicode 標準在基本平面上與GB 13000保持一致。採納UTF-16方案作為未來實現01到0F共15個輔助平面的方式。其它方面與GB 13000基本一致。簡介 GB13000.1-1993的字元集包含20902個漢字。此標準由中華人民共和國信息產業部提出;此標準由信息...
全形指一個字元占用兩個標準字元位置的狀態。漢字字元和規定了全形的英文字元及國標GB2312-80中的圖形符號和特殊字元都是全形字元。一般的系統命令是不用全形字元的,只是在作文字處理時才會使用全形字元。簡要 中文:全形 拼音:quán ji...
標準ASCII碼,通常也稱7位代碼,由7位二進制碼組成,最高位為0,其範圍用二進制表示為00000000~01111111,用十進制表示為0~127,共128種,每一個編碼代表一個基本符號,也就是說,使用ASCII碼可以表示最多128個基本符號。
國際音標(英語:International Phonetic Alphabet,縮寫:IPA),早期又稱“萬國音標”,是一套用來標音的系統,以拉丁字母為基礎,由國際語音學學會設計來作為口語聲音的標準化標示方法。國際音標的使用者有語言學家、言語治療學家、外語教師、歌...
英語可用7位編碼儲存,而其他使用拉丁字母、希臘字母、西里爾字母、希伯來字母等的語文,由於只使用數十個字母,傳統上均使用8位編碼的ISO/IEC 8859標準來表示。但由於漢語、日語及朝鮮語字數眾多,無法用單一個8位字元來表達,故需要多於一...
此外還有一個帶斜線的下方變形字元:“⁁”(CARET INSERTION POINT,U+2041)。^ 特殊符號,標準鍵盤中位於數字6上方,可用英文輸入法Shift+6打出。ASCII碼值0x5E(16進制)=94(10進制)數學符號 “^”是一個用來表示第三級運算的...
正在制定《信息交換用漢字編碼字元集輔助集》,以滿足少數用字量超過基本集的用戶和台灣、香港等地的需要。字元集 ① GB2312-80字元集,中文名國家標準字元集(GB=GuóBiāo國標)。收入漢字6763個,符號715個,總計7478個字元,這是...
字母編碼是把字元集中的字母為指定集合中某一對象(例如:比特模式、自然數序列、8位組或者電脈衝),以便文本在計算機中存儲和通過通信網路的傳遞。編碼簡介 在顯示器上看見的文字、圖片等信息在電腦裡面其實並不是我們看見的樣子,即使...
標準的Base64並不適合直接放在URL里傳輸,因為URL編碼器會把標準Base64中的“/”和“+”字元變為形如“%XX”的形式,而這些“%”號在存入資料庫時還需要再進行轉換,因為ANSI SQL中已將“%”號用作通配符。為解決此問題,可採用一...
●可表示高密度數據和字元串;●每個字元由3個條、3個空、11個單元構成,字元串可變長;●符號內含校驗碼;●有三種不同的版本:A(數字、大寫字母、控制字元)B(數字、大小字母、字元)C(雙位數字)CODE128A:標準數字和大寫字母,...