民族文字編碼字元集(national characters subset of unicode)是2018年全國科學技術名詞審定委員會公布的計算機科學技術名詞。
基本介紹
- 中文名:民族文字編碼字元集
- 外文名:national characters subset of unicode
- 所屬學科:計算機科學技術
- 公布時間:2018年
民族文字編碼字元集(national characters subset of unicode)是2018年全國科學技術名詞審定委員會公布的計算機科學技術名詞。
民族文字編碼字元集(national characters subset of unicode)是2018年全國科學技術名詞審定委員會公布的計算機科學技術名詞。定義在Unicode4.0國際標準中,我國少數民族文字的編碼...
民族文字字元編碼(national characters encoding)是2018年全國科學技術名詞審定委員會公布的計算機科學技術名詞,出自《計算機科學技術名詞 》第三版。定義 我國各少數民族文字字元和符號編碼的總稱。包括民族文字字元、標點符號、圖形符號、數字等。目前UnicodeISO/IEC10646-1:2000中已收入中國少數民族編碼字元集包括蒙古(...
GB2312又稱為GB2312-80字元集,全稱為《信息交換用漢字編碼字元集·基本集》,由原中國國家標準總局發布,1981年5月1日實施。特點 GB2312是中國國家標準的簡體中文字元集。它所收錄的漢字已經覆蓋99.75%的使用頻率,基本滿足了漢字的計算機處理需要。在中國大陸和新加坡獲廣泛使用。包含內容 GB2312收錄簡化漢字及一般...
《信息技術中文編碼字元集》是中文信息技術領域最重要的基礎性標準,對漢字和中國多種少數民族文字進行了統一編碼,需要進行中文處理的信息系統均需套用此類編碼標準,因此標準實施場景豐富、套用範圍廣泛。2022年7月28日,《信息技術 中文編碼字元集》強制性國家標準發布,於2023年8月1日正式實施。新國標共收錄漢字87887...
GB18030編碼向下兼容GBK和GB2312,兼容的含義是不僅字元兼容,而且相同字元的編碼也相同。GB18030收錄了所有Unicode3.1中的字元,包括中國少數民族字元,GBK不支持的韓文字元等等,也可以說是世界大多民族的文字符號都被收錄在內。GBK和GB2312都是雙位元組等寬編碼,如果算上和ASCII兼容所支持的單位元組,也可以理解為是單...
景永時主持研製的西夏文字元集,被國際標準組織和國際電工委員會(ISO/IEC)所屬專業組織選定為《信息技術通用多八位編碼字元集(UCS)》(中國國家標準號為GB13000)之西夏文編碼字元集,從而取代了此前由美國學者用日本文字境研究會製作的西夏文字元集的提案,避免了中國少數民族文字字元採用外國人製作的字元編碼的...
這些研究成果的完成、推出都為相應民族語言文字信息處理技術的發展奠定了一個堅實的基礎。而且,這些科研成果已相關領域得到廣泛套用,為民族語文工作的現代化、信息化的全面開展提供了強有力的技術支撐。3、科研成果獲省部級及以上獎項 (1)《信息交換用彝文編碼字元集》,獲四川省人民政府第六次哲學社會科學優秀科研...
更何況,與某些具有特定專業知識門檻的行業領域不同,漢語言文化屬於基礎性知識類別,加之其天然的大眾屬性、民族屬性,其引起大範圍、激烈的民間情緒反彈,實為必然。整形背後 而44個“整形”漢字背後,其實還透射著有關文化闡釋權、文化話語權之爭。不無巧合的是,縱觀漢字的衍變發展過程,同樣可以看到這一布迪厄所說...
8.藏文編碼、點陣字型和鍵盤布局三項國家標準,項目負責人:於洪志 1997年獲西藏語委“榮譽獎”9.《統一平台上少數民族文字(藏維哈柯朝)文檔識別系統》項目負責人:於洪志 獲2005年中國電子學會電子信息科學二等獎,KJ2005-2-05 10.《基於網路環境的藏文音節保護、線上輸入和網頁內容管理》項目負責人:於洪...
第2章 藏文字元特點、編碼及輸入法 2.1 藏文起源及發展 2.2 藏文文字性質 2.3 藏文輔音字母及元音 2.3.1 藏文中的梵文 2.3.2 藏文拼寫規則 2.3.3 相關研究工作 2.4 藏文字元編碼 2.4.1 字元集與字元編碼的基礎知識 2.4.2 藏文編碼標準化進程 2.4.3 藏文字元編碼技術 2.4.4 ...
該軟體是依據國家標準《信息技術信息交換用漢字編碼字元集基本集的擴充》(GB18030-2000)而研究成功的,字型檔容量大,辭彙豐富,編碼方法科學,符合大多數人的思維習慣,簡單易學,便於普及。該輸入法對於普及和提高全民族的科學文化水平具有重要的現實意義。該軟體首次將漢字結構與中文信息處理相結合,大大簡化了漢字的...
——注重研究模式的創新發展,形成了實質性的文理學科交叉,建成漢字實驗室,成功申報科研專利,開創了傳統文字學實驗研究的先例。直接支持了中心所承擔的諸如古文字電腦字元集編碼國際標準研製、國家的語文標準課程的制定、為上海世博會配套的“數位化漢字博物館”建設等政府交辦任務的完成。——立足自身科研特色,提升中心...
取消民族語言中的特殊字元,儘可能以26個標準拉丁字母代替。(參看:壯語) 為還未有文字的民族設立以拉丁字母為本的新文字。中國台灣省方面,在1990年代曾引發“中文電腦化”及“電腦中文化”的爭議。資策會方面的意見:認為電腦的操作空間有限。如果不讓中文適應電腦環境,中文就會失去新時代的活動能力而變成死的語言...
新疆有關單位開發有該文字的信息處理系統。字元集編碼:2008年4月11日中國發布了國家標準 《GB 21669-2008 信息技術 維吾爾文、哈薩克文、柯爾克孜文編碼字元集》,於2008年9月1日實施 根據2017年第7號公告和強制性標準整合精簡結論,自2017年3月23日起,該標準轉化為推薦性標準,不再強制執行。鍵盤布局:2015年9...
《普及型》的編碼規則簡單易學,但不能用來輸入大字元集漢字。《普及型》可以作為《標準型》的學習階梯,因為二者字根的代碼有共性,因此用熟練後能自然過渡到《標準型》。”主要方式 一 .高頻字取碼方式 這W月Q我M發Z現C了Y對X一A度T所P說S要F成H為U個O沒V多R中J用L地B在G世E上I的D是K他N 二....
為使各民族成員共享信息化時代的成果,中國政府制定了蒙古、藏、維吾爾、哈薩克、柯爾克孜等文字編碼字元集、鍵盤、字模的國家標準,研究開發出多種少數民族文字排版系統、智慧型語音翻譯系統,支持少數民族語言文字網站和新興傳播載體有序發展,不斷提升少數民族語言文字信息化處理和社會套用能力。新疆設立民族語言文字工作委員...
一、漢字編碼 二、字元集與集外字 三、古籍數位化中的集外字處理問題 第二章漢字特性 第一節基本屬性 一、方塊型符號 二、信息熵 三、形音義統一體 (一)字形 (二)字音 (三)字義 第二節歷史性 一、漢字演變 (一)六書 (二)字型 二、漢字數量 第三節地...
第三節 知識信息的編碼 一、編碼的意義和原則 二、語言文字元號編碼 三、順序符號編碼 四、條碼標準 五、制訂信息編碼標準的有關國家標準 第四節 現行的主要編碼標準 一、計算機信息處理用基本編碼 二、信息交換用漢字編碼字元集 三、其他語言文字的編碼 四、各種類型的數據編碼 第三章 文字羅馬(拉丁)字母轉寫的...
1981年,為適應計算機處理漢字信息的需要,中國發布了《信息交換用漢字編碼字元集》GB2312-80。GB2312將代碼表分為94個區,對應第一位元組;每個區94個位,對應第二位元組,兩個位元組的值分別為區號值和位號值加32(2OH),因此也稱為區位碼。01-09區為符號、數字區,16-87區為漢字區,10-15區、88-94區是有待...
寧(寧)氏則起源於明末清初,入關的滿族寧古塔氏、寧爾佳氏改漢姓為“寧”(寧),形成滿族寧氏。在文字改革時,滿族寧氏(寧)都簡化成“寧”氏。簡化字方案中,只規定“寧”簡化為“寧”,而“甯”作為姓字,並沒有被簡化。1981年國家標準總局實施的“漢字編碼字元集”,就保留了“甯”字在電腦簡體字型檔中...
自1979年開始,連續承擔國家級科研課題,陸續制定完成了近150項國家標準和行業標準,覆蓋了漢字,以及藏、蒙、傣、彝、朝鮮、傈僳、苗、維吾爾等少數民族現行文字,為發展有民族特色的信息產業做出了貢獻。GB 2312-1980《信息交換用漢字編碼字元集》,收錄編碼漢字6763個,實現了計算機對漢字的自動識別。1985、1986年...
語用所的主要任務是,研究語言文字的套用問題,為加強語言文字規範化、標準化服務。語用所成立以後,比較重要的研究課題有:國家標準《信息交換用漢字編碼字元集輔助集》的研究編制,漢字結構及其構成成分分析統計,現代漢語用字頻度統計,漢語姓氏人名用字分析統計,漢字屬性字典的編寫,漢語口語研究,叫賣語言研究,作家...
新疆維吾爾等多民族文字信息微機綜合處理技術與開發 國家科學技術進步獎三等獎(第二名) 1995年 維漢聲圖文一體化辦公自動化 新疆自治區科技進步獎二等獎(第一名) 1998年 Windows’95系統優秀科技成果金獎(新疆,第一名) 1998年 第十一屆全國發明展覽會銀獎(第一名) 1999年 維漢聲圖文一體化信息處理環境及套用系統...
1952年6月教育部公布《常用字表》收一級字1500個,二級字500個。1981年5月國家標準局公布《信息交換用漢字編碼字元集(基本集)》,收一級字3755個、二級字3008個,共6763個。80年代初,國家標準局和文字改革委員會聯合組織力量用電子計算機對現代漢語字頻進行統計,1985年3月,得出《現代漢語用字頻度表》。1988...
中國的漢字很多,一部《康熙字典》收字47073個,80年代用計算機作字頻統計一共找到8969個比較常用的漢字;國家標準《信息交換用漢字編碼字元集—基本集》規定中文電腦用字以6763個漢字為度。但是,據說僅僅在電工電子領域現有的概念就已超過400萬個(粟武賓,1990)。相形之下,在社會生活領域出現的詞語爆炸更讓人...
該標準徹底解決了藏文信息處理無編碼標準可循、信息無法共享和互動、嚴重製約藏文信息技術發展的技術難題,使藏文成為中國第一個制訂完成信息交換用編碼國際標準的少數民族文字。該標準在中國國內外藏文信息技術領域得到廣泛使用,例如,美國微軟公司的Windows作業系統自Vista版本開始配備基於該標準的藏文輸入法;蘋果公司的...
“GB”在計算機領域中常常表示GB 2312-80或GB 18030-2005。兩者是漢語編碼系統的標準,在中國大陸和新加坡用於簡體中文。常用編碼集 國家漢字標準代碼 較常見的國家漢字標準代碼列表 GB 2312 - 80 信息交換用漢字編碼字元集 基本集(又稱為GB0)GB 13000 - 93 信息技術 通用多八位編碼字元集(UCS)第一部分 GB...
2014年7月中旬,方正字型檔業務團隊開始進行“補字”工作,對化學元素周期表中第101號至112號以及114號、116號新元素的漢字製作計算機字型,將這些漢字收錄進“方正宋體 S-超大字元集”,並提供相應的輸入法。從討論方案到進入字型檔,“補字”工作用時兩周左右。討論方案主要是確定增補到哪些字型檔和補字編碼,然後開始...
《篆書五體大字典》作者是沈繼良,是2015年西泠出版社出版的圖書,本書按《信息交換用漢字編碼字元集—基本集》的國標交換碼,國家標準號為:GB2312-80,選入了6763個漢字,其中一級字型檔中有3755個,是常用漢字,二級字型檔中有3008個,是次常用漢字。內容簡介 本書按《信息交換用漢字編碼字元集—基本集》的國標交換...