《信息處理用現代漢語分詞規範》是1993年6月1日實施的一項中國國家標準。
基本介紹
- 中文名:信息處理用現代漢語分詞規範
- 外文名:Contemporary Chinese language word segmentation specification for information processing
- 標準類別:基礎
- 標準號:GB/T 13715-1992
《信息處理用現代漢語分詞規範》是1993年6月1日實施的一項中國國家標準。
《信息處理用現代漢語分詞規範》是1993年6月1日實施的一項中國國家標準。編制進程1992年10月4日,《信息處理用現代漢語分詞規範》發布。1993年6月1日,《信息處理用現代漢語分詞規範》實施。起草工作主要起草單位:北...
《信息處理用現代漢語分詞規範及自動分詞方法》是2017年9月1日清華大學出版社出版的圖書,作者是周元哲。內容簡介 本書與《軟體測試(第2版)》相配套,內容包括兩部分。第1部分是習題解析,針對主教材的8章內容,給出每章的知識重點,精心設計了相應的習題,並給出了詳細的解析和參考答案。第2部分是實驗指導,主要...
本書介紹了信息處理用現代漢語分詞詞表的收詞原則和方法,《信息處理用現代漢語分詞規範》設計原則及規範內容,中文文本歧義切分技術等內容。本書目錄 第1章 自動分詞是中文信息處理的基礎工程 第一節 分詞的重要性及其主要目標 第二節 自動分詞中存在的主要問題 第2章 《信息處理用現代漢語分詞規範》設計原則及規範...
分詞規範 分詞規範(specification of word segmentation)是2011年公布的語言學名詞,出自《語言學名詞》第一版。定義 規定漢語自動分詞的原則和方法的一系列規則。出處 《語言學名詞》第一版。
1.與英文為代表的拉丁語系語言相比,英文以空格作為天然的分隔設定,而中文由於繼承自古代漢語的傳統,詞語之間沒有分隔。 古代漢語中除了連綿詞和人名地名等,詞通常就是單個漢字,所以當時沒有分詞書寫的必要。而現代漢語中雙字或多字詞居多,一個字不再等同於一個詞。2.在中文裡,“詞”和“詞組”邊界模糊 現...
第一章 信息處理現代漢語分詞詞表 第二章 歧義切分與專有名詞自動識別技術 第三章 基於漢語語素資料庫的漢語構詞研究 第四章 信息處理用現代漢語辭彙研究的兼類問題 第五章 詞的機率語法屬性描述研究及其成果 第六章 《信息處理用現代漢語詞類標記集規範》的研製 第七章 現代漢語述語動詞機器詞典和現代漢語名詞槽...
5.1.2語料庫加工規範65 5.1.3現代漢語語料庫構建實例71 5.2基於統計的分詞方法72 5.2.1統計分詞概述72 5.2.2統計分詞消歧73 5.2.3統計未登錄詞獲取76 5.2.4統計分詞模型83 5.3基於機器學習的分詞方法85 5.3.1最大熵分詞86 5.3.2條件隨機場分詞88第2部分習題/ 91 第3部分語 法 分 析 第6...
《面向中文信息處理的現代漢語動賓語義搭配研究》對動賓語義搭配展開研究,源於近年來自然語言處理領域出現的一個新的語言處理策略——淺層句法分析。淺層句法分析(shallow parsing)也叫部分句法分析(partial parsing)或語塊分析(chunk parsing),它是跟完全句法分析相對的。內容簡介 《面向中文信息處理的現代漢語動...
《面向中文信息處理的現代漢語動名組合問題研究》是以內涵邏輯方法論為指導,以疊置原理為理論基礎,以動詞模型為工具,以漢語中的VN、NV、N1VN2、“動詞+處所賓語”等結構為研究對象,努力從V、N本身來實現VN、NV、N1VN2、“動詞+處所賓語”等不同層級結構單位語義理解過程的形式化。在研究過程中,編者把詞法和...
試論現代漢語的類詞綴 從兩個同級義場代表單字搭配的異同看語義特徵和語義層級 ——以“鍋”和“碗”為例 二字短語凝固度分級初探 《信息處理用現代漢語分詞詞表》的內部構造和漢語的結構特點 漢語常用的兩種語音構詞法 ——從平定兒化和太原嵌l詞談起 漢語聯綿語音詞的韻律類型 ...
《漢語拼音正詞法基本規則》規定了用《漢語拼音方案》拼寫現代漢語的規則,內容包括分詞連寫規則、人名地名拼寫規則、大寫規則、標調規則、移行規則、標點符號使用規則等,同時規定了一些變通規則以適應特殊需要。該標準適用於文化教育、編輯出版、中文信息處理等領域的漢語拼音拼寫。制定過程 修訂背景 《漢語拼音正詞法基本...
《面向語言信息處理的現代漢語並列結構研究》是2013年7月北京師範大學出版集團、北京師範大學出版社聯合出版的圖書,作者是吳雲芳。內容簡介 《國家社科基金後期資助項目:面向語言信息處理的現代漢語並列結構研究》主要內容包括:引論、研究的意義、研究的方法、全書的組織、基於語料庫的並列結構語言研究、並列結構研究的理論...
對外漢語教材的漢語拼音標註方法調查 第三篇 漢語文本檢索技術及套用 漢語語料檢索系統CCRL及其套用 簡單短語及線性鄰接屬性研究 動詞重疊形式的分布與線性鄰接屬性調查 程度副詞加形容詞的線性鄰接屬性調查 “不”加形容詞的短語分布和線性鄰接屬性調查 漢語書面語詞語特徵統計分析 現代漢語通用分詞系統中歧義切分的實用技術...
博士,教育部語言文字套用研究所研究員、計算語言學研究室主任。主要研究領域為計算語言學、語料庫語言學和語言文字信息處理。近年來承擔科研項目多項,出版專著兩部,發表學術論文數十篇,參與研製《信息處理用現代漢語詞類標記集規範》等國家標準。現任教育部教育技術與資源發展中心副主 任。個人履歷 曾任教育部語言...