在計算機語言學, 詞義消歧(WSD)是一個自然語言處理和本體論 的開放問題。歧義與消歧是自然語言理解中最核心的問題,在詞義、句義、篇章含義層次都會出現語言根據上下文語義不同的現象,消歧即指根據上下文確定對象語義的過程。詞義消歧即在詞語層次上的語義消歧。
基本介紹
- 中文名:詞義消歧
- 外文名:Word Sense Disambiguation
- 縮寫:WSD
- 套用:自然語言處理
- 領域:計算機
在計算機語言學, 詞義消歧(WSD)是一個自然語言處理和本體論 的開放問題。歧義與消歧是自然語言理解中最核心的問題,在詞義、句義、篇章含義層次都會出現語言根據上下文語義不同的現象,消歧即指根據上下文確定對象語義的過程。詞義消歧即在詞語層次上的語義消歧。
在計算機語言學, 詞義消歧(WSD)是一個自然語言處理和本體論 的開放問題。歧義與消歧是自然語言理解中最核心的問題,在詞義、句義、篇章含義層次都會出現語言根據上下文語義不同的現象,消歧即指根據上下文確定對象語義的過程。詞...
《基於等價偽詞的漢語全文無指導詞義消歧技術研究》是依託哈爾濱工業大學,由劉挺擔任項目負責人的面上項目。項目摘要 詞義消歧是自然語言處理領域的重要的基礎研究問題和難點之一。目前國內外的研究主要集中在為數很少的幾個歧義詞的詞義消歧上,缺乏實用性。本申請首次提出基於等價偽詞的詞義消歧技術。等價偽詞技術可以...
《英漢雙向機器翻譯詞義消歧的研究》是依託哈爾濱工業大學,由李生擔任項目負責人的面上項目。項目摘要 本課題研究了多種詞義消歧方法:考察特徵的依賴關係,用圖模型表示詞義消歧模型,提出最小描述長度的模型評價標準和模擬退火的模型搜尋策略。改進ID決策樹算法,克服用於詞義消歧面臨的幾大難點,改善消歧效果。基於目標...
《漢語全文詞義標註關鍵技術研究》是依託南京師範大學,由曲維光擔任項目負責人的面上項目。項目摘要 文本的全文詞義標註是文本內容理解的前期重要的基礎性工作。目前漢語的全文詞義標註多關注多義詞的消歧任務,仍然無法解決未登錄詞的詞義預測、詞典中缺失義項詞語的義項標註、成語及慣用語、多詞表達的義項標註及語義知識...
消除歧義(disambiguation)也稱作詞義釐清(word sense disambiguation)或文本消歧(text disambiguation),它是解釋使用一詞多義或多形的詞時作者的使用意圖。消除方法 既然消除歧義(disambiguation)對人類來說很困難,就可以理解電腦在這方面遇到的麻煩了。對於某些程式,如把口頭語言記錄成書寫語言的醫療錄入套用,或是...
《漢語縮略語識別以及歧義消解技術研究》是依託北京大學,由王厚峰擔任負責人的面上項目。項目摘要 縮略語是新詞的主要來源,而新詞對自然語言處理中的詞性標註,詞義確定與消歧,命名實體識別及共指消解等造成了嚴重障礙;在中文信息處理中,還造成了分詞的極大困難。與一般新詞不同,縮略語在構成上表現出特有的規律。...
在詞義消歧方面提出基於等價偽詞的詞義消歧方法,依存分析和語義角標註色獲得2008年CoNLL評測第2名,已授權金山公司使用漢語分詞等七項技術。目前承擔國家863課題“語言技術平台”,國家自然科學基金“漢語依存分析”,“漢語語義角色標註”,“漢語詞義消歧”等。跨語言組(CL組)組長:劉挺(兼)副組長:和為 跨語言(...
9.1詞義消歧 9.1.1基於規則的詞義消歧 9.1.2基於統計的詞義消歧 9.1.3基於實例的詞義消歧 9.1.4基於詞典的詞義消歧 9.2語義角色標註 9.2.1 格語法 9.2.2基於統計機器學習技術的語義角色標註 9.3深層語義推理 9.3.1命題邏輯和渭詞邏輯 9.3.2語義網路 9.3.3概念依存理論 本章小結 思考練習 參考...
如事件抽取等。與現有語義角色標註方法不同,我們將研究如何綜合利用多個句法分析以及詞義消歧結果,提高語義角色標註系統的性能。多句法分析不但指常見的短語結構句法分析,還包括我實驗室特色的依存句法分析。同時,研究如何將基於Kernel的學習方法套用於漢語語義角色標註,從而克服句法結構特徵以及詞特徵的數據稀疏問題。
8.3 詞義消歧345 8.4 命名實體識別347 8.5 從零開始構建NER標註器353 8.6 使用訓練的NER模型構建端到端的NER標註器360 8.7 分析語義表示362 8.7.1 命題邏輯362 8.7.2 一階邏輯364 8.8 本章小結368 第9章 情感分析369 9.1 問題描述370 9.2 安裝依賴項370 9.3 獲取數據370 9.4 ...
7.1 詞義消歧 119 7.1.1 基於規則的詞義消歧 120 7.1.2 基於統計的詞義消歧 121 7.1.3 基於實例的詞義消歧 122 7.1.4 基於詞典的詞義消歧 122 7.2 語義角色標註 124 7.2.1 格語法 124 7.2.2 基於統計機器學習技術的語義角色標註 125 7.3 深層語義推理 126 7.3.1 命題邏輯和...
2006年1月—2008年12月,基於等價偽詞的漢語全文無指導詞義消歧技術研究(60575042),國家自然科學基金面上項目,主要負責人 發表論文 2016 Jiang Guo,Wanxiang Che, David Yarowsky, Haifeng Wang and Ting Liu. A Distributed Representation-based Framework for Cross-lingual Transfer Parsing. Journal of Artificial...
多語詞義消歧;基於Babelfy系統的多語詞義消岐及實體連結;有目的的視頻遊戲。獎勵榮譽 BabelNet是一個多語辭彙語義網路和本體,因其在克服語言障礙和利用異構數據源方面做了巨大的開創性工作,BabelNet於2015年被授予META獎。BabelNet是最新的辭彙知識資源庫,具有巨大創新性,《時代周刊》曾專題報導BabelNet的研究工作,...
4.7詞義消歧 4.8單詞的時態處理、“是”動詞選擇處理及調序 第5章句法(語法)與語義理論及分析 5.1句法分析的作用 5.2句法分析的理論基礎 5.3其他語法理論介紹 5.4自動句法分析方法 5.5語義分析 第6章文字識別 6.1文字識別概述 6.2文字識別的基礎理論 6.3文字識別系統的組成 6.4文字識別的特徵...
5.3.1 詞義消歧和義項歸組 5.3.2 義項與框架對接、框架與實例對勘 5.3.3 相關資源的義項映射和框架映射 5.3.4 實現相關資源的統一和整合 第六章 漢語句法語義知識庫的研究與建設 6.1 漢語詞類的模糊劃分與測試平台 6.1.1 詞類的範疇性質 6.1.2 詞類的模糊劃分和隸屬度分析 6.1.3 ...
指導2名本科生獲得2012年 “全國普通高校信息技術創新與實踐活動”網路安全競賽一等獎(國家級);指導5名本科生獲得2010年ACL SIGHAN的國際漢語詞義消歧評測第一名;指導3名本科生獲得2012年“全國大學生智慧型設計競賽”二等獎(省部級);指導3名碩士生獲得2014年ACL SIGHAN的國際漢語切分評測第一名;獲2012年度校教學...
任海英, 於立婷. 一種基於維基百科的多策略詞義消歧方法,《現代圖書情報技術》, 2015, (11): 18-25.任海英, 李玲靜. 北京電動汽車供應網路發展的多主體仿真和預測,《經濟體制改革》, 2015, 33(2): 120-125.任海英, 王紅旭.北京新醫改方案下病人就診支出預測的仿真方法.《中國衛生經濟》, 2013, 32(4): ...
5.2.9 詞義消歧67 5.2.10 主題建模68 5.2.11 語言檢測68 5.2.12 光符識別68 5.3 小結68 第6章 文本分類70 6.1 機器學習71 6.2 文本分類72 6.3 取樣操作74 6.3.1 樸素貝葉斯法76 6.3.2 決策樹79 6.3.3 隨機梯度下降法80 6.3.4 邏輯回歸81 6.3.5 支持向量機81 6.4 ...
12 [2] 齊魯工業大學(山東省科學院)本科教學質量優秀獎. 2022.01 [3] 基於句法分析的詞義消歧方法研究. 山東省高等學校優秀科研成果獎(三等獎). 2013.09 [4] 醫學圖像處理與數據挖掘技術研究. 山東省高等學校優秀科研成果獎(二等獎). 2011.12 [5] 齊魯工業大學本科教學水平評估先進個人. 2008.05 ...
13.5.3 詞義消歧 13.6 統計 NLP 的機率模型 13.6.1 隱馬爾可夫模型 13.6.2 維特比算法 13.7 統計 NLP 語言數據集 13.7.1 賓夕法尼亞州樹庫項目 13.7.2 WordNet 13.7.3 NLP 中的隱喻模型 13.8 套用:信息提取和問答系統 13.8.1 問答系統 13.8.2 信息提取 13.9 現在和未來的研究(基於 ...
《當代翻譯研究叢書:文學翻譯芻議》主要介紹了形合、意合等翻譯方法,探討了文學翻譯中基於規則的理性主義方法和基於統計的經驗主義方法的優缺點,結合文學翻譯研究的現狀和發展方向,提出了形合和意合相結合的文學翻譯方法的基本思路,闡述了詞義消歧中的理性主義方法和經驗主義方法相結合的發展方向,並對文學翻譯的發展...
5.8 詞義消歧和指代消解105 5.9 小結106 第6章 屬性和實體抽取108 6.1 基於頻率的屬性抽取109 6.2 利用句法關係110 6.2.1 利用觀點和觀點評價對象間的評價關係111 6.2.2 利用部分整體和屬性關係116 6.3 基於監督學習的屬性抽取118 6.3.1 隱馬爾可夫模型118 6.3.2 條件隨機場119 6.4 隱含...
7.2.1理解同義詞集 7.2.2分析辭彙的語義關係 7.3詞義消歧 7.4命名實體識別 7.5分析語義表征 7.5.1命題邏輯 7.5.2一階邏輯 7.6情感分析 7.7IMDb電影評論的情感分析 7.7.1安裝依賴程式包 7.7.2準備數據集 7.7.3有監督的機器學習技術 7.7.4無監督的詞典技術 7.7.5模型性能比較 7.8 小結 ...
5.2.2 詞義消歧.149 5.3 義原的表示學習149 5.3.1 算法模型.149 5.3.2 實驗分析.152 5.3.3 小結155 5.4 基於義原的詞表示學習156 5.4.1 算法模型.156 5.4.2 實驗分析.159 5.4.3 小結164 5.5 本章總結164 第6 章語言知識的自動獲取166 6.1 章節引言166 6.2 相關工作167 6.2.1 ...
1. 荀恩東,李生,英漢機器翻譯中基於目標語同現的詞義消歧方法1999 情報學報 2. 荀恩東,李生,匹配樹和決策樹方法識別英語句子中的BaseNPs 1999 計算機研究與發展 3. 顏偉,荀恩東,基於WordNet的英文詞語相似度計算 2004 第二屆全國學生計算語言學研討會論文集 4. 王潔,荀恩東,兼類詞排岐的一種方法 2004 第...
83. 陳浩,程良倫張小波.基於向量空間模型的無導詞義消歧[J].計算機工程與設計,2007,28(5):1215-1218.84. 程良倫,劉學鋼.一種UHF及微波段RFID標籤晶片的研究與套用[J].微計算機信息,2006(09Z):182-184,74.85. 張鼎華,程良倫,張凌.J2EE框架在需求側用電管理信息系統中的套用[J].電力需求側管理,...
7.3.2 詞義消歧 204 7.3.3 語義角色標註 209 7.4 實驗:Python中文文本分析與可視化 211 習題 213 參考文獻 214 第8章 智慧型控制技術 8.1 自動控制系統 215 8.1.1 概述 215 8.1.2 組成與工作原理 215 8.1.3 分類 216 8.2 模糊控制 217 8.2.1 模糊推理方法 217 8.2.2 模糊控制原理 217 8...
13.5.3 詞義消歧 380 13.6 用於統計 NLP 的機率模型 381 13.6.1 隱馬爾可夫模型 381 13.6.2 維特比算法 383 13.7 用於統計 NLP 的語言數據集 384 13.7.1 賓州樹庫項目 384 13.7.2 WordNet 385 13.7.3 NLP 中的隱喻模型 385 13.8 套用:信息提取和問答系統 387 13.8.1 問答系統 387 13....
4.1.2 基於知識的詞義消歧方法 83 4.1.3 無監督的詞義消歧技術 86 4.1.4 有監督的詞義消歧技術 89 4.2 文本數據的稀疏性與降維 90 4.2.1 數據稀疏問題及解決 91 4.2.2 數據平滑技術 92 4.2.3 數據降維方法 93 4.3 數據融合 97 4.3.1 數據融合的概念與方法 98 4.3.2 實體的識別與統一...