漢語語義知識獲取與語義計算模型研究

漢語語義知識獲取與語義計算模型研究

《漢語語義知識獲取與語義計算模型研究》是依託華中師範大學,由何婷婷擔任項目負責人的重大研究計畫。

基本介紹

  • 中文名:漢語語義知識獲取與語義計算模型研究
  • 項目類別:重大研究計畫
  • 項目負責人:何婷婷
  • 依託單位:華中師範大學
項目摘要,結題摘要,

項目摘要

研究適於句子與篇章的漢語語義計算模型,包括語義知識形式化表示漿提全方法、文本的語義表征模型、語義計算方法。研究內容和特色包括:①提出了一種顯式表示概念的語義知識的形式化方法,把傳統的基於語義知識庫的方法與基於文檔集統計分析的方法有機結合,取長補短,充分發揮各自的優勢,又在一定程蒸重乘度上彌補各自的不足;②提出了用雲模型來表征與計算不確定性概念的語義的方法,使得計算機能夠在一定估境程度上理解不確定性概念的模糊性、隨機性及二者間的關聯性;③將這種語義知識平滑融入到現有的文本計算模型中建立文本的語義表征與計算模型,可顯著提高計算機的語義理解能力;④提出與研究基於真實語言生活材料感知語義知識的策略,便於知識的動態更新、情境感知;⑤利用這種語義計算模型,研究影響自然語言處理的若干難點問題的解決方案,並通過網路文本信息檢索的套用,驗證駝淋少剃研究成果的有效性。本研究對實現重大研究計畫的總體目標有重要意義。

結題摘要

本項目以重大研究計畫“視聽覺信息的認知計算”提出的“感知特徵提取、表達與整合”、“感知數據的機器學習與理解”為指導,重點了研究如何從中文網路文本信息中自動獲取語義知識,從而實現對網路文本基於適度語義理墓料迎解的內容計算。   2010年1月至2012年12月,我們按照項目計畫書順利完成了“漢語語義知識獲取與語義計算模型研究”的國家自然科學基金項目。在項目的實施過程中,提出了從真實語言生活材料獲取漢語語義知識、通過辭彙之間的關聯關係形式化描述語義的方法,並將這種語義知識平滑融入現有的文本計算模型中,建立概念語言模型,該模型能將語義概念融入到傳統的語言模型中,提高計算機對自然語言文本的語義計算能力,其有效性已通過不同網路文本信息處理系統中的套用得以驗證。   針對語義知識的獲取與表示,提出了從大規模真實文本集,百科知識庫,以及部落格中自動獲取多樣化的概念語義知識策略,以及基於語義標籤與語義指紋模型的語義放捉笑腿形式化表示方法,以實現知識獲取。針對語義計算,提出了基於語義指紋的概念語言模型,將獲取的語義知識自然融入到語言模型中,從而建立更加精確的語言表征。提出了用雲模型來表征與計算不確定性概念的語義的方法,將獲取的不確定性知識套用於文本處理。針對基於語義的網路文本信息處理的各項任務,我們分別提出了基於語義的解決方案,如基於LDA模型的生物信息檢索方法、基於主題模型的基因功能組檢索方法、基於作者-會議-主題關聯模型的學術信息檢索方法、基於雲模型的面向查詢的多文檔自動文摘方法、基於LDA主漿幾炒題模型的文本聚類方法、基於雲模型的貝葉斯文本分類方法。

相關詞條

熱門詞條

聯絡我們