科技論文的語義模式研究

科技論文的語義模式研究

《科技論文的語義模式研究》是依託吉林大學,由徐昊擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:科技論文的語義模式研究
  • 項目類別:青年科學基金項目
  • 項目負責人:徐昊
  • 依託單位:吉林大學
項目摘要,結題摘要,

項目摘要

科技論文的讀寫模式,直接影響著科研人員對於知識理解、共享和重用的效果與效率。本項目擬針對當前科技論文非結構化知識表示、匱乏語義信息、缺少語義描述等問題,以論文的語義結構和語義關聯為研究對象,對於科技論文的語義模式進行研究。項目組將通過建立基於論文類型的語義結構模型,揭示科技論文的語義模組及其內在邏輯關聯和邏輯序列;通過設計基於結構化知識表示的元數據方案,實現對於科技論文各個層次結構的語義描述;通過設計並實現一套語義標註語言及方法,實現動態社會網路下語義標註的自動處理和自動生成。本項目的最終目標是,通過逐步研究上述各階段的理論與技術,建立起一套比較完善的科技論文語義模式理論,並在此基礎上開發出相應的語義表示和語義標註方法,為廣大科研人員和出版機構使用。

結題摘要

針對當前科技論文非結構化知識表示、匱乏語義信息、缺少語義描述等問題,項目組以論文的語義結構和語義關聯為研究對象,針對科技論文的語義模式開展研究,提出了基於科技論文類型的元數據方案SKOTypes,基於科技論文邏輯結構的語義模式的SKOPatterns,和基於語義技術的語義標註工具SKOTeX,並進行了一系列的理論和實驗研究,在科技論文的知識表示、實體識別、語義標註和語義搜尋等方面取得了一定進展。 針對不同類型的科技論文和不同結構層次的科技知識中所蘊含的語義模式進行研究,具體包括科技論文(SKO)、科技論文組成模組(SKO Node)、科技論文集合(SKO Set)的定義與分類,以及各種類型之間的包含、繼承等關係。基於論文的分類結構,對不同類型的論文進行了修辭結構分析和邏輯分析,根據論文內容所表達的語義功能,定義了語義模組、模組之間的語義關聯及邏輯序列,進而實現了語義結構模型的設計。 根據語義結構模型,提出了相應的元數據方案,建立了一套有效的理論模型,實現SKO、SKO Set、和SKO Node內在和外在數據、知識、實體的語義關聯表示方法,並給出實體、關係和屬性的詳細定義。針對動態社會網路下的語義標註方法進行研究,設計並實現了一種基於LaTeX語法的語義標註語言,實現元數據模式對於科技論文及其語義結構的標註方法,以及LaTeX與XML及RDF等標記語言的自動轉換。 基於項目提出的語義模組和語義標註方法,搭建了基於修辭結構、自然語言處理、語義技術的語義搜尋平台;實現了基於WikiPedia和科技論文的自動本體建立方法;設計了基於本體的機器學習相關算法,實現了Keyword自動分類器和Concept推薦算法,進一步推動了語義技術在科技知識管理中的理論和套用研究。 本項目共發表SCI/SSCI/EI檢索論文7篇,申請發明專利1項,獲得軟體著作權1項,獲得全國商業科技進步一等獎1項。組織國際研討會2次,培養博士後1人、博士研究生2人、碩士研究生8人。

相關詞條

熱門詞條

聯絡我們