面向GIS的文本空間關係解析機制研究

面向GIS的文本空間關係解析機制研究

《面向GIS的文本空間關係解析機制研究》是依託南京師範大學,由張雪英擔任項目負責人的面上項目。

基本介紹

  • 中文名:面向GIS的文本空間關係解析機制研究
  • 項目類別:面上項目
  • 項目負責人:張雪英
  • 依託單位:南京師範大學
項目摘要,結題摘要,

項目摘要

自然語言是人類空間認知結果的主要表現形式,文本是最常用的一種自然語言,也是一種重要的原始空間數據來源。從文本中獲取未分析的、非顯示的空間知識已成為當前地理信息科學迫切需要解決的問題。本項目針對文本中空間關係描述的定性化、非結構化、隱蔽性和語義不確定性等特點,研究面向自然語言的空間關係規範化表達方法,探討基於核方法的文本空間關係抽取模型和方法,構建基於粗糙集的文本空間關係與GIS空間關係模式的語義映射算法,形成相應的中間件系統,並進行實驗驗證分析。通過該項目的研究,有望系統地揭示面向GIS的文本空間關係解析機制,形成從文本中獲取空間數據的新思路,解決GIS中地理信息的自然語言描述難題,提升GIS表達能力和可理解性,完善文本中時空信息的解析和空間化方法,提供人類解讀和理解文本的新形式,進一步豐富地理信息科學的理論與方法,推動地理信息科學的智慧型化、社會化和人性化發展。

結題摘要

全球技術研究和諮詢公司(Gartner)調查報告顯示,未來至少95%的人機互動信息是文本語言,而80%以上的文本中涉及地理信息的描述。除了傳統的測繪、攝影測量和地圖數位化等手段之外,GPS、衛星影像、文本等已成為新型的重要地理信息來源。由於數據來源和表達模型等方面的限制,GIS空間關係在描述、表達、理解、傳遞與交流等方面與人們習慣使用的自然語言存在顯著差異。如何消除二者之間的語義鴻溝是地理信息科學研究面臨的重要問題。本項目研究主要包括:1)分析文本中空間關係描述的定性化、非結構化、隱蔽性和不確定性等特點,探討了不同類型空間關係描述的語言單元、句法結構和語義關係,制定了面向中文文本的地理命名實體和地理空間關係標註體系,以自然語言處理平台(GATE)為工具,構建了《中國大百科全書地理分冊》標註語料庫;2)構建了大規模全國地名資料庫,設計了基於搜尋引擎的地名敏感網頁爬蟲,分析了地理實體要素類型與特徵字的關聯關係,提出了基於條件隨機場(CRM)和結構化支持向量機(SSVM)的地理實體抽取模型和算法,實現了基於網路爬蟲和地理實體解析的地名資料庫更新方法;3)構建了空間關係辭彙與地理實體要素類型之間的語義映射本體,採用人工總結和序列比對相結合的方法,歸納了中文文本中空間關係描述的句法模式,提出了基於規則和支持向量機(特徵向量和核方法)的空間關係抽取模型和算法;3)針對空間關係語義表達的幾何、功能和語用三大特徵,構建了空間關係辭彙、句法和語用三個層次的語義解析模型,提出了基於上下文空間關係的地理實體模糊空間建模方法;5)開發了面向GIS的文本空間關係解析原型系統,進行了相關數據、模型和算法的實驗驗證分析,並開展了網路事件時空信息關聯、面向土地管理和規劃等領域的空間關係知識挖掘等案例套用研究。創新性成果主要包括:1)通過構建空間關係標註體系和大規模標註語料庫,為面向自然語言的空間關係解析理論和套用研究提供了元數據規範和標準數據集;2)常用空間關係句法模式庫和多種空間關係抽取算法,為相關套用推廣提供了知識庫和套用中間件;3)集成幾何、功能和語用特徵的空間關係語義解析模型,有效實現了自然語言與GIS空間關係的多層次語義映射。項目成果系統地揭示了面向GIS的文本空間關係解析機制,為普適化GIS發展提供了創新思路,同時為後續基金項目“面向自然語言的虛擬地理場景重構”研究奠定了堅實的基礎。

相關詞條

熱門詞條

聯絡我們