《定性地理信息檢索的模型與方法》是依託北京大學,由高勇擔任負責人的面上項目。
基本介紹
- 中文名:定性地理信息檢索的模型與方法
- 項目負責人:高勇
- 項目類別:面上項目
- 依託單位:北京大學
項目摘要,結題摘要,
項目摘要
當前的地理信息檢索技術基於定量化的檢索模型和方法,無法有效處理自然語言文本中豐富的地理語義,造成一定的信息丟失和理解錯誤,並可能產生檢索的錯誤匹配,從而導致檢索結果的不完備和不準確。因此,研究定性地理信息檢索的方法及其形式化模型,以語義匹配為原則、以定性表達為基礎、以推理方法為手段,實現Web文檔信息內容與查詢請求的定性表達和信息提取,建立基於定性空間推理的定性地理信息檢索模型,支持基於語義的檢索匹配和結果排序,並進行原型系統的實驗驗證。從而以符合人類常識性認知和表述習慣的方式,形成基於定性知識表達和推理決策技術的地理信息檢索問題解決方法,提高現代地理信息檢索技術的有效性。
結題摘要
項目主要研究定性地理信息檢索的形式化模型和方法,實現Web 文檔信息內容與查詢請求的定性表達方法和信息提取技術,建立基於定性空間推理的定性地理信息檢索模型,支持基於語義的檢索匹配和相關度評價,並進行原型系統的實驗驗證。通過項目的研究工作,提出了基於條件隨機場識別中文文本地理信息的方法,顯著提高中文地名識別和消歧的精度。提出並實現了基於命題邏輯和證據推理的定性地理信息檢索的模型和方法,豐富了文本地理信息表達和檢索匹配的語義信息,以符合人類常識性認知和表述習慣的方式發現Web中的地理信息和地理知識,顯著提高地理信息檢索的精度和有效性。針對定性地理信息,提出不確定性場理論,表達空間陳述的空間範圍機率分布,建立模糊地理信息檢索模型和方法。將地名及其位置表達為點集,提出基於點集的PageRank算法和Footprint模型,對相關度排序的精度和性能的提高具有很好的促進作用。同時,研究了文本地理信息的數據挖掘方法,提出了基於地名共現的複雜網路分析和空間模式分析方法,有效的從文本中發現地理知識。在上述工作的基礎上,研究開發了一個地理信息檢索的軟體系統,實現定性-定量結合的Web搜尋引擎。