《旅遊地理本體與眾包旅遊信息的時空語義挖掘研究》是依託河北師範大學,由李仁傑擔任項目負責人的面上項目。
基本介紹
- 中文名:旅遊地理本體與眾包旅遊信息的時空語義挖掘研究
- 項目類別:面上項目
- 項目負責人:李仁傑
- 依託單位:河北師範大學
項目摘要,結題摘要,
項目摘要
大數據環境下,數據與模型的語義共享和科學家群體協作日益重要。網際網路中的旅遊知識條目、文本、照片、軌跡等眾包旅遊信息是大數據的重要組成部分。旅遊地理學有必要尋找科學利用眾包信息的方法,適應數據密集型科學的計算模式。項目引入本體思想,基於領域專家知識,充分復用已有旅遊和地理本體,並吸納網際網路新概念,建立旅遊地理本體模型。研究基於本體學習的本體自動填充與知識校驗方法,實現本體知識庫的持續更新。探索基於旅遊地理本體的眾包旅遊信息時空語義挖掘方法,設計開發時空語義提取、尺度變換和精度評估的模型與工具等。通過典型區域的旅遊流動性、人地關係和旅遊格局與過程建模對本體模型和挖掘方法進行驗證。項目旨在建立旅遊地理學套用眾包大數據的關鍵方法,能夠為多時空間尺度上的數據、模型與服務集成,科學家群體協作和區域聯合計算提供理論基礎,對旅遊格局、過程與機制研究和旅遊政策制定與效益評價等均具有基礎意義。
結題摘要
本項目在新地理資訊時代背景下,針對微博、文本、照片、軌跡等眾包旅遊信息的非規則性和時空語義不確定性等問題,從旅遊地理本體的概念、內涵和本體構建方法入手,嘗試旅遊地理本體的填充與校驗方法,設計開發眾包旅遊信息的時空語義提取、尺度變換和精度評估模型,探索基於旅遊地理本體的時空語義挖掘與套用。主要研究成果包括:(1)構建了初步的旅遊地理本體理論模型,並完成以張家界旅遊地為案例的旅遊地理本體實例;建立了以旅遊文本、位置微博等為主體的系列眾包旅遊信息語料庫,為基於旅遊眾包信息的旅遊地理研究提供基礎;(2)設計了旅遊文本內容中的熱度地名提取、識別與可視化方法;引入LDA主題模型,提出了多特徵維度的旅遊文本主題分類方法;(3)設計了針對不同數據源、不同空間尺度的旅遊關注度計算方法、旅遊行為軌跡柵格化方法,完成了從景區到區域旅遊地的多尺度實證案例;(4)引入粒計算模型和包含度方法,提出了多尺度旅遊文本景觀熱度粒計算模型,為旅遊眾包信息的時空尺度變換和數據挖掘奠定了方法學基礎;(5)選擇古城古鎮、山嶽型風景區、區域旅遊地等不同類型、不同尺度的旅遊空間單元,開展了旅遊者景觀感知、時空行為特徵及其演變過程的研究;(6)初步證明了旅遊地理本體支撐下的眾包旅遊信息在旅遊者的流動性、人地關係和旅遊格局與過程建模方面的套用價值。 旅遊眾包信息是旅遊地理學研究的優質數據源,本研究針對旅遊眾包信息的旅遊地理學套用方法與案例成果,對多時空尺度的旅遊地理格局、過程與機制研究具有理論貢獻,在旅遊地發展狀態的實時監測,旅遊地發展規劃與預測、旅遊政策制定與旅遊效益評價方面也具有參考意義。