《基於語義計算的海量Deep Web知識探索機制研究》是依託華中科技大學,由趙峰擔任項目負責人的面上項目。
基本介紹
- 中文名:基於語義計算的海量Deep Web知識探索機制研究
- 項目類別:面上項目
- 項目負責人:趙峰
- 依託單位:華中科技大學
中文摘要,結題摘要,
中文摘要
Deep Web蘊含的信息量豐富、質量高、內容領域性強、增長速度快,已逐步成為網際網路承載信息的主體。近年來,搜尋和發現海量Deep Web背後隱藏的用戶所需要的信息,對其進行可靠管理、準確分析和全面理解,並提供普適化/個性化的知識服務,已成為國內外眾多學者研究的熱點與焦點。本項目針對Deep Web海量性、動態性、不確定性的特徵,圍繞搜尋模式改變和數據量-質矛盾引發的挑戰,以提高Deep Web信息的可用性、實現海量Deep Web的高效知識檢索和發現為目標,研究海量Deep Web知識探索的數據發現與分類、數據採樣、語義推算與動態演化、知識評估與檢索最佳化等關鍵機制,為海量Deep Web的量-質融合和信息-知識轉化奠定基礎。本項選題具有先進性,研究具有重要的理論意義與實用價值,研究成果可直接套用於網際網路資源管理,為其提供新的、有效技術手段,並拓寬網際網路信息檢索的研究領域。
結題摘要
Deep Web蘊含的信息量豐富、質量高、內容領域性強、增長速度快,已逐步成為網際網路承載信息的主體。近年來,搜尋和發現海量Deep Web背後隱藏的用戶所需要的信息,對其進行可靠管理、準確分析和全面理解,並提供普適化/個性化的知識服務,已成為國內外眾多學者研究的熱點與焦點。本項目針對Deep Web海量性、動態性、不確定性的特徵,圍繞搜尋模式改變和數據“量-質”矛盾引發的挑戰,以提高Deep Web信息的可用性、實現海量Deep Web的高效知識檢索和發現為目標,研究海量Deep Web知識探索的數據發現與分類、數據採樣、語義推算與動態演化、知識評估與檢索最佳化等關鍵機制,為海量Deep Web的“量-質”融合和“信息-知識”轉化奠定基礎。經過四年的研究,項目組在Deep Web數據發現與分類問題、Deep Web知識查詢和搜尋問題、Deep Web知識語義分析問題以及Deep Web知識評價與度量問題上取得了系列進展,系統性地提出了Deep Web知識探索的方法,如:兩階段爬蟲系統SmartCrawler、實時搜尋的索引結構LS-AMS等,開發了Acrost、Mysearch等系列原型系統,相關成果發表在IEEE Trans. on Servicing Computing, IEEE Trans. on Big Data, IEEE System Journal, FGCS等國際著名期刊上。研究成果可為Deep Web高效知識探索提供了有效的技術途徑,也可拓展用於網際網路資源管理。