《不確定數據的空間co-location模式挖掘技術研究》是依託雲南大學,由王麗珍擔任負責人的國家自然科學基金專項基金項目。
基本介紹
- 中文名:不確定數據的空間co-location模式挖掘技術研究
- 負責人:王麗珍
- 依託單位:雲南大學
- 項目類型:專項基金項目
項目摘要,結題摘要,
項目摘要
不確定數據遍及我們生活的各個領域,例如:GPS或行動電話的定位、植物生長位置或區域的定位和感測器數據管理等。這些套用中,空間並置(co-located)模式的挖掘是非常重要的。本項目研究不確定數據的空間co-location模式挖掘的理論、算法和套用。包括不確定機率co-location模式挖掘研究、不確定近似co-location模式挖掘研究、不確定模糊co-location模式挖掘研究、不確定加權co-location模式挖掘研究。分析不確定性挖掘在三江併流植物空間數據這一實際套用項目中的意義和作用,建立三江併流區域植物物種分布格局和挖掘共生植物物種的決策支持系統。在國內外重要學術期刊和會議上發表高水平學術論文8-10篇,其中SCI和EI收錄論文5-6篇,培養青年教師3名,碩士研究生至少15名。
結題摘要
不確定數據遍及生活的各個領域,如GPS或行動電話的定位、植被疾病診斷、環境監測等。這些套用中,空間並置(co-located)模式的挖掘是非常重要的。本項目系統全面地研究了不確定數據的空間co-location模式挖掘理論、算法和套用,研究成果豐富和發展了空間數據挖掘的理論與技術。取得的主要成果包括:(1)給出不確定性空間數據的表示和建模方法,定義不確定空間數據的語義距離、空間鄰近關係,提出不確定空間對象間的距離計算的有效方法;(2)定義不確定數據的期望頻繁co-location模式、機率頻繁co-location模式,比較期望頻繁與機率頻繁,設計有效的精確挖掘算法和可伸縮的近似挖掘算法,找到了樣本數目與近似誤差的關係;(3)基於模糊等價劃分,定義區間數表示的不確定數據的語義貼近鄰居概念,設計高效的不確定區間數據的co-location挖掘算法;(4)定義模糊空間數據上空間co-location模式挖掘的相關概念,包括模糊參與率、模糊參與度等。提出模糊特徵的co-location模式及其挖掘算法、模糊度閾值範圍內模糊特徵的co-location模式及其挖掘算法、模糊實例的co-location模式及其挖掘算法、帶模糊屬性的co-location模式及其挖掘算法;(5)定義加權co-location模式概念,證明加權參與率與加權參與度的部分向下閉合性質,設計有效的挖掘算法,以解決帶稀有特徵的或帶時間約束的空間數據集的co-location模式的挖掘問題;(6)獲得“三江併流”區域植被分布的不確定數據,研究不確定co-location挖掘方法、模糊co-location挖掘方法及加權co-location挖掘方法在“三江併流”植被分布數據分析中的套用,進行不確定co-location挖掘與傳統co-location挖掘的比較。在包括《IEEE Transaction on Knowledge and Data Engrineering》(TKDE)、《Expert Systems》、《計算機學報》等國內外重要期刊和包括ADMA、WAIM、BNCOD、NDBC等重要學術會議上發表學術論文27篇,其中SCI 收錄3篇,EI收錄 11篇次。完成一部專著《空間模式挖掘理論與方法》的撰寫工作。培養中青年教師4名,博士研究生2名,碩士研究生26 名。