中國公共資料庫數據質量控制的粒化方法研究

中國公共資料庫數據質量控制的粒化方法研究

《中國公共資料庫數據質量控制的粒化方法研究》是依託昆明理工大學,由劉文奇擔任項目負責人的面上項目。

基本介紹

  • 中文名:中國公共資料庫數據質量控制的粒化方法研究
  • 項目類別:面上項目
  • 項目負責人:劉文奇
  • 依託單位:昆明理工大學
項目摘要,結題摘要,

項目摘要

針對我國公共資料庫的特點和數據質量控制中存在的理論及技術難題,在分析現有的某些公共資料庫數據質量狀況的基礎上,建立和運用基於粗糙集、概念格和變權分析理論的公共資料庫多源性公共數據處理(清洗)模型. 本項目研究中,重點發展公共資料庫多源數據融合的多粒度粗糙集概念格模型、實體識別的多粒度粗糙集模型和最小數據集生成的多粒度代價敏感算法,並在國家企業質量信用資料庫(CCCQ)、中國公安資料庫(CPS)、國家學生健康資料庫(CSH)等真實的公共資料庫中進行實證分析. 本項目研究將在公共資料庫數據融合的多粒度信息粒化、快速屬性約簡、多粒度化實體識別和多要素(技術成本、財務成本、隱私保護、政策風險等)變權綜合代價敏感幾個方面獲得理論創新和技術創新,取得標誌性理論成果和套用成果.

結題摘要

針對我國公共資料庫的特點和數據質量控制中存在的理論及技術難題,在分析質量技術監督數據、氣候環境數據、司法數據等公共資料庫數據質量狀況的基礎上,運用複雜網路、演化博弈論、概念認知學習、相變理論、變權理論、分散式協同控制理論等,建立了較完整的公共資料庫數據質量控制與數據分析的粒化理論基礎,並提出若干公共數據粒化方法且套用與公共數據最小數據集、公共數據電子證據系統、氣候和環境數據粒化及實證分析,取得良好效果。通過研究,我們在以下幾個方面研究中取得重要結果:(A)複雜網路上的公共數據演化博弈與數據質量控制;(B)基於概念認知學習的公共數據粒化方法;(C)公共數據中電子證據的獲取、粒化與區塊鏈技術;(D)大氣、環境與企業質量信用公共數據粒化方法及實證分析;(E)基於社區檢測的數據粒相互依賴性研究。本項目研究成果表明:(1)公共資料庫數據質量控制中,公共資料庫網路上的數據演化博弈存在合作者,而合作者比率既依賴於公共數據監督部門的稽查力度和獎懲力度也依賴於數據粒度的大小和粒化方法;(2)公共資料庫數據粒化的過程是複雜網路上一個概念認知學習的過程,粒化的過程是漸進的,最終形成與現實公共產品供給的對象相對應的相對穩定的概念,進而影響現實公共數據處理與分析的邏輯結論;(3)提出的理論與方法在處理氣候、環境、電子證據和質量技術監督信用數據中套用效果好,有助於提升氣候預報、大氣污染防控、司法辦案和產品質量安全領域公共數據治理水平和公共產品質量。這些成果覆蓋了項目申請書和計畫書的全部研究內容並達到了相應的預期研究目標、取得了預期成果。 該項目研究取得了豐富的成果,其中標誌性成果發表於國內外權威的學術期刊上,包括《中國科學》3篇、IEEE Transactions系列1篇,Omega 1篇,SCI檢索論文10篇,大大超出項目申請書提出的成果發表指標。在項目期內,人才培養成效顯著,具體為:課題組成員中1人晉升為教授,1人晉升為副教授,3人被聘為博士生導師;10人研究生畢業並獲得碩士學位(其中5人考取博士研究生),另有3人在讀研究生考取碩博連讀博士研究生。項目期內,國際國內學術交流成效顯著,具體為:國際學術交流9人次,來訪7人次,派出2人次,接受2名留學生來課題組攻讀博士學位(導師為劉文奇);舉辦國內學術會議3次,外出參加國內學術會議40多人次;舉辦“撈魚河講壇”24期。

相關詞條

熱門詞條

聯絡我們