支持技術創新的海量數據管理基礎理論與關鍵技術

支持技術創新的海量數據管理基礎理論與關鍵技術

《支持技術創新的海量數據管理基礎理論與關鍵技術》是依託武漢大學,由彭智勇擔任項目負責人的重點項目。

基本介紹

  • 中文名:支持技術創新的海量數據管理基礎理論與關鍵技術
  • 項目類別:重點項目
  • 項目負責人:彭智勇
  • 依託單位:武漢大學
項目摘要,結題摘要,

項目摘要

科學發現和技術創新能力已成為一個機構乃至一個國家競爭力的重要標誌。隨著信息技術的迅猛發展,科學發現和技術創新也進入了數據密集型時代。本課題旨在研究支持技術創新的海量數據管理理論和方法,聚焦於與智慧財產權相關的專利及關聯的文獻資料和科學實驗數據等多源異構動態複雜的數據對象。針對現有產權知識管理平台數據單一、不完備、服務簡單且系統擴展性差的局限性,本課題重點研究:(1)海量數據分散式集約化管理架構,數據空間模式規範化理論和需求規約化方法、動態雙向一致性維護策略,實現數據動態管理與按需維護;(2)基於規範的非結構化信息抽取和融合方法及分散式離線分析、記憶體式需求實時調度,保證數據服務的及時性、完整性和有效性;(3)基於語義關聯的查詢處理方案,實現可視化的熱點分析、引證分析和專利預警,輔助技術創新和完善產權管理。期望研發的平台能有效輔助管理部門的專利審查、研發部門的專利查詢以及套用部門的專利預警等套用。

結題摘要

科學數據、科技文獻和設計文檔等海量複雜數據中包含大量有價值的信息,管理、查詢和挖掘這些信息具有重大意義。本項目針對這些複雜數據,研究分層管理體系架構,實現基礎數據集群化管理、語義數據集約化管理、用戶數據個性化管理,並通過複雜關聯可計算方面的研究,以可視化方式為政府部門、科技人員和企業單位提供技術熱點分析、引證分析、預警分析等技術創新服務。 項目從系統體系架構,海量數據存儲研究,複雜數據處理研究,數據空間管理研究,技術創新服務研究五個方面開展了研究工作。在系統體系架構設計方面,設計了三層體系架構,集成大規模集群存儲、先進資料庫和個性化數據空間管理技術,實現海量複雜數據分層管理。在海量數據存儲研究方面,本項目對科學數據、科技文獻、設計文檔進行分散式關聯化存儲,降低處理時網路開銷,實現了對複雜數據的準確語義分析與關聯項挖掘功能。在複雜數據處理研究方面,本項目採用對象代理模型管理複雜數據,實現了海量複雜數據關聯計算,數據按需獲取最佳化調度等算法。在數據空間管理研究方面,基於對象代理資料庫創建數據空間,建立對象代理資料庫規範化理論,設計新的範式和轉換算法,消除異常信息。從數據空間中抽取個性化需求,實現公共需求歸約化,數據空間動態劃分等功能。在支持技術創新服務研究方面,採用聚類發現研究主題,採用自然語言處理方法挖掘科技文獻的技術關鍵字,採用關聯規則挖掘企業用戶與競爭對手的研發方向,結合提取的信息,制定企業技術研發策略,迴避技術風險。 本項目以專利數據為典型示範套用,為企事業單位、研究院所、智慧財產權管理部門等提供一個輔助技術創新的平台,實現個性化數據管理和智慧型信息服務,提高了技術創新的能力。在創新成果方面,在國內外高水平期刊、會議上發表論文共95篇,被SCI收錄24篇,EI檢索81篇,其中包括CCF列表A類會議、期刊論文共6篇,CCF列表B類會議、期刊論文共12篇。此外,還出版專著2部,專利授權12項。培養博士生12名,碩士生32名。

相關詞條

熱門詞條

聯絡我們