《高維對象異化機理挖掘的關鍵技術研究》是依託四川大學,由段磊擔任項目負責人的面上項目。
基本介紹
- 中文名:高維對象異化機理挖掘的關鍵技術研究
- 項目類別:面上項目
- 項目負責人:段磊
- 依託單位:四川大學
項目摘要,結題摘要,
項目摘要
差異發現是複雜對象分析的突破口,但現有差異發現方法存在差異表達形式單一、差異評價方法欠靈活、高維對象分析效率低、缺乏對差異的解釋等不足。本課題提出並研究一種新的數據挖掘任務——異化機理挖掘,在發現差異的基礎上,探索分析對象表現差異的可解釋性,為分析對象的異化規律和變化趨勢提供方法和理論依據。主要研究工作包括:(1)從異化表達、異化度量、異化比較三個層面開展研究,建立異化機理數學模型;(2)針對分析對象高維、海量的主要特點,設計異化機理知識發現的一系列挖掘算法;(3)研究異化機理的知識管理方法,以傳染病防控監測數據分析為需求,驗證異化機理挖掘的實用性和可靠性。異化機理挖掘是從可解釋性的角度對差異發現作出的新探索,可望成為一個新的創新源頭、學術熱點。
結題摘要
項目組根據研究計畫,認真、嚴謹地對高維對象異化表達、異化度量、異化比較,異化機理數學模型建立,以及異化機理知識管理等高維對象異化機理挖掘的關鍵技術開展了深入的科研探究,揭示了高維對象異化機理挖掘的特殊矛盾及相應的適用方法。在項目研究中,項目組一方面以序列數據為研究對象,研究序列數據對象的異化表達、異化度量、異化比較等核心問題,以及面向大規模序列數據集異化度量及異化機理挖掘的分散式計算框架等關鍵技術。另一方面,項目組以典型生物醫學問題為背景,面向多源異構對象設計了異化機理挖掘算法,並基於疾病信息網路元路徑開展致病基因相似性分析和異化度量,以驗證異化機理挖掘的實用性和可靠性。此外,項目組在若干特定領域實踐異化機理挖掘,擴展研究成果的套用範圍。項目組開發了針對序列對象異化機理挖掘的原型系統,發表研究論文28篇(含已錄用),完成學術專著章節1篇,翻譯學術著作2本,申請發明專利2項。項目組收集整理了不涉及保密要求的適合於異化機理挖掘研究的數據集,並已多次為國內同行提供實驗數據集。人才培養方面,博士後出站1人,畢業碩士生13人,目前在讀碩士生18人。項目負責人舉辦ACM中國圖靈大會SIGMOD China 2019會議,逾120人參加。項目組成員積極參加各類學術交流,累計參加國際學術會議22人次,參加國內學術會議25人次,參加各類暑期學校學習35人次。項目組與多位國外專家保持密切科研合作,共同完成多篇高水平學術論文。在研究過程中,項目組成員充分發揮交叉學科優勢,共同努力完成既定科研內容,取得研究成果達到(部分超過)預期目標。同時,項目組注意到高維對象異化機理挖掘研究工作已受到了國內外學者的關注,並開展了相關研究工作。項目組認為,高維對象異化機理挖掘已形成了一個新的學術創新源頭,將有更多的學者關注此問題,產出新成果。