過程大數據中合意路線獲取關鍵技術研究

《過程大數據中合意路線獲取關鍵技術研究》是依託清華大學,由聞立傑擔任項目負責人的面上項目。

基本介紹

  • 中文名:過程大數據中合意路線獲取關鍵技術研究
  • 依託單位:清華大學
  • 項目負責人:聞立傑
  • 項目類別:面上項目
項目摘要,結題摘要,

項目摘要

該項目旨在開發能處理記錄了在高度變化和異構上下文中被執行過程的海量事件日誌的新型過程挖掘技術。過程挖掘的目標是從事件日誌中抽取過程相關信息,即自動發現一個過程模型。儘管過程挖掘有很多最新進展,但仍然存在很多亟待解決的重要挑戰。事實上,從事件日誌中發現過程模型的難度眾所周知,而且過程挖掘的大規模套用需要重大的突破。該項目旨在進行這些突破,它由三個研究主題組成:一、將開發把過程挖掘問題(如過程發現和複合型檢查)分解為能被更高效解決並且能分布到計算機集群的較小問題的技術;二、為了支持無法在極長一段時間記憶體儲全部事件的套用,將開發不需要存儲過量事件就能夠學習(或檢查)過程模型的即時過程挖掘技術;三、當前的過程挖掘技術要求分析師將範圍限制在描述了穩態下一組同質案例的行為的單一過程模型上,將開發能夠系統地突出共性和差異的可比較過程挖掘技術,以便能夠處理隨著時間發生改變而且有很多變種的異質過程。

結題摘要

隨著包含流程信息的事件日誌大小急劇增長,現有的面向單一事件日誌的單機過程挖掘算法日益面臨著挑戰,分散式過程挖掘、可比較過程挖掘、流式過程挖掘等技術亟待開發。 本項目重點開展了如下研究工作並取得技術突破:(1)在分散式過程挖掘方面,提出了Spark分散式過程挖掘框架,比已有的MapReduce分散式過程挖掘框架在效率上提高10-50倍;(2)在可比較過程挖掘方面,提出了基於可擴展活動間關係的基於頻率等級變化思想的突髮漂移與漸變漂移檢測方法,在檢測精度和檢測效率方面遠超現有方法;(3)在流式過程挖掘方面,提出了基於完備視窗、檢測視窗與遺忘機制的線上/線下過程漂移檢測方法,在檢測精度、檢測效率和檢測及時性方面均處於國際領先地位;(4)在傳統過程挖掘方面,創造性的提出了非自由選擇結構與不可見任務的融合發現方法,以及含多實例標記的分層BPMN模型的挖掘方法;(5)在過程模型相似性度量方面,提出了基於任務發生關係、基於變遷標籤圖編輯距離、基於觸發序列集合、基於變遷緊鄰關係重要性、基於擴展精煉不確定活動關係等系列過程模型相似性度量算法;(6)在日誌完備性分析方面,將日誌全局完備性評估問題建模為種群估計問題,並綜述了十幾種經典的方法。 在項目執行期間,共發表論文24篇,其中SCI檢索5篇、EI檢索24篇,申請國家發明專利2項,獲得軟體著作權2項,獲BPM 2015最佳學生論文獎(大陸首次),舉辦中國業務過程管理大會四次(參加總人數約320人),參加BPM、CAiSE、CIKM、ICSOC、CoopIS等國際會議8次(共12人次),培養碩士畢業生10人、博士畢業生1人,其中汪抒浩同學獲2016年度清華大學校級優秀碩士畢業生榮譽稱號、肖永博同學獲2017年度清華大學優秀碩士畢業論文,項目負責人作為大陸唯一成員入選IEEE過程挖掘工作組XES標準化小組,全面參與制定IEEE XES標準制定(標準號:IEEE 1849-2016)。 項目成果有望在Web訪問日誌分析與頁面重構、軟體使用行為分析與最佳化、業務流程日誌分析與模型改進、分散式事件日誌挖掘等領域進行推廣套用。

相關詞條

熱門詞條

聯絡我們