《面向對象系統中經濟有效的潛在缺陷模組推薦模型研究》是依託南京大學,由周毓明擔任項目負責人的面上項目。
基本介紹
- 中文名:面向對象系統中經濟有效的潛在缺陷模組推薦模型研究
- 項目類別:面上項目
- 項目負責人:周毓明
- 依託單位:南京大學
項目摘要,結題摘要,
項目摘要
本課題旨在開發經濟有效的潛在缺陷模組推薦模型。該模型的輸出是潛在缺陷模組序列即按照包含缺陷的可能性從大到小排序的模組序列,其中模組為面向對象系統中的類。與傳統的缺陷模組預測模型相比:一方面,該模型建立在原始碼等信息的基礎上,不需要那些花費很長時間和不菲代價才能收集到的歷史缺陷和過程度量信息,因而構建成本低;另一方面,該模型的輸出是潛在缺陷模組序列而不是潛在缺陷模組集,用戶可根據資源的約束情況從該序列中選取適量模組進行代碼審查/軟體測試,因此更為實用。特別地,與隨機選擇模型和基於模組規模的排序模型等相比,當用戶按照該模型推薦的模組序列選擇模組進行審查/測試時,花費同等工作量能發現更多的缺陷。本項目的主要研究內容包括: (1)基於無監督/半監督機器學習的潛在缺陷模組推薦模型研究;(2)基於因果圖的潛在缺陷模組推薦模型研究;(3)潛在缺陷模組推薦模型的實驗驗證;(4)相應工具開發。
結題摘要
在軟體開發中,開發者需要識別潛在的缺陷模組,以便有針對性地進行審查或者測試,從而儘早地找出並修復缺陷。近年來相關研究結果表明,在考慮模組的審查或者測試工作量時,傳統的缺陷預測模型的性能非常差,甚至比不上隨機模型的性能。針對上述問題,本課題試圖開發經濟有效的潛在缺陷模組序列推薦模型,使得其構建成本低、預測有效性高。在課題執行期間,我們重點研究了基於半監督和主動學習的潛在缺陷模組序列預測模型、基於聚類和投票等無監督機器學習方法的潛在缺陷模組序列預測模型、基於因果圖的潛在缺陷模組序列預測,並在多個開源系統上進行了實驗研究。特別地,我們深入了研究了缺陷預測中的模組規模的混和效應問題,發現規模的混和效應普遍存在,並且是導致傳統缺陷預測模型在工作量感知的性能評價下具有很差性能的主要原因。為此,我們提出了一種有效的規模混和效應移除方法。實驗結果表明,在移除規模混和效應後,傳統缺陷預測模型的工作量感知性能得到大幅度提高,明顯優於常用的基準模型,因此具有實用價值。在三年的研究過程中,經過全體課題組成員的共同努力,我們完成了課題的研究內容,總共發表和錄用論文9篇。其中,在國外著名期刊上4篇(包括在國際一流期刊《ACM Transactions on Software Engineering and Methodology》上1篇),在國內著名期刊《中國科學:信息科學F輯》英文版上論文2篇。與此同時,在該課題的支持下,已經有4名碩士研究生以課題的研究內容為畢業論文的內容,順利獲得了工學碩士學位。總體上,課題達到了預期的研究目標和人才培養目標。