基於機器學習的軟體度量分析

基於機器學習的軟體度量分析

《基於機器學習的軟體度量分析》是依託南京大學,由黎銘擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:基於機器學習的軟體度量分析
  • 項目類別:青年科學基金項目
  • 項目負責人:黎銘
  • 依託單位:南京大學
項目摘要,結題摘要,

項目摘要

機器學習已成為各領域中進行智慧型數據分析的重要途徑。在軟體度量分析中,多種經典機器學習技術已被用於分析現有度量與所關注的目標之間的關係,從建立的模型中可發現與所關注目標密切相關的關鍵度量。然而,大多數軟體度量分析任務中的數據均不滿足經典機器學習方法奏效所依賴的假設,從而會導致預測模型不能完全反映真實規律。本課題擬對適合於軟體度量分析任務特點的學習建模方法進行研究,提出一種能夠主動地從備選樣本空間有選擇性地採樣並獲取標記以供學習的學習方法;提出一種能夠利用大量難以獲得標記的樣本提升學習能力的學習方法;提出一種對目標類錯誤分類代價敏感的學習方法;提出一種能夠針對目標類樣本比例較小的數據進行有效學習的學習方法;並基於上述理論成果建立反映現有軟體度量與程式缺陷之間關係的預測模型。本課題可望在重要國際期刊、會議和國內一級學報上發表高質量論文4-6篇,申請國家發明專利1-2項,培養研究生2-3名。

結題摘要

本項目對基於機器學習的軟體度量分析方法進行了研究,完成了原定研究計畫並取得了以下主要成果:1、提出了能夠主動從備選樣本空間中有選擇性地挑選樣本並獲取標記的主動半監督學習方法;2、提出能夠利用大量難以獲得標記的樣本提升學習能力的半監督集成學習方法等;3、提出能夠有效降低預測模型的期望類別錯分代價同時降低所需標記樣本數量的代價敏感半監督學習方法;4、提出能夠在標記訓練樣本很少時針對目標類樣本比例較小的數據進行有效學習的方法;5、建立了反映現有軟體度量與軟體缺陷之間關係的預測模型,基於此挖掘出影響軟體缺陷性的關鍵度量。在重要國際期刊和會議上以及國內一級學報等發表論文12篇,包括《Automated Software Engineering》等軟體工程領域國際著名期刊以及AAAI、ECML等一流國際會議,申請國家發明專利1項,主編國際論文集2部,在境內組織國際研討會2次。人才培養方面取得良好進展。

相關詞條

熱門詞條

聯絡我們