《基於自生式多目標Memetic算法的高維數據特徵選擇研究》是依託深圳大學,由朱澤軒擔任項目負責人的青年科學基金項目。
基本介紹
- 中文名:基於自生式多目標Memetic算法的高維數據特徵選擇研究
- 項目類別:青年科學基金項目
- 項目負責人:朱澤軒
- 依託單位:深圳大學
項目摘要,結題摘要,
項目摘要
隨著計算機和資料庫技術的發展,很多研究領域需要處理的數據維度越來越高,特徵選擇被廣泛套用於剔除高維數據中的無關/冗餘特徵,並提高高維數據分析的準確性。對於高維數據特徵子集空間的搜尋問題,大多數傳統搜尋方法都無法在短時間內給出令人滿意的結果。本項目在國內外首次提出一種新型自生式Memetic特徵選擇框架動態自適應地對特徵子集最小化和機器學習性能最大化進行多目標最佳化。通過混合基於封裝方法的生物啟發式全局搜尋和基於過濾方法的局部搜尋,新框架充分結合封裝方法的準確性和過濾方法的快速性,有效提高特徵子集空間的搜尋效率,在一定程度上解決高維數據的特徵選擇問題。該項目的實現將為高維數據特徵選擇提供一個通用框架,可以靈活組合不同的生物啟發式算法、過濾特徵選擇方法和機器學習方法。新框架對於面臨高維數據挑戰的許多前沿研究領域有較高的套用價值,理論研究上屬於國際源頭創新,為解決相關問題提供全新選
結題摘要
隨著計算機和資料庫技術的發展,很多研究領域需要處理的數據維度越來越高,特徵選擇/提取被廣泛套用於識別相關數據特徵,剔除高維數據中的無關/冗餘特徵,提高高維數據處理和分析效率。對於高維數據特徵子集空間的搜尋問題,大多數傳統搜尋方法都無法在短時間內給出令人滿意的結果。本項目研究基於Memetic計算(模因計算)的特徵選擇/抽取框架,動態自適應地對特徵子集最小化和分析準確率最大化進行最佳化。通過混合生物啟發式全局搜尋和元啟發式局部搜尋,新框架充分結合局部搜尋的快速性和全局搜尋的穩定性,有效提高特徵子集空間的搜尋效率。 該項目成果為高維數據特徵選擇/抽取提供通用框架,可以靈活組合不同的生物啟發式算法、過濾特徵選擇方法和數據分析方法。新框架對於面臨高維數據挑戰的許多前沿研究領域有理論價值和潛在套用前景,能在一定程度上解決高維數據的特徵選擇/抽取問題。 項目按照計畫進度正常執行,實際經費支出與預算基本相符,執行期間項目組成員共發表論文31篇,其中包括《IEEE Transactions on Evolutionary Computation》、《Briefings in Bioinformatics》、《Bioinformatics》、《PLoS ONE》等SCI期刊論文10篇,EI論文25篇,出版會議論文集1本,獲得專利1項,軟體著作權2項,超過預期目標。