多標記數據特徵選擇及其套用的研究

多標記數據特徵選擇及其套用的研究

《多標記數據特徵選擇及其套用的研究》是依託同濟大學,由尤鳴宇擔任項目負責人的青年科學基金項目。

基本介紹

  • 中文名:多標記數據特徵選擇及其套用的研究
  • 項目類別:青年科學基金項目
  • 項目負責人:尤鳴宇
  • 依託單位:同濟大學
中文摘要,結題摘要,

中文摘要

醫學臨床等科學領域中多標記數據的快速增長對多標記建模提出了迫切需求。數據中無關、冗餘特徵損害了模型的泛化能力,因此需對多標記數據進行特徵選擇。已有的特徵選擇技術忽略了類標之間互相關聯和樣本分布不均衡這兩個多標記數據的特點。本項目計畫從中醫臨床診斷多證型病例數據分析的典型套用出發,研究新型的多標記特徵選擇技術:一是融入多標記數據中類標之間的關聯信息;二是消除樣本分布不均衡的影響。新技術將在文本、圖像、蛋白質功能標註等標準評測數據集上測試,並以蔡小蓀等名老中醫臨床診斷病例的主症選擇為示範性套用。通過特徵選擇技術提高多標記數據分析的效果、效率和可理解性。

結題摘要

對照項目計畫書,項目組高質量全面完成了擬定的研究內容。項目組在高水平論文發表、國際學術合作交流、人才培養等方面均超過項目申請書的預期成果要求。 研究內容包括三個方面:1、研究了融入類標關聯信息的多標記特徵選擇新技術,包括結合類標關聯信息的必要性,結合關聯信息的多標記建模,及基於多標記模型的嵌入式特徵選擇;2、研究了減輕樣本分布不均衡影響的多標記特徵選擇新技術,包括各類標對特徵的偏好,減輕分布不均衡影響的特徵選擇,及大數據環境下新的特徵選擇;3、結合醫學臨床數據的特點,將本項目所提出的新技術,套用到中醫診斷的主症選擇上。 項目資助下, 在國際會議上報告 13 篇次。在IEEE TCBB, IEEE T. NanoBioscience, PRL,IJGS,中國科學等期刊接受和發表論文21篇,其中發表的論文中SCI收錄11篇,接受論文中2篇SCI源刊。 受邀為國外著作撰寫2章次。參與組織了國際會議IEEE BIBM2013,連續三年參與組織了中醫信息學研討會,作為客座編輯組織國際刊物一次。項目成果2011年獲得國際信息安全競賽 (CDMC2011)第一名。

相關詞條

熱門詞條

聯絡我們