《ROC曲線及其推廣型統計量的研究》是依託中國科學技術大學,由王占鋒擔任項目負責人的青年科學基金項目。
基本介紹
- 中文名:ROC曲線及其推廣型統計量的研究
- 項目類別:青年科學基金項目
- 項目負責人:王占鋒
- 依託單位:中國科學技術大學
中文摘要,結題摘要,
中文摘要
本項目的目標是研究兩分類問題中ROC曲線及其推廣型統計量的性質和套用。ROC曲線是度量標記物或分類器分類能力的一個重要指標。在醫學診斷中,常使用一個權威的指標和它的閾值來確診疾病,該指標稱為金標準變數,但金標準變數常取連續值,且沒有明確的閾值,此時傳統的ROC型統計量不適合來評價標記物的診斷能力。這對ROC型統計量的理論和套用帶來了新的挑戰和研究方向。本項目與傳統的ROC型統計量的研究不同,它基於沒有明確閾值的連續值金標準,探索度量標記物診斷能力的ROC型統計量,特別是研究標記物聯合診斷時的最優組合係數;並在原診斷模型下構造評估新標記物診斷能力的ROC型統計量,研究具有診斷能力的新標記物的選擇方法。另外,基因學中有時把相關功能的基因合為一個集合,稱為基因集合。我們用ROC型統計量來鑑別具有不同表達的基因集合,尋找基因集合的最優線性組合。這些方法都將被套用於實際數據分析。
結題摘要
本項目主要致力於研究兩分類問題中ROC曲線及其推廣型統計量的性質和套用。通過研究文獻中方法的優點和不足,基於套用問題的背景,我們提出了各種數據結構下度量標記物分類能力的ROC型指標: 度量基因集合分類能力的ROC型統計量,度量連續金標準下標記物分類能力的ROC型統計量, 評價新生標記物對提高已存在分類模型能力的ROC型指標和評估帶有測量限制的標記物分類能力的ROC型指標。在不假設標記物的總體分布下, 我們也深入研究了各個ROC型統計量的理論性質,建立計算方法,使得所提方法可以實現,利用數值模擬和實際例子分析來評估了所提各個方法的效果。我們在三年的研究中,共發表和完成(不含完成未被接收)相關論文11篇,其中有9篇為SCI收錄的雜誌。培養出3名碩士, 達到了研究計畫中所提出的技術指標和要求。