《基於機率圖的判別式關係隱層空間模型研究》是依託清華大學,由陳寧擔任項目負責人的青年科學基金項目。
基本介紹
- 中文名:基於機率圖的判別式關係隱層空間模型研究
- 依託單位:清華大學
- 項目負責人:陳寧
- 項目類別:青年科學基金項目
項目摘要,結題摘要,
項目摘要
隱層空間模型可以有效發掘複雜數據的隱含特徵表示,已廣泛用於關係網路數據分析。面向網際網路環境下的海量複雜關係網路數據,本項目擬系統解決基於機率圖的關係隱層空間模型中存在的模型表示、學習與推理、以及模型複雜度等若干基礎性關鍵問題。更具體地說,本項目將:(1)提出基於後驗正則化的廣義關係隱層空間模型,提高傳統關係隱層空間模型在描述對稱和非對稱關係網路以及包含實體對象屬性的關係網路數據的能力和靈活性,克服關係網路中廣泛存在的數據不均衡問題;(2)提出關係隱層空間模型的判別式最大間隔學習方法以及基於數據增廣統計思想的精確推理算法,提高關係隱層空間模型學習判別性的特徵表示的能力及其在連結預測、網路推薦、文本檢索等任務中的預測性能;(3)提出非參數化的廣義關係隱層空間模型,自動確定隱含特徵的數目(即模型複雜度),克服參數化隱層空間模型需要時間代價很高的模型選擇的缺陷。
結題摘要
針對項目任務書的研究目標,本項目系統解決了基於機率圖的關係隱層空間模型中存在的模型表示、學習與推理、以及模型複雜度等若干基礎性關鍵問題,順利完成各項研究任務,取得優良成果。具體地說,本項目:(1)提出了基於後驗正則化的廣義關係隱層空間模型,提高了傳統關係隱層空間模型在描述對稱和非對稱關係網路以及包含實體對象屬性的關係網路數據的能力和靈活性,克服了關係網路中廣泛存在的數據不均衡問題;(2)提出了關係隱層空間模型的判別式最大間隔學習方法以及基於數據增廣統計思想的精確推理算法,提高關係隱層空間模型學習判別性的特徵表示的能力及其在連結預測、網路推薦、文本檢索等任務中的預測性能;(3)提出了非參數化的廣義關係隱層空間模型,自動確定隱含特徵的數目(即模型複雜度),克服了參數化隱層空間模型需要時間代價很高的模型選擇的缺陷。(4)提出了一種判別式的非參數化的隱含特徵關係網路模型,可以自動推斷出可能的隱特徵維度,同時實現連結關係預測。在各種實際網路中的實驗結果證明LFRM模型有廣泛的套用場景和用途。(5)針對機器學習的基本問題特徵提取,提出了一種簡單而高效的方法:最大間隔數據偏移變換。該方法在原始數據中學習一個最大間隔分類器,通過建立一個特徵抽取器,能夠學習適用於分類任務的特徵;(6)面向大數據的套用需求,提出了基於噪聲擾動的支持向量機及羅傑斯特回歸預測方法。該方法高效、簡單,顯著提高模型在二分類、多分類任務中的性能,有望用於海量複雜數據的預測任務中。