《融合指代消解和遷移學習的蛋白質互動關係抽取的研究》是依託大連理工大學,由李麗雙擔任項目負責人的面上項目。
基本介紹
- 中文名:融合指代消解和遷移學習的蛋白質互動關係抽取的研究
- 依託單位:大連理工大學
- 項目類別:面上項目
- 項目負責人:李麗雙
項目摘要,結題摘要,
項目摘要
蛋白質互動關係的研究是後基因組時代的主要任務,為疾病的診斷、預防、治療和新藥的發現提供依據和啟發。目前其文本挖掘的方法主要是從生物醫學文獻的摘要中抽取關係,但摘要中包含的信息有限,同時指代消解和語料庫的領域適應問題都沒有得到很好解決,致使抽取的性能較低。本項目針對生物醫學文獻全文並採用指代消解技術和遷移學習方法進行蛋白質互動關係抽取。內容主要包括:1.蛋白質名識別及標準化;2.建立基於全文和針對蛋白質互動關係的指代消解模型;3.選擇句子級和篇章級特徵,組合含有領域知識的語義核建立基於全文的關係抽取模型;4.引入遷移學習思想並與主動學習相結合,解決蛋白質互動關係抽取中的領域適應問題。最終獲得高性能的蛋白質互動關係抽取模型。並與領域專家合作,構建肝癌的蛋白質互動關係資料庫及可視化,為肝癌的研究提供分子生物學知識,同時驗證蛋白質互動關係抽取模型的真實有效性。
結題摘要
蛋白質互動關係的研究是後基因組時代的主要任務,為疾病的診斷、預防、治療和新藥的發現提供依據和啟發。本項目著重研究了針對生物醫學文獻全文,採用指代消解技術和遷移學習方法進行蛋白質互動關係抽取。內容主要包括:基於組合分類器的蛋白質名稱識別、整合多種有效方法的多階段蛋白質名稱標準化、組合機器學習和規則方法的指代消解、基於全文的蛋白質互動關係抽取、融合外部語義資源的組合核函式蛋白質互動關係抽取、基於遷移學習與主動學習相結合的蛋白質互動關係抽取以及蛋白質互動關係網路分析平台的構建。最終獲得高性能的蛋白質互動關係抽取模型,以及包括蛋白質名稱識別、標準化、指代消解和關係抽取的可視化系統。並與領域專家合作,構建了癌症相關的蛋白質互動關係資料庫。為癌症的研究提供分子生物學知識,同時驗證了蛋白質互動關係抽取模型的真實有效性。