《集成學習框架下的螢光素酶抑制劑預測研究》是依託浙江大學,由陳浮擔任項目負責人的青年科學基金項目。
基本介紹
- 中文名:集成學習框架下的螢光素酶抑制劑預測研究
- 依託單位:浙江大學
- 項目負責人:陳浮
- 項目類別:青年科學基金項目
項目摘要,結題摘要,
項目摘要
基於螢光素酶報告系統的發光技術是一種重要的體外實驗方法,已在環境科學、化學和醫藥學等領域廣泛套用。然而研究表明:外源污染物如螢光素酶抑制劑對酶發光體系的毒性效應,會導致針對靶標或信號通路的實驗結果出現假陽性。因此,識別螢光素酶抑制劑並評估其效應,對準確分析細胞毒性或信號通路具有十分重要的意義。.生物實驗測試化合物耗時且昂貴。本項目擬在集成學習框架下基於結合自由能建立螢光素酶抑制劑預測模型。首先以生物實驗測定的數十萬個化合物對螢光素酶效應數據為基礎,通過MM/GBSA結合自由能分解建立化合物的分子相互作用能譜矩陣(MIEC);然後基於MIEC,採用梯度提升決策樹建立高精度的抑制劑與非抑制劑分類模型;進一步利用自組織映射分析法對不同結合模式的抑制劑進行聚類,採用隨機森林建立抑制劑的MIEC與半數效應濃度之間的定量構效關係模型。本項目所構建模型極有望有效識別螢光素酶報告基因實驗中潛在的酶抑制劑。
結題摘要
研究表明部分外源污染物會對基於螢光素酶報告系統的發光體系本身產生毒性效應,導致針對靶標或信號通路的實驗結果出現假陽性,如內分泌干擾物的體外篩選實驗等。因此,識別螢光素酶抑制劑並評估其效應,對準確分析細胞毒性或信號通路具有十分重要的意義。本項目以定量高通量篩選實驗獲得的數十萬個化合物的效應數據為基礎,通過多種計算毒理學方法,構建了螢光素酶抑制劑和非抑制劑預測模型。項目構建了不同精度和速度的預測模型:1、 基於相互作用能矩陣的分類預測模型(簡寫為MIEC-GBDT)。基於30個殘基的Evdw, Eele, GGB, GSA構建的MIEC-GBDT模型對測試集中的抑制劑和非抑制劑的預測準確性分別為87.2%和90.3%。2、基於受體相互作用模式的分類預測模型(簡寫為IP-GBDT)。IP-GBDT分類模型對測試集中的抑制劑和非抑制劑的預測精度分別為86.5%和86.3%。該方法相比於MIEC-GBDT損失了一部分預測準確性,但計算速度顯著快於MIEC-GBDT模型。3、 整合分子描述符和分子指紋的高通量虛擬篩選模型(簡寫為MPF-Bayesian)。MPF-Bayesian對平衡數據集(1:1)的抑制劑的預測準確度為90.6%,非抑制劑的預測準確性為92.0%;對不平衡數據集(1:10)的抑制劑的預測準確度為90.8%,非抑制劑的預測準確性為91.1%。該模型雖然損失了小分子與螢光素酶相互作用信息使得抑制機理不清楚,但是由於很快的計算速度和對不平衡數據集的準確預測,該方法適用於螢光素酶抑制劑的高通量虛擬篩選。4、 基於相互作用能矩陣的抑制劑pEC50定量預測模型(簡寫為MIEC-Q)。MIEC-Q模型根據配體-受體結合模式聚類,採用隨機森林法基於特徵能量矢量矩陣(MIEC),實現了對抑制劑pEC50的定量預測。項目成果已發表論文4篇,其中SCI收錄3篇,會議論文1篇。另在審稿論文1篇,在撰寫論文1篇。培養博士生2名,碩士生1名,本科生2名。