相似性指數分析法原理
自CramerIII在1988年創建比較分子力場分析(CoMFA)方法以來,CoMFA已經發展成為定量結構與活性相關技術(QSAR)研究中使用最廣泛且最有力的工具之一,它主要用於研究分子周圍的非鍵分子場(立體場與靜電場)改變時,其相應的活性所發生的變化。1994年,Klebe等提出相似性指數分析(CoMSIA)方法,該方法是CoMFA的一種擴展,兩者的原理基本相同,都基於如下假設:分子的鍵親合力改變時,其相應的分子性質也發生相應變化,其分子性質以分子場的形式表現。在CoMSIA中,由於採用了與距離相關的Gaussian函式形式計算各種分子場,有效避免了分子表面附近格點上勢能的顯著變化以及原子位置異常的情況;另外,在CoMSIA中,也不再需要定義能量的截斷值(Cut-off)。CoMSIA與CoMFA相比,其不同分子場在相應空間的貢獻的相關性等值面圖得到明顯改善,可以更為直觀的解釋不同分子場對分子活性的影響。
相似性指數分析法分析過程
在進行CoMSIA分析時,首先在疊合後的所有分子集合區產生邊長為0.2A的格點,並用4A的邊界確定所有疊合分子的區域。用CoMSIA提供的預設探針計算分子在每個格點上的立體場、靜電場、疏水場、氫鍵場(包括氫鍵受體與氫鍵供體)。得到每個格點的分子場後,用偏最小二乘(PartialLeastSquare,PLS)方法建立分子場參數與親合力的定量相關模型,並用留一法(LeaveOneOut,LOO)互動校驗(CrossValidation,CV)方法檢驗模型的統計顯著性以及確定模型的主成分數,以最優的互動校驗值確定的主成分數建立非互動校驗的3D-QSAR模型,並以此預測測試集中化合物的親合力。
相似性指數分析法的套用實例
利用定量結構與活性相關技術(QSAR)能夠實現基於分子結構對可疑雌激素類化合物進行活性預測和篩選,然後再進行進一步
生態風險評價。
三維結構-活性關係方法(3D-QSAR),如比較分子力場分析(CoMFA),通過模擬化合物與受體分子的相互作用,分析疊合分子周圍三維空間內力場(立體場、靜電場等)的變化來研究結構-活性關係,並能夠揭示化合物
生物活性的作用機制,因此在環境科學和生態毒理學等領域得到了越來越多的套用。如Tong等人和Waller用比較分子力場方法分別對不同數據集雌激素類化合物的活性進行預測,均得到了具有一定預測能力的定量模型。但這些研究主要側重於對雌激素類化合物的活性進行預測,而對影響活性的分子結構特徵,尤其從配體與受體相互作用的角度研究影響配體活性的受體結合腔中關鍵
胺基酸殘基方面並沒有進行詳細闡述。
相對於比較分子力場分析方法,相似性指數分析法(CoMSIA)是較晚建立的一種3D-QSAR方法。其理論基礎為具有相同作用機理的系列化合物的
生物活性取決於配體和受體之間非鍵相互作用力強弱的變化,而作用力強弱的變化來自於每個配體化合物周圍分子力場的變化,與比較分子力場分析方法相比,CoMSIA方法可以同時描述分子周圍立體場、靜電場、疏水場、氫鍵供體場和氫鍵受體場的變化,更加全面地揭示影響生物活性的分子結構信息。
無論是CoMFA還是COMSIA方法,對所研究的化合物進行分子疊合是至關重要的一步。而雌激素類化合物來源廣泛、結構複雜,因此對這類化合物(尤其對柔性分子)進行分子疊合時難以確定疊合規則。通過模擬化合物與受體分子的對接過程,確定配體在受體結合腔中的三維活性構象,以此進行分子疊合,確定分子的柔性疊合規則,然後套用比較分子相似性指數分析(CoMSIA)研究雌激素類化合物結構與活性之間的關係,建立了具有顯著預測能力的雌激素類化合物活性預測模型。同時闡明了影響雌激素類化合物活性的分子結構特徵,並且揭示了起關鍵作用的受體結合腔中的
胺基酸殘基以及這些胺基酸殘基與配體化合物作用的具體方式。
化合物與活性數據
研究對象包括雌二醇(E2)、雌酮(E1)、雌三醇(E3)及其衍生物、抗雌激素藥物、
植物雌激素和1,2-二苯乙烯雌激素等共44個化合物,其中37個化合物為訓練集,其餘7個化合物為測試集。雌激素活性指標為
雌激素受體相對親和力的對數(logRBA),活性數據及具體測定方法取自文獻。
分子結構模擬
第6號化合物17β-雌二醇、第38號化合物己烯雌酚(DES)、第41號化合物它莫西芬(Tamoxifen)和第44號化合物雷洛昔芬(Raloxifene)的三維結構分別取自它們與雌激素α受體(ERα)複合物的晶體結構。其他化合物的三維結構以17β-雌二醇化合物的結構為基礎,採用SYBYL7。
分子模擬軟體構建
採用Gasteiger-Hückel方法計算原子電荷,採用Tripos標準分子力場進行最佳化,能量收斂標準為0.001kcal·mol-1(1cal=4.186J),得到能量最低構象。
柔性分子疊合
採用SYBYL7.3軟體中的Surflex-Dock程式對雌激素類化合物與雌激素α受體(ERα)進行分子對接。Surflex-Dock以CH4,C=O,N-H為分子探針,確定受體結合腔,將配體小分子與受體進行柔性對接。然後用綜合考慮了極性作用、疏水作用、熵和溶劑化等因素的得分函式對配體和受體相互作用進行評分,得分最高的配體在結合腔中的構象作為該配體的最終活性構象。用Surflex-Dock分別對17β-雌二醇與受體蛋白複合物(PDBID:1ERE)和
己烯雌酚(DES)與受體蛋白複合物(PDBID:3ERD)進行對接,閾值(threshold)設為0.5,膨脹係數(bload)設為1,對接後17β-雌二醇和己烯雌酚(DES)在結合腔中的位置與它們在1ERE和3ERD中的位置的均方根偏差(RMSD)分別為0.155和0.482,這說明對接非常成功。然後將其他雌激素類化合物以相同的方式分別與雌激素α受體(PDBID:1ERE)進行分子對接。分子疊合後所有雌激素類化合物用於比較分子相似性指數分析(COMSIA)。
比較分子相似性指數分析
比較分子相似性指數分析(COMSIA)用來計算分子周圍格線交叉點上的相似性指數。採用偏最小二乘回歸分析(PLS)建立雌激素類化合物活性與結構之間的定量關係,以“逐一剔除”(LOO)和SAMPLS程式確定最佳主成分數PCs,然後再計算非交叉驗證相關係數R2。用非交叉驗證相關係數(R2)、標準估計誤差(SEE)和F-檢驗值(F-test)表征模型的擬合程度。用交叉驗證相關係數(Q2LOO)和標準預測誤差(SEP)表征模型的穩健性。用樣本外測試集相關係數(R2pred)和外部驗證係數(Q2EXT)表征模型的預測能力。