基本介紹
- 外文名:Definition of Secondary Structure of Proteins
- 簡稱:DSSP
- 設計者:Wolfgang Kabsch和Chris Sander
- 屬性:標準化算法
簡介,算法原理,
簡介
DSSP資料庫是由此算法生成的一個存放蛋白質二級結構分類數據的資料庫,其中包括了PDB資料庫(Protein Data Bank)中的所有條目。算法名稱Define Secondary Structure of Proteins由作者在其原始論文中,作為實現該算法的Pascal語言程式名稱所提及。DSSP資料庫英文全稱則為Definition of Secondary Structure of Proteins。
算法原理
DSSP算法使用PDB格式的原子級解析度的蛋白質三維結構坐標集數據,依靠以靜電學定義進行的氫鍵識別,以及對主鏈和側鏈二面角的計算,從而得到每個胺基酸殘基的二級結構構象參數。算法使用的鍵能公式為:
E=q1q2{1/rON+1/rCH-1/rOH-1/rCN}·332 kcal/mol
其中q1=0.42,q2=0.20。以上參數來自分別為-0.42e和+0.20e的羰基氧原子和氨基氫原子間的局部電荷、以及羰基碳原子和氨基氮原子間的互斥電荷。當鍵能小於-0.5 kcal/mol時,DSSP算法將其定義為一個氫鍵。DSSP根據氫鍵模式,可以識別八種類型的二級結構構像,各構像擁有各自的標識符。這八種構像為:310螺旋,α-螺旋,π-螺旋三種螺旋,分別以G、H和I標識,它們的識別特徵是殘基與主鏈中分別3、4、5個後續殘基間形成氫鍵並產生重複序列;兩種β-摺疊片中的氫鍵對類型,平行與反向平行橋中,單獨的橋結構標識為B,即β-橋,含有β-凸起的摺疊片標識為E;在其餘構像種,包含即具有螺旋典型特徵,連線螺旋與摺疊結構的轉角區域表示為T,具有高曲率,即從第i個主鏈α碳原子指向第i+2個的向量與從第i-2個α碳原子指向第i個的向量間夾角小於70°的區域標識為S,這也是程式中唯一不依靠氫鍵分類的構像,剩餘的環狀區域標識為L。
這八種構像在實用中又常被歸為三個大類:螺旋(G、H和I)、摺疊(E和B)以及環狀結構(其餘所有標識符)。