Chou-Fasman方法是預測蛋白質二級結構的方法。
概念,胺基酸傾向,算法,
概念
Chou-Fasman方法是預測蛋白質二級結構的經驗方法,在1970年由Peter Y. Chou 和 Gerald D. Fasman提出。這種方法基於每個胺基酸在阿爾法螺旋的相對頻率,測試表,和通過X射線晶體學已知的蛋白質結構。從這些頻率、機率參數,可知道每個胺基酸在各個二級結構類型出現,而這些參數是用來預測某一胺基酸序列將形成一個螺旋,一個測試鏈,或一個又一個蛋白質的機率的。該方法在確定正確的二級結構準確性約50-60%,這明顯比現代機器學習技術的準確性要低。
胺基酸傾向
? 原Chou–Fasman參數表現出:一些個體胺基酸具有其他的胺基酸不具備的強烈傾向於形成某一種類型的二級結構。丙氨酸,谷氨酸,亮氨酸和蛋氨酸被確定為螺旋形式。而脯氨酸和甘氨酸,由於它們獨特的構象性質的肽債券,通常呈現一端螺旋。最早的Chou–Fasman參數是從一個非常小的,沒有代表性的簡單蛋白質結構獲取的,因為在他們研究的時候,像這樣的蛋白質結構是非常少為人知的。如今,從各種測序資料、測序論壇中都可以了解到這些參數已被證明是不可靠的,並已經從現在的資料庫中得到數據更新,和算法修改。 Chou–Fasman方法所慮到的只有每個胺基酸會出現在一個螺旋,鏈,或轉化的機率,與之不同的,更複雜的方法是GOR方法,它不能像GOR方法那樣反映胺基酸由於其鄰居已經擁有某種結構而形成獨特的二級結構的機率,這種協同性上的缺乏能增加計算效率,但是卻減少了準確率。因為,傾向於研究個別胺基酸,往往不足已提供一個準確的蛋白質結構預測。
算法
? Chou–Fasman方法通過與鏈預測相似的方法預測螺旋,先搜尋線性序列的高度螺旋的“核”區或鏈機率,然後擴大區域直至隨後4-殘留視窗的機率小於1。最初描述,任何連續六個中四個胺基酸足以核螺旋,任何相鄰五個中的三個有能提供表。螺旋和串成鏈的機率閾值是不變的,但不一定相等,設定為螺旋截止為1.03,鏈截止為1。 對4-殘留輪流進行4-殘留,但對計算使用的是一個多步驟的過程,因為許多轉向區域含有胺基酸,這些胺基酸可能出現可能出現在螺旋或片地區。4-殘留原來也有自己的獨特胺基酸,如,脯氨酸和甘氨酸都是常見的轉。另一側理想預測:本方法的使用是在轉向機率大於螺旋或單機率和機率值的基礎上,並且機率值是在胺基酸打開超過預定閾值的基礎上。轉向機率(噸)被確定為: P(t)=Pt(j) ×Pt(j+1)×Pt(j+2)×Pt(j+3) j是胺基酸在4-殘留視窗的位置;在這個視窗中,如果P(t)超過任意截止值(最初7.5e–3),平均的P(t)的超過1,P(t)超過α螺旋和β片機率,那么,就可以進行這個轉的預測。如果以上兩個條件都滿足,並且P(b)>P(t),那么預測的結果就是計算結果的相反值。
殘基構象傾向性因子定義為:Pi=Ai/Ti(i=a,?,c,t),其中下標i代表構象態;Ti是所有被統計殘基處於第i種構象態的分數;Ai代表第A種殘基的對應分數;當Pi>1.0時,表示該殘基傾向於形成i種構象;當Pi<1.0時,表示該殘基傾向於形成其它構象。殘基所處構象態最初採用Levitt&Greer的判別方法,目前通用的二級結構指任方法則是Kabsch&Sander的氫鍵模式識別方法。