隨著生物數據的急劇增長,計算機技術的日新月異以及現代生物信息學的快速發展,以計算機為工具對生物信息進行儲存、檢索和分析的科學。運用生物信息學分析技術對該基因的結構特徵、編碼蛋白的生化性質、定位、生物學功能等進行了預測,它是當今生命科學和自然科學的重大前沿領域之一,同時也將是21世紀自然科學的核心領域之一。
基本介紹
- 中文名:角毛殼菌蛋白質結構
- 分子量:7.83
- 等電點為:24.727kD
- 材料:角毛殼菌菌絲體
基因的蛋白質結構,一級結構,二級結構,結論,
基因的蛋白質結構
在以角毛殼菌菌絲體(Chaetomium cupreum)為材料一,得到條長度為690bp的開放閱讀框(ORF),可編碼229個胺基酸的木聚糖酶基因。BLASTX分析表明,該基因與Scytalidium thermophilum菌株的木聚糖酶基因具有最高的同源性,為61%。該基因是一條新發現的endo-1,4-beta-xylanase基因。該序列已收錄於Genebank,登錄號為DQ。並對該基因進行了生物信息學分析。
【Abstract】 In order to Chaetomium cupreum as materials, have a length of 690bp ORF, coding for 229 amino acids. BLASTX analysis showed that the gene and Scytalidium thermophilum strains xylanase gene has the highest homology of 61%. The gene is a newly discovered endo-1 ,4-beta-xylanase gene. The sequence has been included in the Genebank, accession number of DQ. And the gene of bioinformatics analysis.
一級結構
1.角毛殼菌木聚糖酶基因的核苷酸序列分析
該木聚糖酶基因開放讀碼框由起始密碼子ATG至終止密碼子TAA,共有690個鹼基組成,編碼229個胺基酸,含有1個內含子,ProtParam分析表明該蛋白的分子量為24.7kD,理論等電點為7.83。分子式為C1105H1620N306O340S3。不穩定係數為17.47,因此,該木聚糖酶是穩定的蛋白質。
2. 分子量和等電點預測
運用Compute pI/Mw軟體對木聚糖酶基因的等電點進行預測,結果表明,該蛋白質分子以雙極離子存在,總淨電荷為零,顆粒無電荷間的排斥作用,易凝集成大顆粒,因而最不穩定,溶解度最小,易沉澱析出。在等電點外的所有其他pH值,依據蛋白質所帶淨電荷採用電泳和離子交換層析來分離和分離純化該蛋白質。經分析該蛋白分子量為7.83,等電點為24.727kD。
二級結構
1.角毛殼菌木聚糖酶基因的同源性分析
序列同源性分析,是將待研究序列加入到一組與之同源,但來自不同物種的序列中進行多序列同時比較,以確定該序列與其它序列間的同源性大小,通過序列同源性的比較進而了解基因的進化以及生物系統發生的內在規律。值得注意的是,相似性和同源性雖然在某種程度上具有一致性,但它們是完全不同的兩個概念。相似性是指一種很直接的數量關係,比如部分相同或相似的百分比或其它一些合適的度量,而同源性是指從一些數據中推斷出的兩個基因在進化上曾具有共同祖先的結論,它是質的判斷。基因之間要么同源,要么不同源,絕不象相似性那樣具有多或少的數量關係。
運用blastn suite軟體:按照“>sequence n基因序列”格式分別將下述基因序列輸人blastn suite生物軟體的基因輸入視窗測出角毛殼菌木聚糖酶基因與以下各個基因的同源性,結果如下表所示:
由上表可知:Scytalidium thermophilum菌株與木聚糖酶基因的同源性最高,為61%,具有很高的相似性。
2.角毛殼菌木聚糖基因的保守區預測
經blastp suite軟體預測該木聚糖酶基因屬於糖基水解酶家族11,具有糖基水解酶家族11的保守區結構域。因此,推測該蛋白質具有水解酶的特性。需進一步通過實驗驗證其生物學特性。
2.角毛殼菌木聚糖基因的信號肽預測
運用SignalP 3.0 Server軟體分析該基因的信號肽序列,該軟體是丹麥技術大學的生物序列分析中心開發的,SignalP這個強大的信號肽及其剪下位點檢測工具。該算法基於神經網路方法,用已知信號序列的革蘭氏陰性原核生物、革蘭氏陽性原核生物及真核生物的序列分別作為訓練集。SignalP預測的是分泌型信號肽,而不是那些參與細胞內信號傳遞的蛋白。信號肽signal peptide:常用來特指指導蛋白質跨過內質網的信號。從更廣泛的意義上講,信號肽指的是指導蛋白質尋靶的任何一段連續的胺基酸序列。
序列NN
序列HMM
通過上述兩種模型預測該蛋白質的信號肽具有不同的切割方式,推測其可能為一種分泌型蛋白質,可通過其自身的信號肽引導至胞外進行體外表達,發揮其生物學功能。用SignalP-信號肽預測工具預測該蛋白信號肽機率0.997, 錨定蛋白機率0.000, 最大分隔位點機率是0.342, 位於21與22胺基酸之間。
結論
同時也將是21世紀自然科學的核心領域之一。其研究重點主要體現在基因組學(Genomics)和蛋白學(Proteomics)兩方面,具體說就是從核酸和蛋白質序列出發,分析序列中表達的結構功能的生物信息。