功能
PDB是目前最主要的收集生物大分子(蛋白質、
核酸和糖)2.5維(以二維的形式表示三維的數據)結構的資料庫,是通過
X射線單晶衍射、
核磁共振、
電子衍射等實驗手段確定的蛋白質、多糖、核酸、病毒等生物大分子的三維結構資料庫。隨著
晶體衍射技術的不斷改進,結構測定的速度和精度也逐步提高。90年代以來,隨著多維核磁共振溶液構象測定方法的成熟,使那些難以結晶的蛋白質分子的結構測定成為可能。蛋白質分子結構資料庫的數據量迅速上升。據2000年5月統計,PDB資料庫中已經存放了1萬2千多套原子坐標,其中大部分為蛋白質,包括多肽和病毒。此外,還有核酸、蛋白和核酸複合物以及少量多糖分子。核酸三維結構測定進展迅速。PDB資料庫中已經收集了800多套
核酸結構數據。
PDB資料庫允許用戶用各種方式以及
布爾邏輯組合(AND、OR和NOT)進行檢索,可檢索的欄位包括功能類別、PDB代碼、名稱、作者、
空間群、解析度、來源、入庫時間、分子式、參考文獻、生物來源等項。用戶不僅可以得到生物大分子的各種注釋、坐標、三維圖形、VAML等,並能從一系列指針連線到與PDB有關的資料庫,包括SCOP、CATH、
Medline、ENZYME、SWISS-3DIMAGE等。可通過FTP下載PDB數據。所有的PDB檔案均有壓縮和非壓縮版以適套用戶傳輸需要。PDB的電子公告版BBS和電子郵件興趣小組(Mailing List)為用戶提供了交流經驗和發布新聞的空間。在PDB的伺服器上還提供與
結構生物學相關的多種免費軟體如Rasmol、Mage、PDBBrowser、3DB Brower等。
特點
PDB資料庫以文本檔案的方式存放數據,每個分子各用一個獨立的檔案。除了原子坐標外,還包括物種來源、化合物名稱、結構遞交以及有關文獻等基本注釋信息。此外,還給出解析度、
結構因子、溫度係數、蛋白質主鏈數目、
配體分子式、
金屬離子、
二級結構信息、
二硫鍵位置等和結構有關的數據。
為PDB資料庫以
文本檔案格式存放,故可以用文字編輯軟體查看。顯然,用文字編輯軟體查看注釋信息不太方便。更無法直觀地了解分子的空間結構。RCSB開發的基於Web的PDB資料庫概要顯示系統。只列出主要信息,用戶如須進一步了解詳細信息,或查詢其他
蛋白質結構信息資源,可點擊該頁面左側視窗中的按鈕。此外,
英國倫敦大學開發的PDBsum資料庫是基於網路的PDB注釋信息綜合資料庫。用於對PDB資料庫的檢索。使用十分方便。它將RasMol、CN3D等分子
圖形軟體綜合在一起,同時具有分析和圖形顯示功能。
數據格式
每個PDB檔案可能分割成一系列行,由行
終止符終止。在記錄檔案中每行由80列組成。每條PDB記錄末尾標誌應該是行終止符。PDB檔案中每行都是自我識別的。每行的前六列存放記錄名稱,左對齊空格補足.必須和規定的記錄名稱一致。PDB檔案也可看成是各種記錄類型的總和。每個記錄類型包括一行或多行又被更深一層分成各欄位。以下是PDB檔案存儲數據格式的一個完整簡潔的說明:
標題部分
1 HEADER(分子類,公布日期、ID號)
2 OBSLTE (註明此ID號已改為新號)
3 TITLE(說明實驗方法類型)
4 CAVEAT(可能的錯誤提示)
5 COMPND(化合物分子組成)
6 SOURCE(化合物來源)
7 KEYWDS(關鍵字)
8 EXPDTA(測定結構所用的實驗方法)
9 AUTHOR(結構測定者)
10 REVDAT(修訂日期及相關內容)
11 SPRSDE(已撤銷或更改的相關記錄)
12 JRNL(發表坐標集的文獻)
13 REMARK
REMARK 1(有關文獻)
REMARK 3(用到的程式和統計方法)
REMARK 4-999
一級結構
1 DBREF (其他序列庫的有關記錄)
2 SEQADV ( PDB與其他記錄的出入)
3 SEQRES (殘基序列)
4 MODRES (對標準殘基的修飾)
雜因子
1 HET(非標準殘基)
2 HETNAM(非標準殘基的名稱)
3 HETSNY (非標準殘基的同義字)
4 FORMOL(非標準殘基的化學式)
1 HELIX(螺旋)
3 TURN(轉角)
連線注釋
2 LINK(殘基間化學鍵)
5 CISPEP(順式殘基)
2 ORIGXn(直角-PDB坐標)
4 MTRIXn(非晶相對稱)
5 TVECT(轉換因子)
坐標部分
1 MODEL(多亞基時示亞基號)
2 ATOM(標準基團的原子坐標)
3 SIGATM(標準差)
4 ANISOU(溫度因子)
5 SIGUIJ(各種溫度因素導致的標準差)
6 TER(鏈末端)
7 HETATM(非標準基團原子坐標)
8 ENDMDL(亞基結束)
連通性部分
CONECT(原子間的連通性有關記錄)