DSSP 是用于對蛋白質(zhì)結(jié)構(gòu)中的氨基酸殘基進行二級結(jié)構(gòu)構(gòu)像分類的標準化算法,由Wolfgang Kabsch和Chris Sander設(shè)計。

簡介

DSSP數(shù)據(jù)庫是由此算法生成的一個存放蛋白質(zhì)二級結(jié)構(gòu)分類數(shù)據(jù)的數(shù)據(jù)庫,其中包括了PDB數(shù)據(jù)庫(Protein Data Bank)中的所有條目。算法名稱Define Secondary Structure of Proteins由作者在其原始論文中,作為實現(xiàn)該算法的Pascal語言程序名稱所提及。DSSP數(shù)據(jù)庫英文全稱則為Definition of Secondary Structure of Proteins。

算法原理

DSSP算法使用PDB格式的原子級分辨率的蛋白質(zhì)三維結(jié)構(gòu)坐標集數(shù)據(jù),依靠以靜電學(xué)定義進行的氫鍵識別,以及對主鏈和側(cè)鏈二面角的計算,從而得到每個氨基酸殘基的二級結(jié)構(gòu)構(gòu)象參數(shù)。算法使用的鍵能公式為:

E=q1q2{1/rON+1/rCH-1/rOH-1/rCN}·332 kcal/mol

其中q1=0.42,q2=0.20。以上參數(shù)來自分別為-0.42e和+0.20e的羰基氧原子和氨基氫原子間的局部電荷、以及羰基碳原子和氨基氮原子間的互斥電荷。當(dāng)鍵能小于-0.5 kcal/mol時,DSSP算法將其定義為一個氫鍵。DSSP根據(jù)氫鍵模式,可以識別八種類型的二級結(jié)構(gòu)構(gòu)像,各構(gòu)像擁有各自的標識符。這八種構(gòu)像為:310螺旋,α-螺旋,π-螺旋三種螺旋,分別以G、H和I標識,它們的識別特征是殘基與主鏈中分別3、4、5個后續(xù)殘基間形成氫鍵并產(chǎn)生重復(fù)序列;兩種β-折疊片中的氫鍵對類型,平行與反向平行橋中,單獨的橋結(jié)構(gòu)標識為B,即β-橋,含有β-凸起的折疊片標識為E;在其余構(gòu)像種,包含即具有螺旋典型特征,連接螺旋與折疊結(jié)構(gòu)的轉(zhuǎn)角區(qū)域表示為T,具有高曲率,即從第i個主鏈α碳原子指向第i+2個的向量與從第i-2個α碳原子指向第i個的向量間夾角小于70°的區(qū)域標識為S,這也是程序中唯一不依靠氫鍵分類的構(gòu)像,剩余的環(huán)狀區(qū)域標識為L。

這八種構(gòu)像在實用中又常被歸為三個大類:螺旋(G、H和I)、折疊(E和B)以及環(huán)狀結(jié)構(gòu)(其余所有標識符)。