簡(jiǎn)介
測(cè)序法已經(jīng)成為一種常規(guī)的實(shí)驗(yàn)技術(shù),不過(guò)最近新一代測(cè)序技術(shù)的顯著優(yōu)勢(shì),比如大規(guī)模平行信號(hào)(MPSS, Brenner et al.2000)和焦磷酸測(cè)序法(也稱(chēng)454測(cè)序; Margulies et al.2005, Langaee and ronaghi2005)已經(jīng)使測(cè)序技術(shù)發(fā)生了徹底的變革,它們可以同時(shí)對(duì)數(shù)百萬(wàn)個(gè)短序列讀長(zhǎng)進(jìn)行測(cè)序。盡管面臨著來(lái)自生物信息學(xué)方面的挑戰(zhàn),但是這些技術(shù)為探索更多生態(tài)學(xué)與進(jìn)化問(wèn)題提供了更多的機(jī)會(huì),其中包括對(duì)生物多樣性的分析( Venter etal.2004)。此外,二代測(cè)序技術(shù)是最不可能由于操作不當(dāng)、缺失、稀有轉(zhuǎn)錄及克隆細(xì)菌不穩(wěn)定的原因而產(chǎn)生錯(cuò)誤的。技術(shù)進(jìn)步使得這一方法變得不斷可靠( Hamady et al.2008),絕大多數(shù)的轉(zhuǎn)錄表達(dá)(包括那些表達(dá)量極少的轉(zhuǎn)錄本)都能夠被精準(zhǔn)地定量( StoloⅦ itzky etal.2005)。隨著序列讀長(zhǎng)的增加,454焦磷酸測(cè)序法的使用頻率將大增,能進(jìn)一步增加在非模式物種中鑒定基因的概率( Hudson2008)。由于測(cè)序的讀長(zhǎng)較短,這項(xiàng)技術(shù)最初只能用于已測(cè)序的模式物種。
名詞解釋
根據(jù)發(fā)展歷史、影響力、測(cè)序原理和技術(shù)不同等,主要有以下幾種:大規(guī)模平行簽名測(cè)序(Massively Parallel Signature Sequencing, MPSS)、聚合酶克?。≒olony Sequencing)、454焦磷酸測(cè)序(454 pyrosequencing)、Illumina (Solexa) sequencing、ABI SOLiD sequencing、離子半導(dǎo)體測(cè)序(Ion semiconductor sequencing)、DNA 納米球測(cè)序(DNA nanoball sequencing)等。
高通量測(cè)序技術(shù)是對(duì)傳統(tǒng)測(cè)序一次革命性的改變,一次對(duì)幾十萬(wàn)到幾百萬(wàn)條DNA分子進(jìn)行序列測(cè)定,因此在有些文獻(xiàn)中稱(chēng)其為下一代測(cè)序技術(shù)(next generation sequencing)足見(jiàn)其劃時(shí)代的改變,同時(shí)高通量測(cè)序使得對(duì)一個(gè)物種的轉(zhuǎn)錄組和基因組進(jìn)行細(xì)致全貌的分析成為可能,所以又被稱(chēng)為深度測(cè)序(deep sequencing)。
實(shí)驗(yàn)過(guò)程
1.樣本準(zhǔn)備(sample fragmentation)
2.文庫(kù)構(gòu)建(library preparation)
3.測(cè)序反應(yīng)(sequencing reaction)
4.數(shù)據(jù)分析(data analysis)
測(cè)序平臺(tái)
自從2005年454 Life Sciences公司(2007年該公司被Roche正式收購(gòu))推出了454 FLX焦磷酸測(cè)序平臺(tái)(454 FLX pyrosequencing platform)以來(lái),因?yàn)樗麄兊娜^產(chǎn)品毛細(xì)管陣列電泳測(cè)序儀系列(series capillary array electrophoresis sequencing machines)遇到了兩個(gè)強(qiáng)有力的競(jìng)爭(zhēng)對(duì)手,曾推出過(guò)3730xl DNA測(cè)序儀(3730xl DNA Analyzer)的Applied BioSystem(ABI)這家一直占據(jù)著測(cè)序市場(chǎng)最大份額的公司的領(lǐng)先地位就開(kāi)始動(dòng)搖了,一個(gè)就是羅氏公司(Roche)的454 測(cè)序儀(Roch GS FLX sequencer),,另一個(gè)就是2006年美國(guó)Illumina公司推出的Solexa基因組分析平臺(tái)(Genome Analyzer platform),為此,2007年ABI公司推出了自主研發(fā)的SOLiD 測(cè)序儀(ABI SOLiD sequencer)。這三個(gè)測(cè)序平臺(tái)即為目前高通量測(cè)序平臺(tái)的代表。(見(jiàn)表一)
公司名稱(chēng) | 技術(shù)原理 | 技術(shù)開(kāi)發(fā)者 | 商業(yè)模式 |
Apply Biosystems(ABI) | 基于磁珠的大規(guī)模并行克隆連接DNA測(cè)序法 | 美國(guó)Agencourt私人基因組學(xué)公司(APG) | 上市公司:銷(xiāo)售設(shè)備和試劑獲取利潤(rùn) |
Illumina | 合成測(cè)序法 | 英國(guó)Solexa公司首席科學(xué)家David Bentley | 上市公司:銷(xiāo)售設(shè)備和試劑獲取利潤(rùn) |
Roche | 大規(guī)模并行焦磷酸合成測(cè)序法 | 美國(guó)454 Life Sciences公司的創(chuàng)始人Jonathan Rothberg | 上市公司:銷(xiāo)售設(shè)備和試劑獲取利潤(rùn),該產(chǎn)品已經(jīng)于2013年停產(chǎn)。 |
Helicos | 大規(guī)模并行單分子合成測(cè)序法 | 美國(guó)斯坦福大學(xué)生物工程學(xué)家Stephen Quake | 上市公司:2007年5月首次公開(kāi)募股(IPO)(P.S.由于該平臺(tái)準(zhǔn)確率太低等原因,該公司已于2012年宣告破產(chǎn)) |
Complete Genomics | DNA納米陣列與組合探針錨定連接測(cè)序法 | 美國(guó)Complete Genomics公司首席科學(xué)家radoje drmanac | 私人公司:投資額為4650萬(wàn)美元,該公司于2013年被華大基因收購(gòu)。 |
表一:主流測(cè)序平臺(tái)一覽
Roche 454焦磷酸測(cè)序
(pyrophosphate sequencing)
Illumina Solexa 合成測(cè)序
(sequence by synthesize)
Illumina Genome AnalyzerIIx測(cè)序原理
Illumina公司的新一代測(cè)序儀Hiseq 2000和Hiseq 2500具有高準(zhǔn)確性,高通量,高靈敏度,和低運(yùn)行成本等突出優(yōu)勢(shì),可以同時(shí)完成傳統(tǒng)基因組學(xué)研究(測(cè)序和注釋?zhuān)┮约肮δ芑蚪M學(xué)(基因表達(dá)及調(diào)控,基因功能,蛋白/核酸相互作用)研究。Hiseq是一種基于單分子簇的[1]技術(shù),基于專(zhuān)有的可逆終止化學(xué)反應(yīng)原理。測(cè)序時(shí)將基因組DNA的隨機(jī)片段附著到光學(xué)透明的玻璃表面(即Flow cell),這些DNA片段經(jīng)過(guò)延伸和橋式擴(kuò)增后,在Flow cell上形成了數(shù)以?xún)|計(jì)Cluster,每個(gè)Cluster是具有數(shù)千份相同模板的單分子簇。然后利用帶熒光基團(tuán)的四種特殊脫氧核糖核苷酸,通過(guò)可逆性終止的SBS(邊合成邊測(cè)序)技術(shù)對(duì)待測(cè)的模板DNA進(jìn)行測(cè)序。
ABI SOLiD連接法測(cè)序
(sequence by ligation)
技術(shù)應(yīng)用
測(cè)序技術(shù)推進(jìn)科學(xué)研究的發(fā)展。隨著第二代測(cè)序技術(shù)的迅猛發(fā)展,科學(xué)界也開(kāi)始越來(lái)越多地應(yīng)用第二代測(cè)序技術(shù)來(lái)解決生物學(xué)問(wèn)題。比如在基因組水平上對(duì)還沒(méi)有參考序列的物種進(jìn)行從頭測(cè)序(de novo sequencing),獲得該物種的參考序列,為后續(xù)研究和分子育種奠定基礎(chǔ);對(duì)有參考序列的物種,進(jìn)行全基因組重測(cè)序(resequencing),在全基因組水平上掃描并檢測(cè)突變位點(diǎn),發(fā)現(xiàn)個(gè)體差異的分子基礎(chǔ)。在轉(zhuǎn)錄組水平上進(jìn)行全轉(zhuǎn)錄組測(cè)序(whole transcriptome resequencing),從而開(kāi)展可變剪接、編碼序列單核苷酸多態(tài)性(cSNP)等研究;或者進(jìn)行小分子RNA測(cè)序(small RNA sequencing),通過(guò)分離特定大小的RNA分子進(jìn)行測(cè)序,從而發(fā)現(xiàn)新的microRNA分子。在轉(zhuǎn)錄組水平上,與染色質(zhì)免疫共沉淀(ChIP)和甲基化DNA免疫共沉淀(MeDIP)技術(shù)相結(jié)合,從而檢測(cè)出與特定轉(zhuǎn)錄因子結(jié)合的DNA區(qū)域和基因組上的甲基化位點(diǎn)。
這邊需要特別指出的是第二代測(cè)序結(jié)合微陣列技術(shù)而衍生出來(lái)的應(yīng)用--目標(biāo)序列捕獲測(cè)序技術(shù)(Targeted Resequencing)。這項(xiàng)技術(shù)首先利用微陣列技術(shù)合成大量寡核苷酸探針,這些寡核苷酸探針能夠與基因組上的特定區(qū)域互補(bǔ)結(jié)合,從而富集到特定區(qū)段,然后用第二代測(cè)序技術(shù)對(duì)這些區(qū)段進(jìn)行測(cè)序。目前提供序列捕獲的廠(chǎng)家有Agilent和Nimblegen ,應(yīng)用最多的是人全外顯子組捕獲測(cè)序。科學(xué)家們目前認(rèn)為外顯子組測(cè)序比全基因組重測(cè)序更有優(yōu)勢(shì),不僅僅是費(fèi)用較低,更是因?yàn)橥怙@子組測(cè)序的數(shù)據(jù)分析計(jì)算量較小,與生物學(xué)表型結(jié)合更為直接。
目前,高通量測(cè)序開(kāi)始廣泛應(yīng)用于尋找疾病的候選基因上。內(nèi)梅亨大學(xué)的研究人員使用這種方法鑒定出Schinzel-Giedion 綜合征中的致病突變,Schinzel-Giedion綜合征是一種導(dǎo)致嚴(yán)重的智力缺陷、腫瘤高發(fā)以及多種先天性畸形的罕見(jiàn)病。他們使用Agilent SureSelect序列捕獲和SOLiD對(duì)四位患者的外顯子組進(jìn)行測(cè)序,平均復(fù)蓋度為43倍,讀長(zhǎng)為50 nt,每個(gè)個(gè)體產(chǎn)生了2.7-3 GB可作圖的序列數(shù)據(jù)。他們聚焦于全部四位患者都攜帶變異體的12個(gè)基因,最終將候選基因縮小至1個(gè)。而貝勒醫(yī)學(xué)院基因組測(cè)序中心也計(jì)劃對(duì)15種以Science雜志年度十大科學(xué)突破上疾病進(jìn)行研究,包括腦癌、肝癌、胰腺癌、結(jié)腸癌、卵巢癌、膀胱癌、心臟病、糖尿病、自閉癥以及其他遺傳疾病,以更好地理解致病突變以及突變對(duì)疾病的影響。前不久剛剛結(jié)束的評(píng)選中,外顯子組測(cè)序名列其中。
以上我們盤(pán)點(diǎn)了2010年第二代測(cè)序技術(shù)的最新進(jìn)展和相關(guān)應(yīng)用。但是除了第二代測(cè)序之外,還有另外一種以單分子實(shí)時(shí)測(cè)序和納米孔為標(biāo)志的第三代測(cè)序技術(shù)也正在如火如荼的發(fā)展中,只是還沒(méi)有正式發(fā)布。所以目前科學(xué)界所說(shuō)的高通量測(cè)序還指的是第二代測(cè)序。
意義
高通量測(cè)序[2]技術(shù)的誕生可以說(shuō)是基因組學(xué)研究領(lǐng)域一個(gè)具有里程碑意義的事件。該技術(shù)使得核酸測(cè)序的單堿基成本與第一代測(cè)序技術(shù)相比急劇下降,?以人類(lèi)基因測(cè)序[3]為例,?上世紀(jì)末進(jìn)行的人類(lèi)基因組計(jì)劃花費(fèi)?30?億美元解碼了人類(lèi)生命密碼,?而第二代測(cè)序使得人類(lèi)基因組測(cè)序已進(jìn)入萬(wàn)(美)元基因組時(shí)代。如此低廉的單堿基測(cè)序成本使得我們可以實(shí)施更多物種的基因組計(jì)劃從而解密更多生物物種的基因組遺傳密碼。同時(shí)在已完成基因組序列測(cè)定的物種中,?對(duì)該物種的其他品種進(jìn)行大規(guī)模地全基因組重測(cè)序也成為了可能。