方法介紹

定位克隆首先是獲取基因在染色體上的位置的信息,然后采用各種實驗方法克隆基因和進行定位?;虻亩ㄎ豢寺〔呗源篌w上可以分成四個步驟。

①通過家系連鎖分析資料或染色體微小缺失(雜合性丟失,LOH)等數(shù)據(jù),確定基因在染色體上的位置;

②通過染色體步移(chromosomewalking)、染色體區(qū)帶顯微切割等技術(shù),獲得基因所在區(qū)段的DNA片段疊連群(contig),繪制出更精細(xì)的染色體圖譜;

③確定含有候選基因的染色體片段;

④從這些片段中進一步篩選目的基因,并作突變檢測驗證和功能分析。

重要地位

當(dāng)前,人類基因組研究的重心正在由“結(jié)構(gòu)”向“功能”轉(zhuǎn)移,一個以基因組功能研究為主要內(nèi)容的所謂“后基因組時代”(post-genomics),也即功能基因組(functionalgenomics)時代,即將到來。如何獲取基因的功能信息,即與人類重大疾病和重要生理功能相關(guān)的基因信息,就擺在了我們面前。定位候選克隆策略(positionalcandidatecloning)是傳統(tǒng)定位克隆(positionalcloning)的改進和發(fā)展,并以其在克隆疾病相關(guān)基因中的有效性而日益受到重視。

人類基因組計劃已確定了一系列分布于全基因組24條染色體上的分子標(biāo)記。根據(jù)這些分子標(biāo)記的序列和定位信息,結(jié)合雜交或PCR的方法可以快速檢測染色體上與腫瘤或遺傳性疾病相關(guān)的熱點位置,進而從中克隆疾病相關(guān)基因。定位候選克隆克服了經(jīng)典的定位克隆純粹依靠連鎖分析進行染色體定位的繁冗而緩慢的弊端,大大加快了克隆工作的進程,而且它也不僅僅局限于遺傳病,現(xiàn)在已更多地運用于腫瘤易感基因的克隆工作。

1994年國際上開始構(gòu)建并于1996年首次公布的基因圖譜是一個以cDNA為基礎(chǔ)的STS(sequence-taggedsite)標(biāo)記的物理圖和多態(tài)性微衛(wèi)星標(biāo)記的遺傳圖相結(jié)合的圖譜,它一方面使染色體定位更加準(zhǔn)確、可靠、精密,同時為從候選區(qū)域內(nèi)獲得疾病相關(guān)的候選基因提供了極大的便利,使得目的基因的克隆更加簡便而快捷,為這種方法的發(fā)展和應(yīng)用注入了更大的活力,表現(xiàn)為此后相繼克隆出16條新的疾病相關(guān)基因,如從胰腺癌中分離得到的抑癌基因DPC4等。1998年10月GeneBank公布了最新的“基因圖譜98”,它的信息量更大,且準(zhǔn)確度和精確度都有大幅度的提高,包含有41464個STS標(biāo)記,代表了30181條基因的定位信息,也即完成了人的全部基因組約6萬~7萬條基因中的一半左右的定位工作??傊S著人類基因組計劃的推進,定位候選克隆已成為一種有效的克隆疾病相關(guān)基因的方法。

基本步驟

綜述

定位候選克隆包括三個基本步驟:基因組定位、候選cDNA的獲得、全長及功能分析。本文即對此策略的發(fā)展和應(yīng)用作一概要介紹。

基因組定位

新發(fā)展起來的,尤其在分離腫瘤易感基因中常用的方法是用PCR方法檢測多樣本的雜合性丟失(LOH)或純合性丟失的高發(fā)頻率區(qū),從而獲得疾病候選基因定位。體細(xì)胞抑癌基因的失活是導(dǎo)致癌變的一個主要因素,最常見的表現(xiàn)即雜合性缺失。通常在染色體上雜合性缺失的高發(fā)頻率區(qū)含有一個或多個抑癌基因。利用散布于各條染色體上的分子標(biāo)記(包括STS、微衛(wèi)星標(biāo)記等),用PCR檢測多個腫瘤樣本的染色體各區(qū)帶的缺失情況,可確定LOH的高發(fā)頻率區(qū),也即確定了相關(guān)腫瘤生長負(fù)調(diào)控因子的染色體定位,并可精確到基因組分子標(biāo)記指示的區(qū)域,進一步可作基因的克隆工作。利用這一方法已成功地克隆了幾個抑癌基因,如乳腺癌中的BRCA1、BRCA2及胰腺癌中的DPC4基因等。同時,F(xiàn)ISH技術(shù)的不斷發(fā)展及推廣應(yīng)用,染色體顯微切割技術(shù)的成熟,可在顯微鏡下切割特定的染色體區(qū)帶,制備染色體區(qū)帶特異探針,對正常和病變組織作FISH分析,比較確定疾病相關(guān)基因的染色體區(qū)帶定位。近些年來,RH譜(radiationhybridmap)的建立,使染色體精細(xì)定位成為可能。這些方法比原先連鎖分析的檢測速度更快、精確度更高。例如L-CTsui用連鎖分析花費了大約10年的時間才把囊性纖維變性基因定位在7號染色體,而現(xiàn)在可能只要一年或更短的時間就可完成這項工作。

候選cDNA的獲得

基因組定位提供的信息包含一定的分子標(biāo)記,可用PCR或雜交的方法直接從YAC(yeastartificialchromosome)庫,或從BAC(bacterialartificialchromosome)庫、PAC(P1artificialchromosome)庫中篩選相對應(yīng)的克隆。YAC庫的嵌合性嚴(yán)重且操作難度較大,已逐步為PAC庫和BAC庫取代。PAC系統(tǒng)是以噬菌體P1為基礎(chǔ)的克隆系統(tǒng),它可容納70~100kb的插入片段,并可選擇性地區(qū)分重組子和非重組子,且同時有兩套復(fù)制機制。單拷貝復(fù)制子可用于穩(wěn)定克隆增殖,而多拷貝復(fù)制子則可在Lac操縱子的控制下用于DNA的制備。BAC系統(tǒng)是基于大腸桿菌中可大容量容納基因且穩(wěn)定性良好的F因子衍生而來的載體系統(tǒng),可容納超過100kb的插入片段,BAC克隆的插入片段的平均長度為120kb,最大可達(dá)到240kb左右。良好的穩(wěn)定性和操作的簡便性是BAC系統(tǒng)的主要優(yōu)點。由這些克隆入手,采用依賴于適當(dāng)cDNA文庫的方法、依賴于特征序列的方法或依賴于表達(dá)性質(zhì)等方法獲得候選cDNA。

全長及功能分析

獲得了眾多的候選cDNA后,通過篩選cDNA文庫或RACE等方法克隆全長基因。為確定其中的致病基因,需要逐個檢測它們在患病家系中的變化情況,并分析其功能。功能分析往往是定位克隆中的一個難點,因為不同的疾病有不同的特征,也就需要用不同的功能檢測系統(tǒng)進行分析。常用的如細(xì)胞水平的正義或反義基因的表達(dá)后細(xì)胞形態(tài)和功能變化的研究,在腫瘤研究中檢測細(xì)胞形態(tài)和接觸抑制的變化,軟瓊脂生長能力的變化及裸鼠致瘤性分析等。更進一步的功能分析則包括個體水平的基因敲除實驗等。

現(xiàn)在還發(fā)展出了一些與其它方法相結(jié)合的新思路,如與差減雜交相結(jié)合,篩選位于候選區(qū)域的差異表達(dá)基因,大大提高了獲得有價值基因的可能性。同時人類基因組計劃中轉(zhuǎn)錄圖譜〔15〕工作的開展,有很多EST已被精確定位于染色體的不同區(qū)帶上,可以直接進行功能研究。隨著研究的深入,越來越多的EST定位工作的完成,基因轉(zhuǎn)錄圖譜的不斷完善,我們完全可以直接跳過定位克隆的第二個步驟而直接進入功能鑒定和基因全長的克隆工作,這可能將是定位克隆中最快的方法。在分析分離手段不斷提高,人類基因組計劃緊鑼密鼓地實施的今天,各種新思路新方法層出不窮,定位克隆方法的周期也將不斷縮小,為人類最終克隆各種疾病基因提供了可能性。

篩選方法

直接篩選法

依賴適當(dāng)cDNA文庫的方法有直接篩選法和cDNA選擇法(cDNAselection)。直接篩選法即用基因組DNA直接從cDNA文庫中篩選位于該基因組片段內(nèi)的cDNA,如從覆蓋有候選區(qū)域的YAC、PAC、BAC克隆中分離外源片段作為探針從文庫中篩選候選基因;而cDNA選擇法恰恰與直接篩選法相反,它把基因組DNA固定在膜上,用總cDNA與之雜交,通過PCR從中回收可與基因組片段結(jié)合的cDNA片段。直接篩選法的優(yōu)點在于避免了對候選區(qū)域大片段地亞克隆操作,且在單一的篩選中可以獲得多個轉(zhuǎn)錄子的信息。但缺點是大片段地純化,標(biāo)記較困難,而PAC、BAC克隆片段純化相對方便的優(yōu)點就成為這種方法發(fā)展的趨勢;同時由于探針的復(fù)雜性,使雜交背景加深,假陽性增多,而且容易忽略短的外顯子或低豐度cDNA。cDNA選擇法的最大優(yōu)越性在于PCR反應(yīng)的介入,大大提高了選擇的靈敏度,可以檢測到一些稀有轉(zhuǎn)錄子。

表達(dá)依賴法

也即Northern雜交分析法。用候選區(qū)域基因組DNA作為探針與總RNA雜交,切下陽性條帶,反轉(zhuǎn)錄為cDNA并克隆,即可獲得位于此基因組片段中的轉(zhuǎn)錄子。

上述方法都各有其優(yōu)缺點,必須根據(jù)原材料及要達(dá)到的目的,選擇適當(dāng)?shù)囊环N或多種方法組合來達(dá)到研究目的。此外,其它方法還很多,如微切割和微克隆法、減法cDNA雜交法、重組篩選法等。

依賴特征序列

依賴特征序列的方法是依據(jù)轉(zhuǎn)錄子內(nèi)部及其兩側(cè)的序列特征直接從基因組DNA中分離cDNA片段,主要有CpG島搜尋法、外顯子捕獲法(exontrapping)、交叉物種序列同源性比較法(cross-speciessequencehomology)、AluPCR法與直接序列分析法等。CpG島也稱為HTF島,是一些富含GC的小區(qū)域。大部分轉(zhuǎn)錄子的附近(通常是在5′上游區(qū)域)都含有非甲基化的CpG島。利用一些識別CpG島的稀有酶,如SacⅡ、BssHⅡ、EagⅠ等,切割基因組DNA,獲得位于CpG島附近的序列作為探針從總RNA或cDNA文庫中得到轉(zhuǎn)錄子。外顯子捕獲法是基于對外顯子兩側(cè)的功能性5′和3′剪接位點的識別,從基因組DNA中分離外顯子片段。交叉物種序列同源性比較的依據(jù)是編碼區(qū)序列在不同物種間的保守性要遠(yuǎn)高于非編碼區(qū),把候選區(qū)域的DNA分為多個亞克隆,分別與不同的物種總DNA雜交,與不同物種DNA都有陽性信號的DNA克隆可能就是編碼區(qū)基因。這種方法依賴的是物種間DNA水平上的序列同源性。Alu序列是散布于人基因組中的短的重復(fù)序列,通過設(shè)計人特異的Alu序列作為引物,可直接快速用PCR方法從YAC、BAC、PAC克隆或人鼠雜合細(xì)胞中得到人源的特異序列。直接序列分析法則在基因組序列信息中用GRAIL和GeneScan等軟件分析推測編碼基因的方法。