組蛋白基因(histone gene) 組蛋白基因是已知的重復(fù)基因中唯一具有蛋白質(zhì)編碼機(jī)能的基因。它們?cè)贒NA合成開(kāi)始前短暫地表達(dá),因而它們的活動(dòng)與細(xì)胞周期密切相關(guān)。

概述

組蛋白基因(histone gene)

組蛋白基因在各種生物體內(nèi)重復(fù)的次數(shù)不一樣,但都在中度重復(fù)的范圍內(nèi)。通常每種組蛋白的基因在同一種生物中拷貝數(shù)是相同的。雞的基因組中組蛋白基因有10個(gè)拷貝,在哺乳動(dòng)物中為20拷貝,非洲爪蟾為40拷貝,而海膽的每種組蛋白的基因達(dá)300-600拷貝。不同生物中組蛋白基因在基因組中的排列不一樣,組蛋白基因沒(méi)有一定的排列方式,而在拷貝數(shù)高的基因組中(>100拷貝),大部份組蛋白基因串聯(lián)重復(fù)形成基因簇。

發(fā)育

海膽發(fā)育早期五種組蛋白基形成一個(gè)重復(fù)單位,每種組蛋白基因之間是非轉(zhuǎn)錄間隔區(qū),5個(gè)間隔區(qū)均不相同。這樣的重復(fù)單位在整個(gè)基因組中重復(fù)300次以上,而且這些重復(fù)單位基本上是相同的。在海膽中,5種組蛋白基因的轉(zhuǎn)錄方向都是相同的,每種組蛋白基因獨(dú)立的產(chǎn)生自己的mRNA。非洲爪蟾卵細(xì)胞5S基因重復(fù)單位包括一個(gè)基因和一個(gè)假基因。在三種不同的海膽中,其組蛋白基因重復(fù)單位中非轉(zhuǎn)錄間隔區(qū)在長(zhǎng)度和序列上差異是很大的,盡管它們的組蛋白基因的長(zhǎng)度和序列相差不多。實(shí)際上,在同一種海膽內(nèi)不同的組蛋白基因重復(fù)單位之間,相應(yīng)的非轉(zhuǎn)錄間隔區(qū)也不是完全相同的。另外,在海膽胚胎發(fā)育晚期,要由晚期組蛋白基因來(lái)編碼組蛋白,該基因與上述的早期組蛋白基因有輕微的差異,但該組蛋白基因不成簇排列,整個(gè)基因組僅有10個(gè)拷貝,呈散在分布。

果蠅和非洲爪蟾中,5種組蛋白也排成一個(gè)重復(fù)單位,也存在間隔區(qū),而且組蛋白基因的轉(zhuǎn)錄方向不一樣。多個(gè)重復(fù)單位也形成串聯(lián)重復(fù)排列。進(jìn)化到哺乳動(dòng)物,組蛋白基因一般不再形成重復(fù)單位,而呈散在分布或集成一小群。盡管組蛋白基因在基因組中的排列和分布在不同生物之間相差甚大,但是所有組蛋白基因都不含內(nèi)含子,而且在序列上相應(yīng)的組蛋白基因都很相似,從而編碼的組蛋白在結(jié)構(gòu)上和功能上也極為相似。

基因組中存在大量重復(fù)序列用以編碼組蛋白是有其重要意義的。DNA復(fù)制時(shí),組蛋白也要成倍增加,而且往往在DNA合成一小段后,組蛋白馬上就要與其相結(jié)合,這要求在較短的時(shí)間內(nèi)合成大量的組蛋白,因而需要有大量的組蛋白基因存在。人體基因組中還有幾個(gè)大的基因簇,也屬于中度重復(fù)順序長(zhǎng)的分散片段型。在一個(gè)基因簇內(nèi)含有幾百個(gè)功能相關(guān)的基因,這些基因簇又稱為超基因(Super gene),如人類主要組織相容性抗原復(fù)合體HLA和免疫球蛋白重鏈及輕鏈基因都屬于超基因。超基因可能是由于基因擴(kuò)增后又經(jīng)過(guò)功能和結(jié)構(gòu)上的輕微改變而產(chǎn)生的,但仍保留了原始基因的結(jié)構(gòu)及功能的完整性。

引自http://www.37c.com.cn/topic/004/theory/LL1_2_6.htm