版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、可轉(zhuǎn)座元件(TE)存在于幾乎所有真核生物中,是許多基因組,特別是植物基因組的重要甚至主要成分。LTR反轉(zhuǎn)錄轉(zhuǎn)座子是一類通過“復(fù)制-粘貼”模式進(jìn)行轉(zhuǎn)座的TE。它們的活動提供了植物基因組結(jié)構(gòu)與功能進(jìn)化的重要機(jī)制:已經(jīng)知道,它們參與塑造基因組的組織結(jié)構(gòu)與大小,影響基因的調(diào)控與變異和引起新基因的起源,同時它們還是分子生物學(xué)突變誘導(dǎo)的重要工具。研究LTR反轉(zhuǎn)錄轉(zhuǎn)座子在理論和應(yīng)用方面都有重大意義。
隨著測序技術(shù)的發(fā)展,一個迫切的問題是
2、如何有效地從未經(jīng)注釋的基因組序列數(shù)據(jù)中發(fā)現(xiàn)LTR反轉(zhuǎn)錄轉(zhuǎn)座子。本文首次建立起一套全基因組LTR反轉(zhuǎn)錄轉(zhuǎn)座子注釋的框架。該框架整合了從頭算起,比較基因組學(xué)和同源搜索-拷貝數(shù)驗(yàn)證三個獨(dú)立的功能模塊,形成了完整的LTR反轉(zhuǎn)錄轉(zhuǎn)座子預(yù)測流程。
從頭算起模塊稱為LTR_FINDER,該程序利用LTR反轉(zhuǎn)錄轉(zhuǎn)座子的一般結(jié)構(gòu)特征,在單個基因組上搜索滿足這些特征的區(qū)域。該程序通過四步來發(fā)現(xiàn)一個全長LTR反轉(zhuǎn)錄轉(zhuǎn)座子:第一步采用后綴矩陣數(shù)據(jù)
3、結(jié)構(gòu)來定位和存貯基因組中的所有精確匹配序列對;第二步以精確匹配序列對為種子,通過連接相鄰種子來構(gòu)造可能的LTR區(qū)域;第三步通過序列聯(lián)配發(fā)現(xiàn)最可能的轉(zhuǎn)座子邊界;第四步利用LTR轉(zhuǎn)座子內(nèi)部的結(jié)構(gòu)特征序列確認(rèn)全長轉(zhuǎn)座子的存在。
第二個模塊LTR_INSERT引入比較基因組學(xué)方法,同時分析轉(zhuǎn)座子復(fù)制插入在基因組上留下的序列信號和轉(zhuǎn)座子的結(jié)構(gòu)特征,在兩個基因組之間實(shí)現(xiàn)可靠的LTR反轉(zhuǎn)錄轉(zhuǎn)座子預(yù)測。首先,LTR_INSERT構(gòu)造全基因
4、組聯(lián)配并將聯(lián)配分為同源區(qū)集合和增刪區(qū)集合兩個部分;第二步分析增刪區(qū)及其鄰域,發(fā)現(xiàn)基因組分化后插入的全長LTR轉(zhuǎn)座子;第三步則分析同源區(qū)以預(yù)測分化前插入的LTR轉(zhuǎn)座子。
在以上兩個模塊的基礎(chǔ)上,我們還發(fā)展了同源搜索-拷貝數(shù)驗(yàn)證模塊,該模塊以LTR_FINDER或LTR_INSERT的結(jié)果為輸入,在全基因組上注釋與之相關(guān)的LTR轉(zhuǎn)座子序列。該模塊實(shí)現(xiàn)對LTR轉(zhuǎn)座子的邊界修正、轉(zhuǎn)座子內(nèi)部非相關(guān)序列的識別和去除、多拷貝數(shù)的確認(rèn)及對
5、LTR反轉(zhuǎn)錄轉(zhuǎn)座子分類等功能。LTR_FINDER與LTR_INSERT分別與同源搜索-拷貝數(shù)驗(yàn)證模塊配合使用,可以分別達(dá)到對單基因組與對兩個近緣物種基因組中LTR反轉(zhuǎn)錄轉(zhuǎn)座子進(jìn)行有效注釋的目的??傊?,三個模塊分別提供結(jié)構(gòu),插入和拷貝數(shù)三項(xiàng)獨(dú)立證據(jù)來預(yù)測LTR轉(zhuǎn)座子,每一個由此流程預(yù)測的LTR轉(zhuǎn)座子都有至少兩項(xiàng)支持。
隨后我們將所發(fā)展的注釋方法應(yīng)用在水稻兩個亞種基因組的比較研究中。采用比較基因組模塊與同源搜索-拷貝數(shù)驗(yàn)證模
6、塊相結(jié)合的途徑,通過構(gòu)造和搜索亞洲栽培稻秈粳兩個亞種的全基因組序列聯(lián)配,我們共預(yù)測到993個全長LTR反轉(zhuǎn)錄轉(zhuǎn)座子并在兩個基因組中注釋了15916條與之相關(guān)的拷貝;發(fā)現(xiàn)80個水稻LTR轉(zhuǎn)座子的新家族,其中16個與目前已報道的所有家族沒有任何匹配。通過對全長LTR轉(zhuǎn)座子的分子進(jìn)化分析,我們發(fā)現(xiàn)水稻兩亞種之間在相當(dāng)近的時期(5萬3千年)內(nèi)存在較大規(guī)模的跨亞種遺傳物質(zhì)交流,并證明這種交流是通過亞種間同源非可往復(fù)重組(ISNR)實(shí)現(xiàn)的。然后,我
7、們對基因組的其它功能或非功能區(qū)域作了大規(guī)模采樣以驗(yàn)證這一事實(shí),并估計此類重組事件涉及占水稻基因組總量至少15.3%的區(qū)域。此外,LTR轉(zhuǎn)座子還提供兩重獨(dú)立證據(jù)表明秈粳稻基因組的分化發(fā)生在距今60萬年前。我們還研究了水稻中的LTR轉(zhuǎn)座子家族的進(jìn)化模式,發(fā)現(xiàn)如下特點(diǎn):1)水稻中反轉(zhuǎn)錄轉(zhuǎn)座子在兩亞種基因組“背景”分離后仍然處于活躍狀態(tài),并且在兩個基因組上的活躍程度大致相當(dāng);2)絕大部分LTR反轉(zhuǎn)錄復(fù)制事件是由相當(dāng)少的家族完成的;3)秈粳分化事
8、件并沒有對高活性LTR家族的活動造成顯著的影響;4)LTR反轉(zhuǎn)錄轉(zhuǎn)座子在基因組上的分布是非隨機(jī)的,傾向于在著絲粒附近集中。此工作第一次從比較基因組學(xué)的角度出發(fā),在全基因組的規(guī)模上對水稻亞種間的基因流動與滲入的規(guī)模作出了估計與分析。
結(jié)合從頭算起模塊與同源搜索-拷貝數(shù)驗(yàn)證模塊,我們在世界上首先對豆科的模式植物蒺藜苜?;蚪M序列做了LTR反轉(zhuǎn)錄轉(zhuǎn)座子的大規(guī)模描述和分析。在可公開使用的、約占苜?;蚪M總量近一半的序列中,我們發(fā)現(xiàn)
9、526個全長LTR反轉(zhuǎn)錄轉(zhuǎn)座子和與之相關(guān)的17421個拷貝;發(fā)現(xiàn)苜?;蚪MLTR反轉(zhuǎn)錄轉(zhuǎn)座子至少可分為85個家族,其中66個為本研究首次報道。我們研究了各個家族的PBS使用偏好和內(nèi)部區(qū)域蛋白質(zhì)組織方式,并討論了LTR反轉(zhuǎn)錄轉(zhuǎn)座子的進(jìn)化親緣關(guān)系。苜蓿中的全長LTR反轉(zhuǎn)錄轉(zhuǎn)座子主要分為Copia和Gypsy兩個超家族,后者盡管在家族數(shù)量上僅為前者的1/3,但在基因組中卻更為活躍。我們分析了LTR反轉(zhuǎn)錄轉(zhuǎn)座子的復(fù)制和刪除并估計了刪除對基因組的
10、影響,發(fā)現(xiàn):絕大部分可見的全長轉(zhuǎn)座子都是在近50萬年內(nèi)插入的;全長結(jié)構(gòu)的半衰期為26萬年,顯著快于在水稻中的79萬年;LTR轉(zhuǎn)座子的刪除曾經(jīng)引起基因組中至少10Mb數(shù)量級序列被刪除。我們還分析了若干特別活躍的LTR反轉(zhuǎn)錄轉(zhuǎn)座子新家族的結(jié)構(gòu),保守性和家族復(fù)制的時空模式。這些結(jié)果表明,LTR反轉(zhuǎn)錄轉(zhuǎn)座子的活動是苜?;蚪M進(jìn)化的重要力量。最后,我們還對這些家族在同科的百脈根與大豆中的同源LTR序列作了比較研究,結(jié)果發(fā)現(xiàn):1)Copia超家族比
11、Gypsy超家族在另兩個基因組上活躍得多;2)LTR反轉(zhuǎn)錄轉(zhuǎn)座子的活動在科內(nèi)看是支系高度特異的;3)它們在豆科較大基因組的尺寸進(jìn)化中可能起到重要作用。
總之,本研究創(chuàng)建了一套LTR反轉(zhuǎn)錄轉(zhuǎn)座子全基因組注釋的流程,并開發(fā)了使用LTR轉(zhuǎn)座子研究近緣物種的短期進(jìn)化的新方法。在水稻和蒺藜苜?;蚪M上使用這些方法獲得了新的結(jié)果。在水稻中的研究使得我們在遺傳物質(zhì)的橫向傳遞對馴化作物基因組的影響方面有了新的認(rèn)識;同時,對蒺藜苜蓿IXR反
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 植物L(fēng)TR反轉(zhuǎn)錄轉(zhuǎn)座子的預(yù)測和注釋及鄰聚法構(gòu)建系統(tǒng)進(jìn)化樹研究.pdf
- 基于簡化基因組的地黃屬植物轉(zhuǎn)座子比較研究.pdf
- 15280.藻類基因組ltr逆轉(zhuǎn)座子發(fā)掘及海帶(saccharinajaponica)轉(zhuǎn)錄組分析研究
- 家蠶微孢子蟲LTR反轉(zhuǎn)座子的活性研究.pdf
- 桑樹LINE反轉(zhuǎn)錄轉(zhuǎn)座子的特征及相關(guān)基因分析.pdf
- 家蠶基因組中轉(zhuǎn)座子的水平轉(zhuǎn)移.pdf
- 玉米基因組中SINE轉(zhuǎn)座子的發(fā)掘和特性研究.pdf
- 140.基于反轉(zhuǎn)錄轉(zhuǎn)座子標(biāo)記的梨屬植物親緣關(guān)系研究
- 低能離子輻照煙草后反轉(zhuǎn)錄轉(zhuǎn)座子活性的研究.pdf
- 牡丹Ty1-copia類反轉(zhuǎn)錄轉(zhuǎn)座子LTR序列的分離及其種質(zhì)資源評價.pdf
- 桑樹全基因組轉(zhuǎn)座子的鑒定及特征分析.pdf
- 牡丹Ty1-copia類反轉(zhuǎn)錄轉(zhuǎn)座子反轉(zhuǎn)錄酶序列的克隆和分析.pdf
- 全基因組中網(wǎng)絡(luò)缺失基因和微型轉(zhuǎn)座子的發(fā)現(xiàn)及研究.pdf
- PB轉(zhuǎn)座子和To12轉(zhuǎn)座子介導(dǎo)基因長期表達(dá)的研究.pdf
- 小麥及其近緣植物NPR1類似基因和反轉(zhuǎn)錄轉(zhuǎn)座子基因片段的分離和特性分析.pdf
- 茄子反轉(zhuǎn)錄轉(zhuǎn)座子分子標(biāo)記IRAP和REMAP的開發(fā)利用.pdf
- 基因組重測序作物的新轉(zhuǎn)座子鑒定及特征分析.pdf
- 茄子反轉(zhuǎn)錄轉(zhuǎn)座子基因片段的克隆及IRAP分子標(biāo)記體系的建立.pdf
- 鱗翅目昆蟲基因組中HITEs轉(zhuǎn)座子的鑒定、特征和進(jìn)化分析.pdf
- 長末端重復(fù)序列反轉(zhuǎn)錄轉(zhuǎn)座子分析流程構(gòu)建及應(yīng)用.pdf
評論
0/150
提交評論