版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、近些年,下一代測(cè)序技術(shù)獲得了突飛猛進(jìn)的發(fā)展,由此產(chǎn)生了越來越多的測(cè)序數(shù)據(jù)。如何處理這些測(cè)試數(shù)據(jù)一直以來都是生物信息學(xué)領(lǐng)域的一項(xiàng)重要研究?jī)?nèi)容,下一代測(cè)序技術(shù)應(yīng)用到轉(zhuǎn)錄組研究領(lǐng)域產(chǎn)生了高通量轉(zhuǎn)錄組測(cè)序技術(shù),簡(jiǎn)稱為RNA-seq技術(shù)。RNA-seq數(shù)據(jù)分析軟件的一項(xiàng)重要功能便是重構(gòu)剪接之前的mRNA在細(xì)胞中的形態(tài),此外,還應(yīng)該能夠評(píng)估每種剪接異構(gòu)體的表達(dá)水平。但是,所有分析過程的第一步都是要把從RNA-seq中得到的測(cè)序片段比對(duì)到相應(yīng)的參考序
2、列上。因?yàn)閮?nèi)含子序列在DNA轉(zhuǎn)錄為成熟mRNA時(shí)會(huì)被剪切除去,所以與傳統(tǒng)的序列比對(duì)問題相比,轉(zhuǎn)錄組序列比對(duì)有其固有的特殊之處,即需要將測(cè)序得到的序列分段比對(duì)到不同的外顯子序列上,因此需要設(shè)計(jì)專門針對(duì)RNA-seq的序列比對(duì)算法?,F(xiàn)有的RNA-seq序列比對(duì)算法基本上都是依賴于經(jīng)典的剪接位點(diǎn)信號(hào),而許多非經(jīng)典的剪接信號(hào)位點(diǎn)具有重要的生物學(xué)功能,如GT-TG與人類腺苷酸環(huán)化酶刺激蛋白Gαs的形成有關(guān)。為此,筆者設(shè)計(jì)了兩個(gè)新的RNA-seq序
3、列比對(duì)算法,用來發(fā)現(xiàn)多種類型的剪接位點(diǎn)。
(1)獨(dú)立于剪接位點(diǎn)信號(hào)的轉(zhuǎn)錄組序列比對(duì)算法
首先筆者設(shè)計(jì)了一種采用重疊種子內(nèi)部擴(kuò)展策略的RNA-seq序列比對(duì)算法,命名為RNAMap。種子序列的重疊性能夠保證由種子的比對(duì)信息能夠組合出完整測(cè)序序列的定位信息。在掃描基因組時(shí),RNAMap建立一個(gè)靜態(tài)表和一個(gè)動(dòng)態(tài)表來索引種子序列及其比對(duì)信息,尋找左右錨點(diǎn)序列之間的剪接位點(diǎn),此時(shí)并不受經(jīng)典剪接位點(diǎn)信號(hào)的限制。實(shí)驗(yàn)結(jié)果表明,對(duì)于
4、含有多種類型的剪接位點(diǎn)的數(shù)據(jù)集,RNAMap的召回率和精確度分別達(dá)到了92.53%和97.01%,優(yōu)于其它的轉(zhuǎn)錄組序列比對(duì)工具。
(2)轉(zhuǎn)錄組序列比對(duì)算法改進(jìn)
之后又設(shè)計(jì)了一種采用非重疊種子之間擴(kuò)展策略的RNA-seq序列比對(duì)算法,命名為RNAMap2。該算法通過減少種子的數(shù)量來降低計(jì)算量,然后利用測(cè)序深度,即測(cè)序序列的重復(fù)性來進(jìn)行比對(duì)。這在一定程度上彌補(bǔ)了RNAMap在運(yùn)行速度方面的不足。實(shí)驗(yàn)結(jié)果表明,在測(cè)序序列的
溫馨提示
- 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 高通量轉(zhuǎn)錄組測(cè)序片段快速比對(duì)算法研究.pdf
- 基于高通量測(cè)序半夏珠芽轉(zhuǎn)錄組研究.pdf
- 基于高通量測(cè)序的狼和家犬血液轉(zhuǎn)錄組研究.pdf
- 基于高通量測(cè)序的木麻黃轉(zhuǎn)錄組分析.pdf
- 基于高通量RNa-seq數(shù)據(jù)轉(zhuǎn)錄組拼接的算法研究.pdf
- 高通量測(cè)序
- 紫石房蛤高通量轉(zhuǎn)錄組文庫(kù)測(cè)序和分子標(biāo)記開發(fā).pdf
- 基于高通量轉(zhuǎn)錄組測(cè)序與植物代謝組學(xué)技術(shù)研究遠(yuǎn)志皂苷生物合成途徑.pdf
- 基于高通量測(cè)序的Klebsiella pneumoniae基因組拼接的研究.pdf
- 鏈狀亞歷山大藻高通量轉(zhuǎn)錄組測(cè)序與基因表達(dá)分析.pdf
- 基于高通量測(cè)序的微生物基因組學(xué)研究.pdf
- 高通量測(cè)序技術(shù)簡(jiǎn)介
- 基于高通量測(cè)序的石刁柏基因組SSR標(biāo)記的開發(fā).pdf
- 基于高通量測(cè)序技術(shù)的全基因組甲基化研究.pdf
- RLM-RACE聯(lián)合高通量測(cè)序構(gòu)建HepG2細(xì)胞lncRNA轉(zhuǎn)錄組文庫(kù).pdf
- 菜粉蝶不同發(fā)育階段mRNA與miRNA轉(zhuǎn)錄組的高通量測(cè)序分析.pdf
- 基于高通量測(cè)序技術(shù)的膀胱癌轉(zhuǎn)錄組分子標(biāo)記的初步篩選.pdf
- 基于高通量測(cè)序技術(shù)的非編碼RNA研究.pdf
- 基于高通量測(cè)序數(shù)據(jù)的遺傳調(diào)控元件識(shí)別及算法研究.pdf
- 基于高通量測(cè)序的日本三角渦蟲再生過程轉(zhuǎn)錄組分析.pdf
評(píng)論
0/150
提交評(píng)論