版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡(jiǎn)介
1、技術(shù)的革命將遺傳學(xué)的研究引入了組學(xué)的時(shí)代,通過芯片技術(shù)的運(yùn)用產(chǎn)生了大量的遺傳數(shù)據(jù)。為了深入地對(duì)數(shù)據(jù)進(jìn)行挖掘,其他學(xué)科,如統(tǒng)計(jì)學(xué)、信息學(xué)等,與遺傳學(xué)的結(jié)合越來越緊密。本文就五年來本人攻讀博士學(xué)位期間的工作進(jìn)行了總結(jié),期望通過對(duì)兩部分工作的介紹,展示統(tǒng)計(jì)學(xué)運(yùn)用于解決遺傳學(xué)問題的實(shí)例。
其一,我們對(duì)高通量單核苷酸多態(tài)分型平臺(tái)的缺失偏倚現(xiàn)象及其對(duì)后續(xù)分析的影響進(jìn)行了探究。高通量、低成本的分型平臺(tái)的出現(xiàn),使全基因組關(guān)聯(lián)分析成為了可能。但
2、是研究者往往將關(guān)注的目標(biāo)及于如何提高分型的準(zhǔn)確率,而忽視了另一質(zhì)量問題——缺失數(shù)據(jù)的存在。為了研究缺失現(xiàn)象對(duì)全基因組關(guān)聯(lián)分析的影響,我們對(duì)四個(gè)主流分型平臺(tái)(TaqMan(@) SNP分型平臺(tái)、GenomeLabTM SNPstream分型平臺(tái)、BeadLab(Illumina)分型平臺(tái)和Human Mapping500K(Affymetrix)芯片)的缺失數(shù)據(jù)進(jìn)行了重測(cè)序分型,實(shí)驗(yàn)證實(shí)了缺失偏倚現(xiàn)象在多個(gè)平臺(tái)中均普遍存在。進(jìn)而,我們從理
3、論上分析了缺失偏倚對(duì)后續(xù)分析的影響,如等位基因/基因型頻率的估計(jì)、哈迪——溫伯格平衡檢驗(yàn)和不同疾病模型下關(guān)聯(lián)分析統(tǒng)計(jì)功效的影響等。研究顯示,缺失偏倚往往導(dǎo)致關(guān)聯(lián)分析統(tǒng)計(jì)功效的下降,而且這種下降通常要比單純的樣本缺失造成的影響嚴(yán)重。我們還分別比較了缺失偏倚、分型錯(cuò)誤對(duì)頻率估計(jì)、關(guān)聯(lián)分析的影響。通過分析獲知,大多數(shù)情況下因?yàn)榉中唾|(zhì)量問題造成的分析偏差可以通過提高分型響應(yīng)度,即使會(huì)犧牲一定的分型準(zhǔn)確率來盡可能避免、減小。這一發(fā)現(xiàn)提示我們過去通
4、常對(duì)處于分型邊界的讀點(diǎn)進(jìn)行不判讀的做法需要被修正。如果是為了降低分析偏差,在全基因組關(guān)聯(lián)分析中,分型響應(yīng)度和錯(cuò)誤率的篩選標(biāo)準(zhǔn)要互相配合。我們建議修改現(xiàn)行的質(zhì)量控制標(biāo)準(zhǔn),可以適當(dāng)增加響應(yīng)度的閾值而降低對(duì)分型準(zhǔn)確率的要求。
其二,我們提出了近似估計(jì)拷貝數(shù)變異突變率的統(tǒng)計(jì)新方法。人類基因組中存在著拷貝數(shù)變異,而且這種變異和孟德爾遺傳疾病、復(fù)雜疾病以及進(jìn)化中的基因組可塑性相關(guān)。為了更好的理解拷貝數(shù)變異相關(guān)性狀的成因,研究拷貝數(shù)變異的生
5、成機(jī)制、估計(jì)它的突變率是十分重要的。多項(xiàng)用于揭示拷貝數(shù)變異成因的研究已經(jīng)開展起來;但是從基因組水平對(duì)拷貝數(shù)變異突變率進(jìn)行實(shí)驗(yàn)估計(jì)還是一個(gè)不現(xiàn)實(shí)的問題,它需要大量的樣本量和精確的分型技術(shù)。本研究提出了一種可以運(yùn)用群體基因型數(shù)據(jù)對(duì)拷貝數(shù)變異突變率進(jìn)行近似估計(jì)的方法。這一估計(jì)可以通過基因組中不同拷貝數(shù)變異的比較,找尋到拷貝數(shù)變異的突變熱點(diǎn)。運(yùn)用該方法我們分析了來自HapMap計(jì)劃的三個(gè)群體、4,330個(gè)拷貝數(shù)變異位點(diǎn),發(fā)現(xiàn)大多數(shù)的拷貝數(shù)變異突
6、變率大致在10-5/代水平,這與分子實(shí)驗(yàn)觀察到的零星突變率估計(jì)相一致。值得一提的是,有132(3.0%)個(gè)拷貝數(shù)變異的突變率可達(dá)10-3/代水平,被認(rèn)為是突變熱點(diǎn)。進(jìn)一步的分析發(fā)現(xiàn),基因組結(jié)構(gòu)和重排機(jī)制的不同可能造成了人類基因組中拷貝數(shù)變異熱點(diǎn)的存在。
在不久的將來,由二代測(cè)序技術(shù)產(chǎn)生的海量數(shù)據(jù)將不斷地涌現(xiàn)出來,許多懸而未決的遺傳問題有望獲得解決。對(duì)這些數(shù)據(jù)的挖掘工作離不開統(tǒng)計(jì)學(xué)、信息學(xué)等的運(yùn)用,讓我們做好準(zhǔn)備迎接生命科學(xué)發(fā)展
溫馨提示
- 1. 本站所有資源如無(wú)特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫(kù)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。
最新文檔
- 全基因組拷貝數(shù)變異和拷貝數(shù)平衡的雜合性缺失分析獲得LCPD基因.pdf
- 人類基因組
- 人類基因組indel與結(jié)構(gòu)變異的檢測(cè)和分析方法的研究.pdf
- 人類基因組中檢測(cè)結(jié)構(gòu)變異的計(jì)算方法.pdf
- 人類基因組上有害同義突變預(yù)測(cè).pdf
- 人類基因組計(jì)劃
- 人類基因組學(xué)
- 人類基因組中若干序列的統(tǒng)計(jì)分析.pdf
- Noonan綜合征相關(guān)基因突變和拷貝數(shù)變異研究.pdf
- 人類基因組計(jì)劃及基因測(cè)序
- 人類基因組A1u序列的研究.pdf
- 人類基因組堿基組成的統(tǒng)計(jì)研究.pdf
- 人類基因組計(jì)劃及其意義
- 中國(guó)女性全基因組拷貝數(shù)變異與初潮年齡的關(guān)聯(lián)研究.pdf
- 全基因組芯片技術(shù)在先天性心臟病基因組拷貝數(shù)變異中的研究.pdf
- 44432.人類基因組計(jì)劃的價(jià)值倫理分析及對(duì)策
- 人類基因組SNP數(shù)據(jù)庫(kù)的數(shù)據(jù)整合.pdf
- 全基因組拷貝數(shù)變異與卵巢腫瘤異質(zhì)性的關(guān)聯(lián)研究.pdf
- 產(chǎn)前先天性心臟病胎兒的全基因組基因拷貝數(shù)變異分析.pdf
- 豬基因組中拷貝數(shù)變異分析及多聚腺苷酸化位點(diǎn)的發(fā)掘.pdf
評(píng)論
0/150
提交評(píng)論