版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、在后基因組時代,生物信息技術迅速發(fā)展,生命科學的研究重心從破譯基因組序列轉移到基因功能注釋。依據(jù)分子生物學中心法則,攜帶遺傳信息的基因翻譯成蛋白質才能在生物體內執(zhí)行多種多樣的生理功能。隨著高通量測序技術的日臻成熟,被測定的蛋白質序列數(shù)目呈指數(shù)增長,與此相比,被測定功能的蛋白質數(shù)目的增長速度相對滯后。已知序列的蛋白質數(shù)目和已知功能的蛋白質數(shù)目之間的差距不斷擴大,蛋白質功能預測成為重要且極具挑戰(zhàn)性的研究課題,其不僅有助于探索生命起源和遺傳變
2、異,而且有助于從細胞和分子水平上探討人類重大疾病的發(fā)病機制,為疾病的診斷、預防和藥物開發(fā)等提供重要的理論支持。通過實驗方法進行蛋白質功能注釋,成本昂貴、耗時耗力且無法大規(guī)模開展。因此,亟需開發(fā)可靠、經(jīng)濟和高通量的計算方法,快速精確地預測蛋白質功能。蛋白質類別預測和蛋白質-配體相互作用預測是蛋白質功能預測的兩大重要研究分支?;跈C器學習,本學位論文對蛋白質類別預測和蛋白質-配體相互作用預測進行了深入研究,具體內容如下:
(1)蛋
3、白質類別預測中的二分類問題
噬菌體病毒蛋白和非病毒蛋白具有不同的生物學功能。從噬菌體蛋白中準確地識別病毒蛋白有助于理解復雜的病毒機制和開發(fā)抗細菌藥物?,F(xiàn)有的計算方法未全方位的提取蛋白質序列特征,且利用單一的分類器構建預測模型。基于Stacking方法,提出了新的噬菌體病毒蛋白預測方法。該方法從蛋白質序列中提取氨基酸的組成、位置、順序、分布、理化屬性和進化等信息?;诓煌奶卣魈崛〔呗?,分別構建不同的隨機森林預測模型,并利用邏輯
4、回歸算法整合隨機森林預測模型的預測結果。在獨立測試集上,該方法的預測性能優(yōu)于現(xiàn)有方法,是預測噬菌體病毒蛋白的有效工具。
在生物體內,抗氧蛋白在維持氧化/抗氧化的平衡過程中發(fā)揮著重要作用,且對于疾病的治療具有潛在的價值。準確地預測抗氧蛋白為揭示氧化/抗氧化平衡的生理機制和開發(fā)抗氧化藥物提供理論依據(jù)。針對現(xiàn)有方法的局限性,通過多源特征提取和分類器選擇策略,構建了預測抗氧蛋白的集成學習方法。為進一步提高預測性能,該方法利用Relie
5、f-增量特征選擇剔除冗余和不相關的特征。在獨立測試集上,該方法取得了較為均衡的敏感性和特異性,遠遠優(yōu)于現(xiàn)有方法。
抗血管生成肽對于血管生成具有抑制作用,有助于治療與血管生成相關的疾病。準確地預測抗血管生成肽能夠為理解血管的生成機制和發(fā)展抗腫瘤療法提供重要線索?,F(xiàn)有方法通過單分類器建立預測模型,并未利用特征選擇技術獲取具有高度識別能力的特征。通過分別選取具有高敏感性以及高特異性的基分類器模型,構建了預測抗血管生成肽的集成分類器模
6、型。為降低計算復雜度和提高預測能力,利用特征選擇技術獲取與分類目標更相關的特征。與現(xiàn)有方法在相同的基準數(shù)據(jù)集上的預測性能比較結果表明,該集成分類器是預測抗血管生成肽的有效方法。
(2)蛋白質類別預測中的多分類問題
不同類型J蛋白在疾病發(fā)展中發(fā)揮著不同功能。準確地識別J蛋白的類型將、為闡明不同類型J蛋白在相關生物學過程中的功能提供線索,并有助于理解疾病的發(fā)作機制?,F(xiàn)有方法采用的特征編碼方式單一,尚未解決類不平衡問題。基
7、于欠采樣方法,借鑒集成學習思想,構建了J蛋白類型預測模型。該預測模型有效地解決了類不平衡問題。與現(xiàn)有方法相比,該集成分類器模型的敏感性和特異性更均衡。
在生物體內,不同離子通道的芋螺毒素所發(fā)揮的生理功能和對疾病的治療潛力有較大差異。準確地預測芋螺毒素離子通道類型有助于破譯芋螺毒素的生理機制和藥理學特性。現(xiàn)有方法從蛋白質序列中只提取了氨基酸的組成信息,并未解決類不平衡問題。通過提取蛋白質序列中的氨基酸組成、分布、順序、理化屬性和
8、二級結構信息,利用少數(shù)類過采樣算法增加少數(shù)類樣本的數(shù)目,建立了新的芋螺毒素離子通道類型預測模型。在獨立測試集上,該預測模型對不同類型芋螺毒素的預測精度都高于現(xiàn)有方法,驗證了其強大預測能力。
(3)蛋白質-配體相互作用預測
蛋白質-適配體相互作用在生物體內發(fā)揮著各種生理功能,并具有潛在的疾病治療價值。快速有效地預測蛋白質-適配體相互作用有助于深刻理解蛋白質-適配體相互作用的作用機制和開發(fā)基于適配體的療法?,F(xiàn)有方法采用單
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于蛋白質相互作用網(wǎng)絡的蛋白質功能預測.pdf
- 從蛋白質相互作用網(wǎng)絡預測未知蛋白質功能.pdf
- 蛋白質相互作用
- 蛋白質-蛋白質相互作用界面和熱點預測的方法研究.pdf
- 基于蛋白質相互作用網(wǎng)絡拓撲結構的蛋白質功能模塊預測.pdf
- 基于多分類器組合的蛋白質-蛋白質相互作用位點預測研究.pdf
- 基于蛋白質相互作用網(wǎng)絡及聚類算法的蛋白質功能預測方法研究.pdf
- 蛋白質相互作用預測方法的研究.pdf
- 樸素貝葉斯分類器預測擬南芥蛋白質相互作用及蛋白質功能注釋.pdf
- 基于蛋白質相互作用加權網(wǎng)絡的關鍵蛋白質識別算法研究.pdf
- 基于序列的蛋白質相互作用預測方法研究.pdf
- 基于機器學習的蛋白質相互作用關系抽取的研究.pdf
- 基于信噪比的蛋白質相互作用的預測研究.pdf
- 基于序列的蛋白質-藥物相互作用預測研究.pdf
- 15854.蛋白質相互作用預測方法研究
- 蛋白質相互作用預測及其應用的研究.pdf
- 基于蛋白質相互作用網(wǎng)絡的代謝pathway預測.pdf
- 基于深度學習的蛋白質-RNA相互作用預測模型構建.pdf
- 蛋白質相互作用網(wǎng)絡中關鍵蛋白質預測算法及其應用研究.pdf
- 基于蛋白質網(wǎng)絡與蛋白質功能的關鍵蛋白質預測研究.pdf
評論
0/150
提交評論