版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)
文檔簡介
1、蛋白質(zhì)組學(xué)是后基因組時代的一個重要研究方向,它試圖詮釋蛋白質(zhì)在細(xì)胞中扮演的角色,揭示細(xì)胞環(huán)境中蛋白質(zhì)之間的相互作用和及其功能。確定蛋白質(zhì)的亞細(xì)胞定位是實現(xiàn)蛋白質(zhì)功能注釋的重要一環(huán),但生物實驗確定蛋白質(zhì)亞細(xì)胞定位周期長,成本高,迫切需要發(fā)展新的更有效的方法。 本文基于現(xiàn)代統(tǒng)計模式識別理論與方法,開展了亞細(xì)胞定位預(yù)測中的特征表達(dá)、分類算法、多類分類策略以及不均衡數(shù)據(jù)處理等問題的研究。主要貢獻(xiàn)如下: 1.提出了矩描述子特征表達(dá)
2、方法,并從預(yù)測正確率、支持向量、訓(xùn)練和測試時間幾個方面對基于支持向量機的三種多類分類策略的分類性能進(jìn)行了研究。該特征表達(dá)方法從統(tǒng)計學(xué)角度分析了氨基酸組成成分特征,引入了氨基酸次序和位置信息,以氨基酸坐標(biāo)均值和坐標(biāo)方差來表示蛋白質(zhì)序列中氨基酸出現(xiàn)位置的期望值和離散程度?;趦煞N典型數(shù)據(jù)庫進(jìn)行了實驗數(shù)據(jù)驗證,結(jié)果表明,矩描述子特征能更有效地表達(dá)出蛋白質(zhì)序列中各種氨基酸殘基的位置分布信息。 2.提出了氨基酸組成分布特征表達(dá)方法,給出了
3、不均衡性衡量指標(biāo),研究了不均衡數(shù)據(jù)集的不均衡性對支持向量機分類的影響,并提出了一種基于加權(quán)懲罰系數(shù)的訓(xùn)練方法。該特征表達(dá)方法將蛋白質(zhì)序列平均分成多段,分別求取每一段子序列的氨基酸組成成分,不僅包含了所有子序列的氨基酸含量而且能夠體現(xiàn)了子序列在空間結(jié)構(gòu)上的相互作用關(guān)系。實驗數(shù)據(jù)驗證結(jié)果表明,(1)氨基酸組成成分特征體現(xiàn)了局部的子序列信息之和大于整體序列信息,能更有效地表達(dá)出蛋白質(zhì)子序列之間的相互關(guān)系;(2)基于加權(quán)懲罰系數(shù)的訓(xùn)練方法能夠來
4、減輕數(shù)據(jù)的不均衡性給分類帶來的負(fù)面影響。 3.針對蛋白質(zhì)物理化學(xué)信號的非平穩(wěn)性,提出了基于氨基酸殘基指數(shù)的多尺度能量特征表達(dá)方法。該特征表達(dá)方法利用氨基酸殘基指數(shù)將蛋白質(zhì)符號序列映射成數(shù)值信號,使用基于多分辨率分析思想的小波變換,將信號進(jìn)行Mallat塔式分解,從而求解出該信號在多個尺度上的均方根能量,并通過向量的形式來表達(dá)亞細(xì)胞定位的特征信息。實驗數(shù)據(jù)驗證結(jié)果表明,本方法能更有效地表達(dá)出蛋白質(zhì)物理化學(xué)信號的特性,并具有更小的計
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 眾賞文庫僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 基于融合特征的蛋白質(zhì)亞細(xì)胞定位預(yù)測.pdf
- 蛋白質(zhì)亞細(xì)胞定位預(yù)測方法研究.pdf
- 蛋白質(zhì)亞細(xì)胞定位的識別.pdf
- 蛋白質(zhì)序列特征表達(dá)及其在亞細(xì)胞定位預(yù)測中的應(yīng)用.pdf
- 基于理化特征融合的蛋白質(zhì)亞細(xì)胞定位預(yù)測.pdf
- 基于離散特征的蛋白質(zhì)亞細(xì)胞定位預(yù)測方法研究.pdf
- 基于圖像的蛋白質(zhì)亞細(xì)胞定位.pdf
- 蛋白質(zhì)亞細(xì)胞定位的序列分析和理論預(yù)測算法研究.pdf
- 基于多特征融合的蛋白質(zhì)亞細(xì)胞多位點定位預(yù)測.pdf
- 蛋白質(zhì)結(jié)構(gòu)類與亞細(xì)胞定位預(yù)測中的特征提取方法研究.pdf
- 基于mRNA等融合特征的單定位和多定位細(xì)胞凋亡蛋白質(zhì)亞細(xì)胞定位預(yù)測.pdf
- 基于混合編碼的蛋白質(zhì)亞細(xì)胞定位研究.pdf
- 多標(biāo)簽設(shè)置下的蛋白質(zhì)亞細(xì)胞定位研究.pdf
- 29280.蛋白質(zhì)亞細(xì)胞定位預(yù)測中若干信息提取算法研究
- 蛋白質(zhì)序列特征提取及其在亞細(xì)胞定位中的應(yīng)用.pdf
- 蛋白質(zhì)亞細(xì)胞定位方法研究和網(wǎng)絡(luò)預(yù)測平臺構(gòu)建.pdf
- 基于直推學(xué)習(xí)的蛋白質(zhì)亞細(xì)胞定位預(yù)測.pdf
- 使用蛋白質(zhì)和mRNA序列信息預(yù)測蛋白質(zhì)亞線粒體定位.pdf
- 基于多標(biāo)記學(xué)習(xí)的蛋白質(zhì)亞細(xì)胞定位預(yù)測.pdf
- 基于糾錯輸出編碼的蛋白質(zhì)亞細(xì)胞定位預(yù)測.pdf
評論
0/150
提交評論