亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        miRNA與疾病關(guān)系中分類預(yù)測方法研究

        2017-07-29 22:49:28孫華張燕施偉
        電腦知識與技術(shù) 2017年12期
        關(guān)鍵詞:支持向量機

        孫華 張燕 施偉

        摘要:由于miRNA的復(fù)雜性,只在調(diào)控時袁征出來,因此對于miRNA的識別工作難度很大。事實上,在miRNA分類問題中,有多種分類方法,如支持向量機、馬爾科夫鏈模型、非負矩陣分解、KNN算法等,該文對前期研究報告中用到的分類方法做比較,找出各類方法的特點及使用環(huán)境,為后續(xù)研究做準備。

        關(guān)鍵詞:miRNA;支持向量機;馬爾科夫鏈模型;非負矩陣分解;KNN算法

        miRNA是真核生物中的一組內(nèi)源性非編碼序列RNA分子,個體很小,只有不到24m,因為難被發(fā)現(xiàn),所以也被稱為真核生物體內(nèi)的“暗物質(zhì)”。但它能在細胞發(fā)育、生物細胞的凋亡與增殖,器官形成過程中起重要作用,具備調(diào)控功能。因此,miRNA的研究對疾病防治以及生物進化等都具有重要意義。也因此有越來越多的生物學(xué)家對miRNA在各種疾病的診斷和治療等方面的應(yīng)用寄予了極高的期望。對于miRNA的識別主要有兩個階段:尋找有效的特征選擇方法一尋找分類效率高的分類器。以下就對目前研究識別工作的分類器進行一一比較。

        1支持向量機(SVM)方法

        發(fā)現(xiàn)miRNA的方法主要有計算預(yù)測和eDNA克隆測序兩種,支持向量機(SVM)法已經(jīng)被廣泛應(yīng)用在miRNA預(yù)測中,通過合理的特征提取與編碼,SVM分類器可以達到較高的分類精度,但以往的模型通過單物種的miRNA序列或前體序列建立模型,在對其他物種的預(yù)測中分類精度往往會有所降低,并且沒有形成一套從前體結(jié)構(gòu)預(yù)測到成熟miRNA預(yù)測的完整流程。2012年孫超等人基于支持向量機分類算法的番茄miRNA預(yù)測,利用SVM方法構(gòu)建sly_pre_SVM模型和sly_SVM模型,并以已發(fā)現(xiàn)的miRNA特征為基礎(chǔ),預(yù)測番茄前體miRNA序列和成熟miRNA序列。研究miRNA特征向量的編碼、miRNA特征選擇和參數(shù)的優(yōu)化。從測試集的分類精度、敏感性和特異性上看,分別達到99.69%、100%和99.66%。

        另外,馬靜等人基于數(shù)據(jù)不平衡的方法預(yù)測miRNA,文中提出了綜合SVM-RFE和RelieW兩種特征的選擇方法,在每次迭代過程中,參照特征的評價標準,利用ReliefF算法計算的特征權(quán)重值,同時,利用SVM-RFE算法刪除冗余特征,并對特征子集的樣本集合使用K折交叉驗證方法,最終從準確率最高的集合中選擇最優(yōu)特征子集。

        2隱馬爾科夫鏈(HMM)模型

        高松等人研究指出,傳統(tǒng)的HMM方法最大的優(yōu)點是有可靠的概率統(tǒng)計理論,但也存在缺陷,如一階HMM無法表示遠距離的依賴關(guān)系,從而忽略了部分有用的統(tǒng)計特征。因此,他們提出采用高階HMM方法,并對方法做出改進,提出“前向一后向”算法和Baum-Weleh訓(xùn)練算法使得模型更易于理解和實現(xiàn)。

        劉麗云等人研究針HMM,指出高階馬爾科夫鏈模型存在維數(shù)多和存儲量大的缺點,并提出可變長的馬爾科夫鏈模型,用于預(yù)測可趨近交互位點的算法。該算法通過比對原miRNA和可趨近性的miRNA位點,從而形成具有二聚體的新序列。新序列中對不同的堿基配采用不同的符號,以代表不同類型。再用可變長HMM模擬新序列,并在概率后綴樹上加入平滑化技術(shù)改進模型。通過比較正、負分類上新序列概率的大小判斷新序列所屬類別。

        Wei Shen等人提出基于二級結(jié)構(gòu)模式的固定階馬爾可夫模型方法對mieroRNA進行預(yù)測,建立了一個閥桿凸出間隙符號描述發(fā)夾的二級結(jié)構(gòu),成功地從發(fā)夾序列直接實現(xiàn)了成熟miRNAs的全功能識別。

        3非負矩陣分解算法

        2013年尤燕玲等人利用非負矩陣分解算法和粒子群優(yōu)化算法對miRNA與基因的互作關(guān)系展開了深入的探索。他們的研究得出了50對新的miRNA與基因互作關(guān)系對,并對這50個關(guān)系對的生物學(xué)意義做部分闡述。具體做法是:在給定的基因與基因互作數(shù)據(jù),及已知的miRNA與基因互作關(guān)系上,同時用收斂圖檢測算法的收斂有效性;同時,考慮到非負矩陣分解算法在對miRNA與基因整合時,并沒有注意到基因與miRNA互作關(guān)系的生物學(xué)統(tǒng)計意義。因此,引入粒子群優(yōu)化算法,對非負矩陣分解算法中的目標函數(shù)參數(shù)值進行優(yōu)化,并以miRNA與基因數(shù)據(jù)矩陣的皮爾森系數(shù)值作適應(yīng)值。

        4混合分類器

        2016年梅端等人提出一種改進的SVM算法對miRNA表達譜的分析,文章提出了一種新的數(shù)據(jù)挖掘算法——SVM-KNN.該算法的思想是:首先采用統(tǒng)計量法對該數(shù)據(jù)集進行特征初選,其次將融合了支持向量機和k-最近鄰判別法思想的SVM-KNN算法作為分類器,最后輸出分類結(jié)果,SVM-KNN分類器的分類效果,比分另4單獨運行SVM-KNN分類器和SVM-KNN分類器的分類效果都要好㈣。

        5小結(jié)

        miRNA的研究仍有許多問題需要解決,目前所采用的支持向量機、馬爾科夫鏈模型、非負矩陣分解、KNN算法等熱點分類方法,在識別過程中起著重要作用,但仍然有很多不足,如數(shù)據(jù)的單一值特征選取,生物數(shù)據(jù)庫的基因組、代謝基因組、蛋白質(zhì)組數(shù)據(jù)多特征分類,還有很大的研究空間。

        猜你喜歡
        支持向量機
        基于支持向量回歸機的電能質(zhì)量評估
        基于智能優(yōu)化算法選擇特征的網(wǎng)絡(luò)入侵檢測
        數(shù)據(jù)挖掘技術(shù)在電廠經(jīng)濟性分析系統(tǒng)中的應(yīng)用Q
        基于改進支持向量機的船舶縱搖預(yù)報模型
        中國水運(2016年11期)2017-01-04 12:26:47
        基于SVM的煙草銷售量預(yù)測
        動態(tài)場景中的視覺目標識別方法分析
        論提高裝備故障預(yù)測準確度的方法途徑
        價值工程(2016年32期)2016-12-20 20:36:43
        基于熵技術(shù)的公共事業(yè)費最優(yōu)組合預(yù)測
        價值工程(2016年29期)2016-11-14 00:13:35
        基于支持向量機的金融數(shù)據(jù)分析研究
        管理類研究生支持向量機預(yù)測決策實驗教學(xué)研究
        考試周刊(2016年53期)2016-07-15 09:08:21
        中文字幕这里都是精品| 四虎影视免费永久在线观看| 高清中文字幕一区二区| 丝袜美腿福利一区二区| 私人vps一夜爽毛片免费| 性猛交╳xxx乱大交| 无码成人一区二区| 人妻少妇边接电话边娇喘| 国产精品露脸视频观看| 久九九久视频精品网站| 日本高清一区二区在线播放| 激情久久黄色免费网站| 亚洲乱码中文字幕在线播放| 狠狠摸狠狠澡| 人人妻人人妻人人片av| 免费国精产品自偷自偷免费看| 久久久久久久尹人综合网亚洲| 免费人成网站在线播放 | 国产亚洲美女精品久久久| 亚洲日本va99在线| 国产精品久久久久免费a∨不卡| 在线播放偷拍一区二区| 一本色道久久综合亚洲精品不| 在线免费看91免费版.| 无套内谢孕妇毛片免费看| 亚洲综合成人婷婷五月网址| 日韩欧美人妻一区二区三区| 亚洲av无码专区国产乱码不卡| 国产中文aⅴ在线| 日本一区二区三区四区在线看| 久久久人妻一区二区三区蜜桃d| 国产91传媒一区二区三区| 亚洲精品无码专区在线在线播放| 亚洲伊人一本大道中文字幕| 久久国产色av| 亚洲国产精品免费一区| 日本精品少妇一区二区| 亚洲中文字幕午夜精品| 国产乱子伦| 中文字幕人妻av一区二区| 国产福利酱国产一区二区|