亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        用支持向量機(jī)對(duì)新陳代謝網(wǎng)絡(luò)進(jìn)行預(yù)測(cè)

        2015-12-28 06:34:33
        科學(xué)中國(guó)人 2015年24期
        關(guān)鍵詞:狀態(tài)機(jī)產(chǎn)物向量

        劉 浩

        大連交通大學(xué)

        用支持向量機(jī)對(duì)新陳代謝網(wǎng)絡(luò)進(jìn)行預(yù)測(cè)

        劉 浩

        大連交通大學(xué)

        用支持向量機(jī)的方法輔助以有窮狀態(tài)機(jī)對(duì)新陳代謝網(wǎng)絡(luò)進(jìn)行預(yù)測(cè),該方法比基因注釋的方法不僅提高了運(yùn)行速度,同時(shí)還大大的提高了準(zhǔn)確率,克服了其弊端,即累積錯(cuò)誤導(dǎo)致準(zhǔn)確率下降的問(wèn)題。

        代謝網(wǎng)絡(luò);代謝途徑;基因注釋;累積錯(cuò)誤;軟件工程;有窮狀態(tài)機(jī);支持向量機(jī)

        背景

        研究人體的新陳代謝網(wǎng)絡(luò),對(duì)于理解哪條代謝路徑出現(xiàn)問(wèn)題而導(dǎo)致疾病來(lái)說(shuō)非常重要。新陳代謝網(wǎng)絡(luò)允許使用者對(duì)某個(gè)具體的生化反應(yīng)的細(xì)節(jié)進(jìn)行相應(yīng)的放縮。新陳代謝網(wǎng)絡(luò)好比是城市中所有交通工具的坐標(biāo)。實(shí)際應(yīng)用時(shí),類似的代謝網(wǎng)絡(luò)能夠幫助生物學(xué)家提高酵母生產(chǎn)乙醇的產(chǎn)量以及預(yù)測(cè)金黃色葡萄球菌、大腸桿菌等微生物的抗藥性,能將其用來(lái)研究各種與代謝有關(guān)的疾病。因而,若能準(zhǔn)確預(yù)測(cè)出新陳代謝網(wǎng)絡(luò),對(duì)于我們今后的研究及應(yīng)用至關(guān)重要。但遺憾的是,目前在代謝網(wǎng)絡(luò)中仍然有眾多的代謝途徑無(wú)法被清晰地描述出來(lái),而現(xiàn)有的手段則是在基因?qū)用?,依靠基因注釋的比?duì),但這種方案存在一個(gè)缺陷,即基因注釋的累積錯(cuò)誤會(huì)降低預(yù)測(cè)結(jié)果的準(zhǔn)確度,并且數(shù)據(jù)量越大,積累的錯(cuò)誤越多,且錯(cuò)誤會(huì)呈幾何級(jí)增長(zhǎng),最終得到的預(yù)測(cè)結(jié)果很可能與實(shí)際大相徑庭,因而在此我們引入軟件工程中的有窮狀態(tài)機(jī)(Finite State Machine)并且結(jié)合支持向量機(jī)(Support Vector Machine)為該問(wèn)題提出解決方案。

        新陳代謝網(wǎng)絡(luò)是各種新陳代謝途徑的集合。把生物體內(nèi)從A到X的酶反應(yīng)常規(guī)程序(A→B→C→……→X),稱為A至X的代謝途徑。A→B、B→C等各反應(yīng)則稱為中間代謝(途徑),而在代謝過(guò)程中,B,C等最終產(chǎn)物X之前的中間產(chǎn)物既是上一個(gè)代謝反應(yīng)的輸出產(chǎn)物,同時(shí)也是下一個(gè)酶反應(yīng)的輸入產(chǎn)物。各代謝途徑之間的緊密聯(lián)系,形成了新陳代謝網(wǎng)絡(luò),每個(gè)節(jié)點(diǎn)均是各種代謝的中間產(chǎn)物。

        支持向量機(jī)是機(jī)器學(xué)習(xí)領(lǐng)域中,一個(gè)比較有效的監(jiān)督學(xué)習(xí)模型,通常用于分類,識(shí)別(如圖像識(shí)別,手寫(xiě)輸入識(shí)別等)以及回歸分析等,廣泛應(yīng)用于各個(gè)領(lǐng)域。

        現(xiàn)在引入有窮狀態(tài)機(jī),給定一個(gè)初態(tài)集I(Initial),終態(tài)集F(Fi?nal),狀態(tài)集S(State),轉(zhuǎn)換函數(shù)T(Transition),初態(tài)權(quán)重函數(shù)WI,終態(tài)權(quán)重函數(shù)WF,其中I與F均是S的子集,另外還有輸入集∑,輸出集Δ。

        節(jié)點(diǎn)圖G為代謝網(wǎng)絡(luò)中各個(gè)中間產(chǎn)物組成的圖,其中節(jié)點(diǎn)為中間產(chǎn)物,邊為生化反應(yīng),各個(gè)代謝途徑之間緊密聯(lián)系形成了代謝網(wǎng)絡(luò)。

        原理

        我們的目的是根據(jù)現(xiàn)有的已經(jīng)了解的代謝網(wǎng)絡(luò)對(duì)未知的代謝網(wǎng)絡(luò)進(jìn)行功能預(yù)測(cè),由酶的專一性我們可知,一種酶只能催化一種或者一類生化反應(yīng),而大多數(shù)酶的組成成分為蛋白質(zhì),少部分為RNA,因而我們對(duì)于新陳代謝網(wǎng)絡(luò)的預(yù)測(cè)就轉(zhuǎn)化為了對(duì)于蛋白質(zhì)和RNA序列的比對(duì),如果比對(duì)結(jié)果的相似度越高,則功能越相似。由于之前對(duì)一個(gè)未知的代謝網(wǎng)絡(luò)在基因?qū)用嬗没蜃⑨尩氖侄螌?duì)新陳代謝網(wǎng)絡(luò)進(jìn)行預(yù)測(cè)會(huì)有累計(jì)錯(cuò)誤的問(wèn)題,因而,我們現(xiàn)選用Pairwise Kernels進(jìn)行改進(jìn),倘若無(wú)法找到一個(gè)合適的比對(duì)序列預(yù)測(cè)其功能,我們可以通過(guò)將該代謝網(wǎng)絡(luò)圖與已知的代謝網(wǎng)絡(luò)圖進(jìn)行第二次比對(duì),或者在得到較好的蛋白質(zhì)或者基因比對(duì)結(jié)果的情況下,結(jié)合代謝網(wǎng)絡(luò)圖,對(duì)于網(wǎng)絡(luò)內(nèi)部的代謝途徑進(jìn)行進(jìn)一步剖析。

        核函數(shù)的選擇

        普通的核函數(shù)特點(diǎn)是其核函數(shù)內(nèi)有兩個(gè)參數(shù)x和y,主要用于度量?jī)蓚€(gè)對(duì)象間的相似程度,但是當(dāng)度量對(duì)象為成對(duì)或者以更多的組合出現(xiàn)的時(shí)候,例如蛋白質(zhì)對(duì)(x1,x2),(y1,y2),普通核就不是很適用了,這是因?yàn)椋▁1,x2)與(y1,y2)進(jìn)行相似度比較的時(shí)候,不僅要考慮x1,x2及y1,y2的相似程度,還要考慮x1,y2及x2,y1的相似程度,因而我們須將二者進(jìn)行綜合考量后選出較高的那組作為最終結(jié)果。而Pairwise核正好提供了一種名為“交叉比較”的算法,其本身對(duì)于元素間組合的次序不敏感,即樣例(x,y)和樣例(y,x)所得到的比對(duì)結(jié)果是相同的,這正好符合“物質(zhì)之間是相互作用的”。

        定義1.X屬于輸入集∑的一個(gè)子集,轉(zhuǎn)換函數(shù)T,則在(X×X)×(X×X)→R上,有①K((x1,x2),(y1,y2))=T(x1,y1)+T(x1,y2)+T(x2,y1)+T(x2,y2)。

        定義2.ρ是輸入物的權(quán)重,λ是生成物的權(quán)重,二者均由Pair?wise kernels得到(用的是打分法,比對(duì)物質(zhì)序列,相同則打+1,不同則打-1,累積求和得到ρ,λ)。

        如下將介紹算法的原理:(1)我們比較待測(cè)新陳代謝網(wǎng)絡(luò)的酶和已知新代謝網(wǎng)絡(luò)的酶的序列,用的核函數(shù)是定義1中的①,找到最相近的酶,(2)用Pairwise的打分法對(duì)輸入和輸出產(chǎn)物進(jìn)行序列對(duì)比,將(1)(2)得到的結(jié)果進(jìn)行綜合評(píng)測(cè),則可以預(yù)測(cè)該待測(cè)新陳代謝網(wǎng)絡(luò)。

        然后是對(duì)預(yù)測(cè)完后的新陳代謝網(wǎng)絡(luò)進(jìn)行內(nèi)部的具體剖析,先拿出一條代謝途徑,在上一步中,若給定一個(gè)相似度臨界值ξ,則會(huì)在大于或者等于臨界值ξ的基礎(chǔ)上生成一個(gè)集合,我們令這個(gè)集合為S,即相似度集合,在這個(gè)集合內(nèi),我們將每次生化反應(yīng)的產(chǎn)物與該集合中各個(gè)網(wǎng)絡(luò)中的節(jié)點(diǎn)(即中間產(chǎn)物)進(jìn)行序列對(duì)比,找到相似度最高的節(jié)點(diǎn)并參考其功能以及其局部網(wǎng)絡(luò)的組成方式與結(jié)構(gòu),然后進(jìn)行遞增與迭代,將所得到的所有比對(duì)后的產(chǎn)物,運(yùn)用有窮狀態(tài)機(jī)畫(huà)出各個(gè)產(chǎn)物之間的轉(zhuǎn)換關(guān)系圖,然后將各個(gè)代謝途徑用以上方法進(jìn)行循環(huán)遞增和迭代,得到各個(gè)代謝途徑之間的聯(lián)系,然后組成代謝網(wǎng)絡(luò)。

        總結(jié)

        根據(jù)以上所述,支持向量機(jī)作為一種近年來(lái)比較實(shí)用的機(jī)器學(xué)習(xí)方法,在若干具有挑戰(zhàn)性的應(yīng)用項(xiàng)目中取得了最好的性能,是一個(gè)令人十分矚目的發(fā)展方向。在不同的情境中,需要不同的核函數(shù)。相較于其他核函數(shù),在此提出的Pairwise Kernels是一種較為合理的解決方案,由于現(xiàn)實(shí)情況中基因和蛋白質(zhì)序列的復(fù)雜性,我們需要根據(jù)實(shí)際情況對(duì)核函數(shù)進(jìn)行相應(yīng)的改進(jìn),從而得到最符合期待的結(jié)果,并且實(shí)現(xiàn)效率的最大化。

        猜你喜歡
        狀態(tài)機(jī)產(chǎn)物向量
        低共熔溶劑在天然產(chǎn)物提取中的應(yīng)用
        向量的分解
        聚焦“向量與三角”創(chuàng)新題
        《天然產(chǎn)物研究與開(kāi)發(fā)》青年編委會(huì)
        基于有限狀態(tài)機(jī)的交會(huì)對(duì)接飛行任務(wù)規(guī)劃方法
        向量垂直在解析幾何中的應(yīng)用
        向量五種“變身” 玩轉(zhuǎn)圓錐曲線
        遠(yuǎn)志水解產(chǎn)物的分離及鑒定
        FPGA設(shè)計(jì)中狀態(tài)機(jī)安全性研究
        基于反熔絲FPGA的有限狀態(tài)機(jī)加固設(shè)計(jì)
        日日噜噜夜夜狠狠久久av| 国产精品美女久久久久久| 久久精品视频在线看99| 免费黄色福利| 日本精品av中文字幕| 亚洲a无码综合a国产av中文| 午夜无码伦费影视在线观看| 精品午夜久久网成年网| 久久精品网站免费观看| 少妇激情一区二区三区99| 黄网站欧美内射| 中文字幕AⅤ人妻一区二区| 超短裙老师在线观看一区二区| 国产自拍精品视频免费| 亚洲女初尝黑人巨高清| 久久国产亚洲精品超碰热| 国语自产啪在线观看对白| 18禁止进入1000部高潮网站| 亚洲精品乱码久久久久久蜜桃图片| 国产精品福利小视频| 国产久久久自拍视频在线观看| 国产精品天干天干综合网| 欧美黑人巨大xxxxx| 青青草视频在线视频播放| 日韩精品视频高清在线| 国产成人亚洲精品青草天美| 无码日韩人妻AV一区免费| 国产91在线精品观看| 亚洲欧洲成人a∨在线观看| 丰满人妻熟妇乱又伦精品视| 国产精品制服一区二区| 亚洲av专区国产一区| 99国产精品无码| 亚洲色大成人一区二区| 国产av一区二区网站| 777米奇色狠狠俺去啦| 在线观看欧美精品| av天堂一区二区三区| 国产香港明星裸体xxxx视频 | 99久久国产综合精品麻豆| 无码人妻精品中文字幕免费|