亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        多組學(xué)數(shù)據(jù)分析中關(guān)聯(lián)網(wǎng)絡(luò)融合ANF算法及應(yīng)用研究*

        2021-01-09 07:03:32哈爾濱醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)學(xué)教研室150081徐臻旖
        關(guān)鍵詞:差異效果方法

        哈爾濱醫(yī)科大學(xué)衛(wèi)生統(tǒng)計(jì)學(xué)教研室(150081) 徐臻旖 王 策 侯 艷 李 康

        【提 要】 目的 引入關(guān)聯(lián)網(wǎng)絡(luò)融合(affinity network fusion,ANF)方法對(duì)多組學(xué)數(shù)據(jù)進(jìn)行整合分析,并應(yīng)用于腫瘤分子分型研究。方法 模擬產(chǎn)生兩組學(xué)數(shù)據(jù),改變總體差異大小等情況比較多種多組學(xué)整合方法的效果。實(shí)例分析中目標(biāo)人群選擇TCGA數(shù)據(jù)庫(kù)中對(duì)鉑類藥物敏感并擁有mRNA和甲基化兩個(gè)組學(xué)的卵巢癌患者,目標(biāo)基因是TCGA數(shù)據(jù)庫(kù)和ImmPort數(shù)據(jù)庫(kù)中共有基因,目標(biāo)甲基化位點(diǎn)是目標(biāo)基因?qū)?yīng)的所有甲基化位點(diǎn)。使用ANF、SNF、K-means、系統(tǒng)聚類和iCluster五種方法比較聚類效果。結(jié)果 模擬實(shí)驗(yàn)提示存在總體差異的兩亞型間差異較小時(shí)ANF方法的效果明顯優(yōu)于其他方法。實(shí)例分析結(jié)果表明,通過(guò)ANF方法進(jìn)行多組學(xué)數(shù)據(jù)整合得到的分子分型較單組學(xué)得到的分子分型有更好的生物學(xué)意義且多組學(xué)聚類效果優(yōu)于其他方法。結(jié)論 ANF方法可以應(yīng)用于多組學(xué)數(shù)據(jù)整合分析,具有實(shí)際應(yīng)用意義。

        多組學(xué)指基因組、轉(zhuǎn)錄組、蛋白質(zhì)組及代謝組等,利用多組學(xué)進(jìn)行整合分析能提供更多的信息。傳統(tǒng)的分析方法是對(duì)各組學(xué)分別進(jìn)行分析,然后再根據(jù)生物學(xué)知識(shí)對(duì)其進(jìn)行解釋。這種分析方法的不足之處在于不能充分利用數(shù)據(jù)提供的信息,從根本上建立各組學(xué)之間的關(guān)系。根據(jù)不同目的可將多組學(xué)整合方法分為不同類型,如基于奇異值分解發(fā)現(xiàn)組學(xué)間調(diào)控關(guān)系的JIVE(joint and individual variation explained)方法[1],基于聯(lián)合潛在變量模型的iCluster方法以及基于樣本間網(wǎng)絡(luò)結(jié)構(gòu)得到分子亞型的相似網(wǎng)絡(luò)融合(similarity network fusion,SNF)方法等[2-3]。本文引進(jìn)關(guān)聯(lián)網(wǎng)絡(luò)融合法(affinity network fusion,ANF),與SNF方法相比計(jì)算過(guò)程更簡(jiǎn)潔,可利用先驗(yàn)信息對(duì)不同組學(xué)進(jìn)行加權(quán)。ANF將不同組學(xué)的數(shù)據(jù)矩陣進(jìn)行轉(zhuǎn)化再整合分析,為多組學(xué)研究提供有價(jià)值的信息[4]。

        原理和方法

        ANF是一種利用多組學(xué)數(shù)據(jù)構(gòu)建矩陣的方法,即通過(guò)隨機(jī)游走的方式將分別構(gòu)建的組學(xué)樣本間關(guān)聯(lián)矩陣進(jìn)一步整合[4],對(duì)最終得到的包含多組學(xué)信息的關(guān)聯(lián)矩陣進(jìn)行譜聚類分析。

        具體步驟如下:

        1.構(gòu)建關(guān)聯(lián)矩陣

        (1)

        (2)

        (3)

        2.不同組學(xué)關(guān)聯(lián)矩陣融合

        (4)

        (5)

        對(duì)得到的關(guān)聯(lián)矩陣W進(jìn)行多分類譜聚類分析[5]。多分類譜聚類由Stella等人提出,與標(biāo)準(zhǔn)譜聚類不同在于該方法使用奇異值分解進(jìn)行計(jì)算,聚類數(shù)目通過(guò)啟發(fā)式特征間隙法(eigengap heuristic)進(jìn)行確定,假設(shè)求得m個(gè)特征值λ1,…,λm,存在i∈[1,m],使得λi與λi+1的差值較大,則認(rèn)為聚類類別數(shù)為i類。

        3.聚類效果評(píng)價(jià)

        聚類效果的衡量指標(biāo)通常分為兩大類:第一類為有監(jiān)督方法,已知真實(shí)標(biāo)簽,用一定的度量評(píng)判聚類結(jié)果與真實(shí)標(biāo)簽的符合程度,例如標(biāo)準(zhǔn)化互信息(NMI)[0,1],NMI的值越接近1表明得到聚類結(jié)果與真實(shí)情況越吻合;第二類為無(wú)監(jiān)督方法,根據(jù)是否滿足類內(nèi)聚集程度高與類間離散程度大對(duì)聚類效果進(jìn)行評(píng)價(jià),例如輪廓系數(shù)(silhouette coefficient),其值越接近1表明聚類越合理,越接近-1表示可能存在錯(cuò)分情況;還可通過(guò)比較生存分析的預(yù)后情況評(píng)價(jià)聚類效果。

        模擬實(shí)驗(yàn)

        可以看到,隨著差異變量比例和不同亞組差異變量均值差異增加,NMI逐漸增加,ANF在不同亞型總體差異較小時(shí)效果優(yōu)于其他四種方法,如均數(shù)差值為4,變量數(shù)為200,差異變量為15%時(shí),ANF的NMI值為0.750,明顯大于其他聚類方法的NMI值。當(dāng)不同亞型總體差異逐漸增加達(dá)到一定程度時(shí),除系統(tǒng)聚類外以上方法的聚類效果均較好。

        實(shí)例分析

        本研究對(duì)使用鉑類藥物敏感的卵巢癌患者進(jìn)行免疫亞型分析。選擇TCGA數(shù)據(jù)庫(kù)中同時(shí)擁有mRNA、甲基化數(shù)據(jù)以及患者臨床信息的卵巢癌樣本,使用ImmPort數(shù)據(jù)庫(kù)確定與免疫相關(guān)的mRNA?;熋舾谢颊叨x為使用大于等于六個(gè)周期的鉑類藥物且化療后無(wú)進(jìn)展生存期為六個(gè)月以上的患者;將化療耐藥患者定義為第一次使用鉑類藥物化療耐藥以及在治療周期完成后六個(gè)月內(nèi)復(fù)發(fā)的患者[7]。

        對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,將樣本ID匹配,要求樣本同時(shí)具有mRNA數(shù)據(jù)和甲基化數(shù)據(jù),選擇TCGA與ImmPort數(shù)據(jù)庫(kù)中共有的mRNA,同時(shí)確定mRNA所對(duì)應(yīng)的甲基化位點(diǎn)。刪除重復(fù)變量,將mRNA中超過(guò)70%為0的變量剔除,將甲基化位點(diǎn)中超過(guò)70%缺失的變量剔除,并用最近鄰KNN算法填補(bǔ)剩余缺失值。最終鉑類藥物化療敏感人群136人,1211個(gè)mRNA以及2140個(gè)甲基化位點(diǎn)納入本次研究。對(duì)mRNA數(shù)據(jù)的表達(dá)值進(jìn)行l(wèi)og2(count+1)轉(zhuǎn)化,由于不同組學(xué)存在異質(zhì)性問(wèn)題,將轉(zhuǎn)化后的mRNA數(shù)據(jù)以及甲基化數(shù)據(jù)進(jìn)行Z-score標(biāo)準(zhǔn)化處理。

        表1 基于NMI評(píng)價(jià)指標(biāo)對(duì)五種無(wú)監(jiān)督聚類方法結(jié)果比較

        對(duì)預(yù)處理得到的數(shù)據(jù)分別使用ANF、SNF、K-means、iCluster以及系統(tǒng)聚類方法分析,提示聚類分為兩類,因此將卵巢癌鉑類藥物敏感患者分為兩個(gè)免疫亞型即免疫I型和免疫II型,通過(guò)log-rank檢驗(yàn)比較亞型間的生存差異。為增加方法間的可比性,對(duì)于SNF和ANF兩種方法,分別選擇log-rank檢驗(yàn)得到P值最小時(shí)的參數(shù)k,其中ANF中k分別選擇30和15。結(jié)果參見表2。

        表2 無(wú)監(jiān)督聚類得到免疫分子分型的log-rank生存分析結(jié)果比較

        結(jié)果顯示對(duì)ANF得到的無(wú)監(jiān)督聚類標(biāo)簽進(jìn)行l(wèi)og-rank檢驗(yàn)P<0.001(HR=2.900,95%CI(1.809,4.648)),P值小于其他四個(gè)方法的P值,其中通過(guò)系統(tǒng)聚類進(jìn)行生存分析模型不收斂,同時(shí)多組學(xué)整合無(wú)監(jiān)督聚類結(jié)果優(yōu)于單組學(xué)無(wú)監(jiān)督聚類結(jié)果。圖1表示利用以上方法進(jìn)行多組學(xué)整合得到的Kaplan-Meier生存曲線。

        圖1-A顯示利用ANF方法得到的免疫分型I型和II型的生存曲線,發(fā)現(xiàn)I型預(yù)后好于II型預(yù)后。為了進(jìn)一步證明多組學(xué)聚類效果優(yōu)于單組學(xué)聚類效果,使用ANF方法得到的mRNA、甲基化以及mRNA和甲基化多組學(xué)整合的聚類結(jié)果計(jì)算輪廓系數(shù),參見圖2,A~C圖中縱軸表示每個(gè)樣本及其所在的亞組,橫軸表示每個(gè)樣本的輪廓系數(shù)值,最終取平均得到該組學(xué)的輪廓系數(shù)值,值越接近1表示聚類效果越合理。結(jié)果顯示,通過(guò)多組學(xué)聚類的輪廓系數(shù)0.42高于單組學(xué)聚類輪廓系數(shù)(mRNA:0.32;甲基化:0.3),進(jìn)一步說(shuō)明多組學(xué)在無(wú)監(jiān)督聚類亞型分析中的價(jià)值。

        圖1 多組學(xué)整合的化療敏感患者免疫分型生存曲線

        為了控制其他因素對(duì)生存的影響,將年齡(≥60歲和<60歲),化療緩解情況(完全緩解和非完全緩解),腫瘤分化程度(高分化G1,中分化G2,低分化G3,未分化G4),腫瘤臨床分期(I期,II期,III期,IV期)列為協(xié)變量,Cox比例風(fēng)險(xiǎn)回歸模型結(jié)果見表3。

        結(jié)果表明,校正上述協(xié)變量后,I型預(yù)后仍好于II型預(yù)后。可以看出ANF得到的免疫亞型是卵巢癌化療敏感人群的獨(dú)立預(yù)后因素。

        為了進(jìn)一步確定I型和II型的差異變量,本研究使用LASSO算法進(jìn)行組間差異變量篩選,得到43個(gè)差異mRNA以及39個(gè)差異甲基化位點(diǎn),將得到的差異變量在不同樣本間表達(dá)量尺度歸一化,使用R包pheatmap畫出熱圖,表示如圖3。

        表3 調(diào)整協(xié)變量后的Cox比例風(fēng)險(xiǎn)回歸模型結(jié)果

        根據(jù)熱圖可以看出不同亞型的組間差別。據(jù)文獻(xiàn)報(bào)道,BMPR1B在乳腺癌中高表達(dá)與較差的生存預(yù)后相關(guān)[8]。PIK3CD在其他癌癥如結(jié)腸癌組織和CRC細(xì)胞系中過(guò)表達(dá),是結(jié)腸癌患者總體生存的獨(dú)立預(yù)測(cè)因子,并且PIK3CD與CILA4和原發(fā)性免疫缺陷有關(guān),有理由認(rèn)為BMPR1B和PIK3CD的高表達(dá)可能與卵巢癌化療敏感的患者生存預(yù)后較差相關(guān)[9-10]。甲基化位點(diǎn)中cg16097079,cg17475918分別對(duì)應(yīng)HLA-C、HLA-E,屬于主要組織相容性復(fù)合體中(MHC)的I類分子,其表達(dá)的喪失提供了關(guān)鍵的免疫逃避策略[11]。巨噬細(xì)胞遷移抑制因子(MIF)是一種炎性介質(zhì),可促進(jìn)炎癥細(xì)胞因子的產(chǎn)生,并具有趨化特性,可招募巨噬細(xì)胞和T細(xì)胞,目前有研究探討可將MIF作為靶標(biāo)對(duì)卵巢癌以及泌尿生殖系統(tǒng)癌癥患者進(jìn)行治療,本研究中在甲基化位點(diǎn)cg20377673所對(duì)應(yīng)的基因以及mRNA中均發(fā)現(xiàn)MIF表達(dá)在得到的免疫亞型間存在差異[12-14]。因此,針對(duì)鉑類藥物敏感的卵巢癌患者的不同免疫亞型,使用特定的免疫靶點(diǎn)治療可能增加患者的預(yù)后生存。

        圖3 不同分子亞型中差異基因表達(dá)的熱圖

        討 論

        與傳統(tǒng)的使用單組學(xué)數(shù)據(jù)聚類發(fā)現(xiàn)疾病亞型相比,包含多種組學(xué)信息可以彌補(bǔ)單組學(xué)的局限性,生物學(xué)解釋更合理,有效提高患者預(yù)后效果。利用樣本多組學(xué)數(shù)據(jù)進(jìn)行網(wǎng)絡(luò)構(gòu)建的ANF算法在原始SNF算法的基礎(chǔ)上簡(jiǎn)化了迭代過(guò)程,使計(jì)算上更為簡(jiǎn)便且效果良好,提高運(yùn)算效率。通過(guò)矩陣變換使其在解釋上更為合理,同時(shí)可對(duì)不同組學(xué)信息進(jìn)行加權(quán),更符合生物學(xué)意義。

        模擬實(shí)驗(yàn)結(jié)果提示通過(guò)改變差異變量的均數(shù)差值以及差異變量百分比,當(dāng)亞型總體差異較小時(shí),ANF方法聚類效果明顯優(yōu)于其他方法。均數(shù)差異越大,差異變量百分比越高時(shí),NMI越高,聚類效果越好,當(dāng)不同亞型總體差異足夠大時(shí),除系統(tǒng)聚類外其他幾種方法效果趨于一致。

        由于鉑類藥物敏感的卵巢癌患者總生存較低,有必要對(duì)這類患者進(jìn)行進(jìn)一步治療提高患者生存。本次研究發(fā)現(xiàn)對(duì)鉑類藥物敏感的卵巢癌患者的新的免疫亞型,且該免疫亞型中通過(guò)LASSO篩選得到的差異mRNA和差異甲基化位點(diǎn)中,有目前報(bào)道的免疫靶點(diǎn)MIF等,因此針對(duì)不同免疫亞型,選擇免疫靶點(diǎn)進(jìn)行治療可能是鉑類藥物化療后的又一治療策略。

        由于收集多組學(xué)數(shù)據(jù)較為困難,目前大多數(shù)利用多組學(xué)得到的分子亞型在驗(yàn)證上難度較大。對(duì)于無(wú)監(jiān)督聚類,生存分析的結(jié)局指標(biāo)常用來(lái)對(duì)獲得亞型進(jìn)行評(píng)價(jià)分析。方法中參數(shù)的選擇可能會(huì)對(duì)假設(shè)檢驗(yàn)中的P值產(chǎn)生較大影響,因此這并不能作為唯一的評(píng)價(jià)指標(biāo),在未知組學(xué)權(quán)重的情況下,權(quán)重的設(shè)置通常較難選擇,實(shí)際中可以根據(jù)已有先驗(yàn)知識(shí)進(jìn)行設(shè)置。

        猜你喜歡
        差異效果方法
        相似與差異
        按摩效果確有理論依據(jù)
        找句子差異
        迅速制造慢門虛化效果
        生物為什么會(huì)有差異?
        抓住“瞬間性”效果
        可能是方法不對(duì)
        模擬百種唇妝效果
        Coco薇(2016年8期)2016-10-09 02:11:50
        用對(duì)方法才能瘦
        Coco薇(2016年2期)2016-03-22 02:42:52
        四大方法 教你不再“坐以待病”!
        Coco薇(2015年1期)2015-08-13 02:47:34
        国产午夜激无码av毛片不卡| 国产视频精品一区白白色| 日本一区二区啪啪视频| 一级r片内射视频播放免费| 国产l精品国产亚洲区久久| 欧美z0zo人禽交欧美人禽交| 日本一区二区国产高清在线播放| 亚洲精品中文字幕一二三四| 亚洲精品色午夜无码专区日韩| 亚洲粉嫩高潮的18p| 亚洲精品乱码久久久久99| 中文字幕亚洲五月综合婷久狠狠| 国产无遮挡又黄又爽高潮| 欧美日韩精品一区二区三区不卡| 精品无码成人片一区二区| 久久国产精品免费专区| 久久亚洲精品成人av无码网站| 成人免费视频在线观看| 果冻国产一区二区三区| 亚洲美女毛片在线视频| 少妇高潮喷水久久久影院| 欧美成人a在线网站| 一区二区三区手机看片日本韩国 | 欧洲美女熟乱av| 国产精品天天在线午夜更新| 91网红福利精品区一区二| 亚洲日本高清一区二区| 日日天干夜夜狠狠爱| 国产人成午夜免电影观看| 亚洲一区二区三区av色婷婷| 日本精品女优一区二区三区| 久青草久青草视频在线观看| 亚洲国产成人无码电影| 日产一区日产2区日产| 9 9久热re在线精品视频| 久久国产亚洲高清观看5388| 福利视频在线一区二区三区 | 97久久人人超碰超碰窝窝| 永久免费看免费无码视频 | 一区二区无码精油按摩| 亚洲av成熟国产一区二区|