亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        利用全基因組表達(dá)數(shù)據(jù)對(duì)比評(píng)價(jià)九種遺傳預(yù)測(cè)模型方法*

        2019-05-23 12:38:34徐州醫(yī)科大學(xué)公共衛(wèi)生學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)系221004余星皓黃水平
        中國衛(wèi)生統(tǒng)計(jì) 2019年2期
        關(guān)鍵詞:表型遺傳效應(yīng)

        徐州醫(yī)科大學(xué)公共衛(wèi)生學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)系(221004) 余星皓 劉 兵 曾 平 黃水平

        【提 要】 目的 研究稀疏模型(Lasso、ENET、ssLasso、貝葉斯變量選擇回歸模型(BVSR))與多基因模型(線性混合模型(LMM)、貝葉斯稀疏線性混合模型(BSLMM)、狄利克雷回歸模型(DPR))等九種遺傳預(yù)測(cè)方法在全基因組表達(dá)數(shù)據(jù)中對(duì)復(fù)雜疾病的遺傳預(yù)測(cè)表現(xiàn)。方法 通過模擬研究評(píng)價(jià)每種方法在不同的較大基因稀疏程度和不同的遺傳度下的預(yù)測(cè)精度,利用乳腺癌數(shù)據(jù)進(jìn)行表型預(yù)測(cè)。結(jié)果 模擬結(jié)果顯示預(yù)測(cè)方法在滿足各自的模型假設(shè)時(shí)表現(xiàn)結(jié)果最好。在相同模擬假設(shè)情況下,隨著遺傳度的增高,模型的預(yù)測(cè)準(zhǔn)確性也逐漸增高。BVSR運(yùn)算速度和BSLMM運(yùn)算速度相似,由于迭代次數(shù)的影響,BVSR與BSLMM的運(yùn)算速度低于LMM。實(shí)際的乳腺癌數(shù)據(jù)顯示BSLMM和DPR的預(yù)測(cè)精度優(yōu)于其他方法。結(jié)論 BSLMM和DPR在不同模擬情形下和真實(shí)數(shù)據(jù)中均表現(xiàn)出穩(wěn)健的預(yù)測(cè)能力,值得在實(shí)際應(yīng)用中推薦。

        全基因組關(guān)聯(lián)研究(genome-wide association study,GWAS)已經(jīng)發(fā)現(xiàn)了上萬個(gè)單核苷酸多態(tài)性(single-nucleotide polymorphism,SNP)位點(diǎn)與數(shù)百種復(fù)雜疾病存在關(guān)聯(lián),為表型變異的遺傳基礎(chǔ)提供了前所未有的視角[1-7]。GWAS的成功也極大促進(jìn)了利用遺傳信息(除環(huán)境和生活方式信息外)進(jìn)行復(fù)雜疾病風(fēng)險(xiǎn)預(yù)測(cè)評(píng)估的研究[8]。在動(dòng)物或植物中,具有遺傳標(biāo)記的準(zhǔn)確表型預(yù)測(cè)可以幫助選擇理想的育種個(gè)體,從而提高育種計(jì)劃的有效性[9];在人群中,利用遺傳標(biāo)記的準(zhǔn)確表型預(yù)測(cè)有利于復(fù)雜疾病的早期預(yù)防和干預(yù)、促進(jìn)開發(fā)個(gè)性化藥物,從而制定治療方案和預(yù)測(cè)療效[10]。此外,在跨組學(xué)數(shù)據(jù)分析中,表型預(yù)測(cè)也被認(rèn)為是將功能基因組測(cè)序研究與GWAS相結(jié)合的關(guān)鍵步驟,可以在GWAS中構(gòu)建更高效和具有可解釋性的基因集測(cè)試,通過設(shè)置SNP權(quán)重,將其從預(yù)測(cè)模型中推斷出來,并用于表達(dá)數(shù)量性狀位點(diǎn)映射研究[11]。

        研究者們發(fā)明了許多新的表型預(yù)測(cè)模型方法以利用全基因組遺傳位點(diǎn)信息提高預(yù)測(cè)精度。表型預(yù)測(cè)模型本質(zhì)上是對(duì)基因效應(yīng)大小分布的假設(shè)不同,例如Henderson等人[12]提出的線性混合模型(liner mixed model,LMM),Speed等人[13]提出的最佳無偏估計(jì)模型(multiple best linear unbiased prediction,MultiBLUP),Tang等人[14]提出的Bayes Lasso模型。上述方法多屬于參數(shù)模型,所假設(shè)的遺傳效應(yīng)分布是高度參數(shù)化的、由少數(shù)幾個(gè)參數(shù)決定,其局限在于僅對(duì)特定滿足模型假設(shè)的疾病預(yù)測(cè)效果良好,對(duì)其它不滿足假設(shè)的疾病預(yù)測(cè)精度不佳。理論上,模型預(yù)測(cè)精度取決于遺傳效應(yīng)先驗(yàn)與真實(shí)分布的接近程度。然而,真實(shí)的遺傳結(jié)構(gòu)往往未知,由于疾病的不同,在遺傳度、關(guān)聯(lián)位點(diǎn)個(gè)數(shù)、最小等位基因頻率和效應(yīng)大小等方面存在諸多差別。另外,這些方法先前主要利用全基因組SNP位點(diǎn)信息進(jìn)行復(fù)雜疾病的預(yù)測(cè);而越來越多的研究表明基因表達(dá)在復(fù)雜疾病的發(fā)生、發(fā)展和轉(zhuǎn)歸中起著十分重要的作用,是SNP對(duì)復(fù)雜疾病起作用的重要分子中介。因此,通過全基因組表達(dá)數(shù)據(jù)預(yù)測(cè)復(fù)雜疾病具有重要的科學(xué)意義。通過基因表達(dá)預(yù)測(cè)復(fù)雜疾病與利用SNP預(yù)測(cè)復(fù)雜疾病的差別在于,基因表達(dá)數(shù)據(jù)的變量較少,效應(yīng)可能更強(qiáng),作為一個(gè)整體的功能單位,基因相對(duì)SNP更具有結(jié)果的可解釋性。那些通過全基因組SNP位點(diǎn)獲得復(fù)雜疾病預(yù)測(cè)結(jié)論未必適合基因表達(dá)預(yù)測(cè)。

        本文主要對(duì)九種遺傳預(yù)測(cè)模型方法進(jìn)行比較,這些方法大致可分為兩類:稀疏模型和多基因模型。前者包括Lasso、elastic net(ENET)、spike-and-slab Lasso GLMs(ssLasso)、貝葉斯變量選擇回歸模型(Bayesian variable selection regression,BVSR);后者包括線性混合模型(LMM)、貝葉斯稀疏線性混合模型(Bayesian sparse linear mixed model,BSLMM)、狄利克雷回歸模型(Dirichlet process regression,DPR)等。本文通過癌癥患者基因表達(dá)數(shù)據(jù)模擬各種復(fù)雜疾病可能的遺傳結(jié)構(gòu),比較上述方法在不同情況下對(duì)于復(fù)雜疾病的預(yù)測(cè)能力,進(jìn)一步通過比較各方法在真實(shí)腫瘤數(shù)據(jù)中的預(yù)測(cè)能力評(píng)價(jià)這些方法在基因表達(dá)數(shù)據(jù)中的表型預(yù)測(cè)精度。

        材料與方法

        1.方法

        比較九種模型(稀疏模型:BVSR[15]、Lasso[16]、ENET[17]和ssLasso,多基因模型:LMM、Linear-BSLMM、Probit-BSLMM[18]、DPR.VB和DPR.MCMC[19])在遺傳預(yù)測(cè)中的能力,這些模型方法被廣泛運(yùn)用于人類復(fù)雜疾病的表型預(yù)測(cè)以及動(dòng)植物繁殖的基因選擇中。具體而言,BVSR假設(shè)較少部分的基因變異對(duì)復(fù)雜疾病或性狀產(chǎn)生效應(yīng),單個(gè)基因變異對(duì)表型的效應(yīng)較大,假設(shè)總體效應(yīng)大小符合正態(tài)分布和零點(diǎn)分布的混合分布;Lasso是在模型的離均差平方和基礎(chǔ)上增加一個(gè)絕對(duì)值的懲罰項(xiàng),使其總和小于等于一個(gè)常數(shù),是一種壓縮估計(jì)方法;ENET是一種Lasso與嶺回歸組合后的回歸分析,在絕對(duì)值懲罰項(xiàng)基礎(chǔ)上同時(shí)施加平方和懲罰項(xiàng);ssLasso假設(shè)基因的系數(shù)服從混合雙指數(shù)先驗(yàn),根據(jù)不同的基因型與表型數(shù)據(jù),產(chǎn)生適合的收縮系數(shù),并保留系數(shù)較大的基因;LMM假設(shè)所有的基因?qū)Ρ硇途a(chǎn)生效應(yīng),且效應(yīng)均較小,同時(shí)服從正態(tài)分布;BSLMM假設(shè)基因?qū)Ρ硇偷男?yīng)大小服從兩個(gè)正態(tài)分布組成的混合分布,兩個(gè)正態(tài)分布的混合程度決定于不同的混合比例,需要注意的是,針對(duì)病例對(duì)照研究(假設(shè)表型編碼為0-1),BSLMM可直接將0-1當(dāng)作連續(xù)變量通過線性模型處理,稱為Linear-BSLMM,或?qū)robit鏈接函數(shù)通過廣義線性模型處理,稱為Probit-BSLMM,圖1中分別以BSLMM1和BSLMM2表示;DPR假設(shè)基因效應(yīng)大小服從一個(gè)無窮混合正態(tài)分布,屬于非參數(shù)貝葉斯模型范疇,DPR的參數(shù)估計(jì)可通過傳統(tǒng)的馬爾科夫蒙特卡羅估計(jì),稱為DPR.MCMC,也可通過變分貝葉斯方法估計(jì),稱為DPR.VB。

        LMM、BVSR、Linear-BSLMM和Probit-BSLMM方法采用GEMMA[18]軟件執(zhí)行,DPR.VB、DPR.MCMC等方法采用DPR[19]軟件執(zhí)行,Lasso、ENET通過glmnet軟件包執(zhí)行,ssLasso通過BhGLM[20]軟件包執(zhí)行。

        2.模擬數(shù)據(jù)

        為更加接近真實(shí)數(shù)據(jù),使用916例乳腺癌患者的基因表達(dá)數(shù)據(jù),模擬三種情境下的表型數(shù)據(jù):(i)所有基因均對(duì)表型產(chǎn)生效應(yīng),分別服從正態(tài)分布、t分布或Laplace分布,設(shè)置遺傳度分別為0.2、0.5或0.8;(ii)僅有小部分基因(分別為10、50或100)對(duì)表型產(chǎn)生效應(yīng),服從正態(tài)分布,大部分剩余的基因?qū)Ρ硇途划a(chǎn)生效應(yīng),遺傳度分別為0.2、0.5或0.8;(iii)所有基因?qū)Ρ硇途a(chǎn)生效應(yīng),效應(yīng)基因分為兩部分:小部分效應(yīng)較大的基因和較大部分效應(yīng)較小的基因,兩組基因的效應(yīng)大小都服從正態(tài)分布,兩部分占遺傳度的比例分別為0.2和0.8;較大效應(yīng)的基因數(shù)量分別為10、50或100;遺傳度分別為0.2、0.5或0.8。每種情景分別重復(fù)模擬20次,每一次重復(fù)中隨機(jī)將數(shù)據(jù)中90%的個(gè)體作為訓(xùn)練集,剩余的10%作為測(cè)試集。通過訓(xùn)練集數(shù)據(jù)估計(jì)每種方法的模型參數(shù),并在測(cè)試集數(shù)據(jù)中比較不同方法的預(yù)測(cè)能力。通過表型與預(yù)測(cè)值的曲線下面積(area under the curve,AUC)評(píng)價(jià)預(yù)測(cè)效果。

        3.真實(shí)數(shù)據(jù)

        真實(shí)數(shù)據(jù)全部來源于癌癥和腫瘤基因圖譜(The Cancer Genome Atlas,TCGA),通過加利福尼亞大學(xué)基因組瀏覽器(UCSC Xena,https://xenabrowser.net/)下載乳腺癌(Breast Cancer,BRCA)數(shù)據(jù)。原始數(shù)據(jù)包括1215例患者臨床數(shù)據(jù)和1219例患者的20530個(gè)基因表達(dá)數(shù)據(jù),首先對(duì)兩份數(shù)據(jù)進(jìn)行合并,刪除重復(fù)的患者和男性患者,同時(shí)刪除2840個(gè)零表達(dá)值超過50%的基因,最終獲得916例患者的17690個(gè)基因表達(dá)數(shù)據(jù)。在數(shù)據(jù)分析前,首先將癌癥的基因表達(dá)數(shù)據(jù)分成兩部分:90%的患者為訓(xùn)練集數(shù)據(jù),剩余10%的患者為測(cè)試集數(shù)據(jù),對(duì)數(shù)據(jù)集執(zhí)行20次重復(fù)。通過AUC評(píng)價(jià)不同模型的預(yù)測(cè)能力。

        結(jié)果

        1.模擬數(shù)據(jù)結(jié)果

        情景i中(圖1-i)當(dāng)遺傳度為0.2時(shí),效應(yīng)大小的分布服從正態(tài)分布的情況下,各模型的預(yù)測(cè)能力接近。效應(yīng)大小的分布服從t分布和Laplace分布的情況下,多基因模型的預(yù)測(cè)能力均高于稀疏模型,多基因模型的預(yù)測(cè)能力大小接近。當(dāng)遺傳度為0.5或0.8時(shí),三種情況下多基因模型中五種模型的預(yù)測(cè)準(zhǔn)確性相對(duì)接近,優(yōu)于稀疏模型,BVSR預(yù)測(cè)能力最低。當(dāng)遺傳度為0.8時(shí),各統(tǒng)計(jì)學(xué)模型的預(yù)測(cè)結(jié)果AUC均在0.7左右,高于遺傳度為0.2和0.5時(shí)的預(yù)測(cè)結(jié)果。

        情景ii中(圖1-ii)當(dāng)遺傳度為0.2或0.5時(shí),稀疏模型的預(yù)測(cè)能力優(yōu)于多基因模型,但是,隨著效應(yīng)基因數(shù)量和遺傳度增加,稀疏模型與多基因模型之間的差異逐漸縮小;當(dāng)遺傳度為0.8:效應(yīng)基因數(shù)量為10的時(shí)候,BSLMM和DPR的預(yù)測(cè)能力較強(qiáng),其余多基因模型精度稍低。隨著效應(yīng)基因數(shù)量增加,稀疏模型與多基因模型之間的差異越小,當(dāng)效應(yīng)基因數(shù)量為100時(shí),稀疏模型的預(yù)測(cè)能力要低于多基因模型。

        情景iii中(圖1-iii)當(dāng)遺傳度為0.2時(shí),三種情況下多基因模型的預(yù)測(cè)效果均高于稀疏模型,其中BVSR的預(yù)測(cè)能力最差,linear-BSLMM、probit-BSLMM和DPR.MCMC的預(yù)測(cè)能力較強(qiáng)且較穩(wěn)定。當(dāng)遺傳度為0.5時(shí),多基因模型的預(yù)測(cè)效果優(yōu)于稀疏模型,BSLMM和DPR的預(yù)測(cè)能力較穩(wěn)定,且精度較高。當(dāng)較大效應(yīng)基因數(shù)量增加時(shí),Lasso和ENET的預(yù)測(cè)能力上升;當(dāng)遺傳度為0.8時(shí),較大效應(yīng)基因的數(shù)量不同時(shí),模型之間預(yù)測(cè)結(jié)果相似。多基因模型的預(yù)測(cè)結(jié)果相似。稀疏模型的預(yù)測(cè)結(jié)果相對(duì)不穩(wěn)。在不同情況下,多基因模型的預(yù)測(cè)能力均稍高于稀疏模型。各統(tǒng)計(jì)學(xué)模型的預(yù)測(cè)結(jié)果AUC均在0.75左右,高于遺傳度為0.2或0.5時(shí)的預(yù)測(cè)結(jié)果。

        圖1 遺傳度0.2(A)、0.5(B)、0.8(C)時(shí)三種模擬情景下Lasso(紅)、ENET(綠)、ssLasso(深藍(lán))、BVSR(綠)、LMM(藍(lán))、BSLMM1(Linear-BSLMM)(黃)、BSLMM2(Probit-BSLMM)(紫)、DPR.VB(淺藍(lán))、DPR.MCMC(粉)之間AUC估計(jì)值的比較

        2.真實(shí)數(shù)據(jù)結(jié)果

        真實(shí)數(shù)據(jù)來源于上述的乳腺癌數(shù)據(jù),將術(shù)后淋巴結(jié)陽性轉(zhuǎn)移作為預(yù)測(cè)的表型數(shù)據(jù)(編碼為0-1,視為連續(xù)變量應(yīng)用線性模型處理)。經(jīng)過計(jì)算,數(shù)據(jù)的真實(shí)遺傳度為0.15。各方法表型預(yù)測(cè)結(jié)果AUC均在0.61左右(圖2A),多基因模型的預(yù)測(cè)能力均高于稀疏模型。多基因模型中,五種方法的預(yù)測(cè)能力幾乎無差異(雖然DPR和BSLMM輕微略高)。稀疏模型中,ENET的預(yù)測(cè)能力最強(qiáng),Lasso與BVSR的預(yù)測(cè)能力接近,ssLasso的預(yù)測(cè)能力最低。同時(shí),采用Logistic回歸分析各基因的效應(yīng)大小,并繪制相應(yīng)的分布密度函數(shù),與正態(tài)分布、Laplace分布和自由度為4的t分布相比較(圖2B)。

        3.運(yùn)算時(shí)間

        最后對(duì)比各種方法的運(yùn)算速度,以乳腺癌數(shù)據(jù)為例。這里需要說明的是,貝葉斯預(yù)測(cè)方法的運(yùn)算時(shí)間與所使用的迭代次數(shù)有關(guān)系,為了節(jié)省時(shí)間,這里只進(jìn)行了100次迭代。結(jié)果顯示(表1),Lasso、ENET和ssLasso的運(yùn)算速度最快,其次為LMM和DPR.VB;BVSR、BSLMM和DPR.MCMC運(yùn)算速度相近,且時(shí)間均較長。

        討論

        本文所提及的多種統(tǒng)計(jì)學(xué)方法在遺傳統(tǒng)計(jì)學(xué)的多個(gè)方面都有較好的應(yīng)用價(jià)值,例如估計(jì)遺傳度[18]和關(guān)聯(lián)映射[21]。本文主要致力于多種統(tǒng)計(jì)學(xué)方法在表型預(yù)測(cè)方面的研究。國內(nèi)外已發(fā)表的文獻(xiàn)[13,18-19,22-24]主要研究表型預(yù)測(cè)方法在GWAS中的比較,已取得較大成果,本文通過模擬不同的疾病遺傳結(jié)構(gòu),比較了兩類統(tǒng)計(jì)學(xué)方法在基因表達(dá)數(shù)據(jù)中的預(yù)測(cè)能力。模擬數(shù)據(jù)分析結(jié)果顯示,各模型在表型預(yù)測(cè)上的表現(xiàn)不同。當(dāng)模擬假設(shè)全部基因?qū)Ρ硇途a(chǎn)生效應(yīng)時(shí),多基因模型的預(yù)測(cè)能力要高于稀疏模型;當(dāng)模擬假設(shè)只有部分基因?qū)Ρ硇彤a(chǎn)生效應(yīng)時(shí),稀疏模型的預(yù)測(cè)能力要高于多基因模型。當(dāng)模擬假設(shè)小部分基因?qū)Ρ硇彤a(chǎn)生較大的效應(yīng),其余大部分對(duì)表型產(chǎn)生較小的效應(yīng)時(shí),多基因模型中的BSLMM和DPR預(yù)測(cè)能力要高于其余模型。在相同模擬假設(shè)情況下,隨著遺傳度的增高,模型的預(yù)測(cè)準(zhǔn)確性也逐漸增高。當(dāng)假設(shè)全部基因?qū)Ρ硇途a(chǎn)生效應(yīng)、效應(yīng)大小服從單個(gè)正態(tài)分布、遺傳度值較小時(shí),多基因模型與稀疏模型的預(yù)測(cè)能力相似。當(dāng)遺傳度較大時(shí),多基因模型的準(zhǔn)確性稍高于稀疏模型。當(dāng)假設(shè)部分基因?qū)Ρ硇彤a(chǎn)生效應(yīng),且效應(yīng)大小服從單個(gè)正態(tài)分布時(shí),隨著相應(yīng)基因數(shù)量的增加,稀疏模型的預(yù)測(cè)能力逐漸由高于多基因模型逐漸變化為與多基因模型預(yù)測(cè)能力相似,甚至低于多基因模型。真實(shí)數(shù)據(jù)分析結(jié)果顯示不同統(tǒng)計(jì)學(xué)方法在表型預(yù)測(cè)的表現(xiàn)不同,各方法表型預(yù)測(cè)結(jié)果表型預(yù)測(cè)結(jié)果AUC均在0.61左右,多基因模型的預(yù)測(cè)能力均高于稀疏模型,其中BSLMM和DPR最優(yōu)。由模擬研究和真實(shí)數(shù)據(jù)分析結(jié)果可以看出,模型預(yù)測(cè)的準(zhǔn)確性與復(fù)雜疾病或性狀的真實(shí)遺傳結(jié)構(gòu)有關(guān),當(dāng)復(fù)雜疾病的真實(shí)遺傳結(jié)構(gòu)與模型假設(shè)相吻合時(shí),模型的預(yù)測(cè)表現(xiàn)較好,而當(dāng)復(fù)雜疾病的真實(shí)遺傳結(jié)構(gòu)與模型假設(shè)差異較大時(shí),模型的預(yù)測(cè)表現(xiàn)較差。這與以往研究的結(jié)論相同[13,18]。因此我們認(rèn)為多基因的模型假設(shè)與復(fù)雜疾病的真實(shí)遺傳結(jié)構(gòu)相符合,少數(shù)較大效應(yīng)的基因和大多數(shù)小效應(yīng)基因共同對(duì)復(fù)雜疾病產(chǎn)生影響。

        圖2 BRCA九種方法預(yù)測(cè)能力的比較

        表1 真實(shí)數(shù)據(jù)集中不同方法的運(yùn)算時(shí)間(小時(shí))

        *:Lasso、ENET、ssLasso的調(diào)整參數(shù)均為通過100倍交叉驗(yàn)證選擇的最佳值,BVSR、BSLMM、DPR.MCMC均為進(jìn)行了100次MCMC迭代計(jì)算,括號(hào)中的值為標(biāo)準(zhǔn)差,均值和標(biāo)準(zhǔn)差都是基于模擬的20次重復(fù)計(jì)算。

        本文研究的基因表達(dá)數(shù)據(jù)相對(duì)較小,三種方法的運(yùn)算速度均較高,但是這些方法往往并不適用于較大數(shù)據(jù)集[22]。需要注意的是,Lasso、ENET和ssLasso的運(yùn)算速度同時(shí)受到交叉驗(yàn)證次數(shù)的影響,本研究中只通過100倍交叉驗(yàn)證,并未進(jìn)一步研究交叉驗(yàn)證數(shù)量對(duì)于運(yùn)算速度的影響。LMM、BVSR和BSLMM使用GEMMA軟件進(jìn)行分析,同時(shí)適用于大規(guī)模數(shù)據(jù)集。BVSR和BSLMM的運(yùn)算速度相似,由于迭代次數(shù)的影響,BVSR與BSLMM的運(yùn)算速度低于LMM。有研究報(bào)道[18],當(dāng)納入模型的自變量較大時(shí),BSLMM的運(yùn)算速度將遠(yuǎn)高于BVSR。DPR通過DPR軟件進(jìn)行分析,其中DPR.VB與LMM運(yùn)算時(shí)間接近,而DPR.MCMC運(yùn)算時(shí)間同樣受到迭代次數(shù)的影響,遠(yuǎn)高于其它方法。此外,計(jì)算時(shí)間還受到工作環(huán)境、計(jì)算機(jī)語言、以及基因和表型之間的關(guān)系等因素的影響。雖然目前對(duì)于表型預(yù)測(cè)方法的研究層出不窮,但是尚未有一種方法對(duì)于不同遺傳結(jié)構(gòu)的復(fù)雜疾病或性狀都具有較高的預(yù)測(cè)能力且運(yùn)算時(shí)間較快。同時(shí),遺傳度較低時(shí),所有方法的預(yù)測(cè)表現(xiàn)均較差。此外,本文所納入的方法均為通過基因表達(dá)數(shù)據(jù)進(jìn)行復(fù)雜疾病或性狀的預(yù)測(cè),都未能考慮到在遺傳數(shù)據(jù)中非常重要的分組結(jié)構(gòu)。例如:SNP可以通過基因或者功能注釋的形式分成不同的組;基因之間存在交互作用和共同作用,基因可以通過通路信息進(jìn)行分組,功能相同的基因可以被劃分到一組[25]。這些被忽視的遺傳信息(分組結(jié)構(gòu)、非線性效應(yīng)和交互作用)可能會(huì)對(duì)預(yù)測(cè)結(jié)果造成一定的影響。已經(jīng)有研究表明,充分利用多組學(xué)的信息可以提高遺傳預(yù)測(cè)的精度[26],這也將是接下來的研究重點(diǎn)之一。

        猜你喜歡
        表型遺傳效應(yīng)
        非遺傳承
        鈾對(duì)大型溞的急性毒性效應(yīng)
        懶馬效應(yīng)
        還有什么會(huì)遺傳?
        還有什么會(huì)遺傳
        還有什么會(huì)遺傳?
        建蘭、寒蘭花表型分析
        應(yīng)變效應(yīng)及其應(yīng)用
        GABABR2基因遺傳變異與肥胖及代謝相關(guān)表型的關(guān)系
        慢性乙型肝炎患者HBV基因表型與血清學(xué)測(cè)定的臨床意義
        性感人妻av在线播放| 精品亚洲国产成人av| AV有码在线免费看| 亚洲国产日韩综一区二区在性色 | 免费一级淫片日本高清| 亚洲一区久久久狠婷婷| 少妇熟女天堂网av天堂| 欧美精品一区二区精品久久| 大陆极品少妇内射aaaaa| 免费观看国产精品| 成年人视频在线播放视频| 日本二区在线视频观看| 婷婷成人丁香五月综合激情| 内射少妇36p九色| 在线人妻无码一区二区| 丝袜美腿av免费在线观看| 国产亚洲91精品色在线| 大地资源在线观看官网第三页 | 国产一区二区三区免费在线播放 | 亚州韩国日本区一区二区片| 91精品国产在热久久| 99精品人妻少妇一区二区| av一区无码不卡毛片| 亚洲天堂一二三四区在线| 精品国产粉嫩内射白浆内射双马尾 | 少妇又色又爽又刺激的视频| 久久精品国产色蜜蜜麻豆国语版| 国产av一区二区精品凹凸| 国产香蕉一区二区三区在线视频| 男女视频在线一区二区| 国产av一啪一区二区| 亚洲av综合色区无码另类小说| а天堂中文在线官网| 国产成人AV无码精品无毒| 牛仔裤人妻痴汉电车中文字幕| 精品亚洲天堂一区二区三区| 国产肥熟女视频一区二区三区 | 激情影院内射美女| 国产福利片无码区在线观看 | 国产精品国产三级国产a| 亚洲乱亚洲乱少妇无码99p|