王 也,吳方楠,周伊婷,鞠秀峰,湯在祥
(蘇州大學(xué)醫(yī)學(xué)部公共衛(wèi)生學(xué)院流行病與衛(wèi)生統(tǒng)計(jì)學(xué)系,遺傳流行病與基因組學(xué)研究中心,蘇州,江蘇 215123)
生物性狀的表達(dá)有賴(lài)于基因間的上位性作用,上位性作用構(gòu)成了復(fù)雜的網(wǎng)絡(luò),調(diào)節(jié)了幾乎全部的基因表達(dá)[1]。目前研究人員已經(jīng)發(fā)展出一系列解析核內(nèi)基因間上位性的統(tǒng)計(jì)模型和分析方法,在實(shí)際研究中也檢測(cè)到了具有顯著上位性的基因[2]。隨著對(duì)復(fù)雜性狀遺傳基礎(chǔ)研究的不斷深入,細(xì)胞質(zhì)環(huán)境對(duì)于基因表達(dá)的影響作用正在受到研究人員的關(guān)注。在模式生物上線(xiàn)粒體與細(xì)胞核間的上位性效應(yīng)對(duì)性狀表達(dá)有明顯的影響[3-5],核質(zhì)之間的緊密聯(lián)系多次得到了證實(shí)。雖然這些研究結(jié)果為深入認(rèn)識(shí)復(fù)雜性狀的遺傳表達(dá)以及核質(zhì)互作遺傳機(jī)制提供了一定的依據(jù),然而,如何在分子水平上探明核質(zhì)互作的遺傳學(xué)基礎(chǔ),仍然有待研究。長(zhǎng)期以來(lái),由于相關(guān)統(tǒng)計(jì)學(xué)方法的缺乏,核質(zhì)上位性在復(fù)雜數(shù)量性狀遺傳中的重要性常常被研究人員忽視[6]。尚沒(méi)有將核質(zhì)互作效應(yīng)在分子水平上作進(jìn)一步的遺傳剖析,因而,無(wú)法追蹤在一定細(xì)胞質(zhì)背景下哪些基因表達(dá),表達(dá)的基因所在位置,表達(dá)效應(yīng)的方向和大小,以及重要的核質(zhì)上位互作效應(yīng)等。
Tang等[7]在2007年較早地提出核質(zhì)互作的quantitative trait locus (QTL)分析思想,在分離群體中引入細(xì)胞質(zhì)變異,即將雙親雜交衍生的正交分離群體和反交分離群體進(jìn)行混合分析,有效地分解控制復(fù)雜性狀的細(xì)胞質(zhì)效應(yīng)、核內(nèi)QTL效應(yīng)以及QTL和細(xì)胞質(zhì)的互作效應(yīng)。本研究將在前期研究工作的基礎(chǔ)上[7-9],擬進(jìn)一步改善該模型和方法,并以公開(kāi)發(fā)表的小鼠膽固醇含量等復(fù)雜性狀的數(shù)據(jù)為例,展示該分析方法和模型的有效性和實(shí)用性,并在現(xiàn)有數(shù)據(jù)基礎(chǔ)上發(fā)現(xiàn)新的遺傳機(jī)制。
本研究采用QTL Archive 網(wǎng)站上的公共數(shù)據(jù),其遺傳設(shè)計(jì)如下:取DBA/2J (D2)和CAST/EiJ (CAST)兩種品系的小鼠,采用正反遺傳交配設(shè)計(jì)。親代小鼠以及F1和F2均在相同的環(huán)境條件下飼養(yǎng)繁殖[10,11]。F1代小鼠由D2和CAST兩種品系的小鼠相互交配產(chǎn)生,兩種雜交形式為CAST(父本)×D2(母本)和D2(父本)×CAST(母本)。F2代由F1代個(gè)體隨機(jī)組合交配產(chǎn)生。遺傳設(shè)計(jì)如圖1所示。
圖1 正反雜交遺傳設(shè)計(jì)
根據(jù)原作者描述,研究采用了F2代小鼠全部為雄性,共278只,年齡在16~18周。F2代小鼠生長(zhǎng)至6~8周后進(jìn)行連續(xù)十周的高脂肪飲食喂養(yǎng)[12],實(shí)驗(yàn)前禁食4 h后眼窩靜脈竇進(jìn)行采血。血液在4℃環(huán)境下保存,然后通過(guò)離心(1 000 r/min,5 min)將血漿分離,在分析前儲(chǔ)存在-20℃環(huán)境下。采用自動(dòng)生化分析儀及配套的試劑對(duì)高密度脂蛋白膽固醇和總膽固醇進(jìn)行分析[13,14]。非高密度脂蛋白通過(guò)計(jì)算總膽固醇與高密度膽固醇之間的差值而確定。
采用在DBA/2J (D2)和CAST/EiJ (CAST)小鼠間具有多態(tài)性的微衛(wèi)星遺傳標(biāo)記,其數(shù)量選擇依染色體長(zhǎng)度而定。標(biāo)記間平均遺傳距離約20 cM, 覆蓋小鼠除性染色體以外全部19條染色體。
(1)
記Xj=(1xcjx1jx2jx3jx4j)為一行向量,b=(b0cadiaciad)Τ,則模型(1)可以矩陣語(yǔ)言表示為:
(2)
表1 個(gè)體基因型及基因型值組成分量
(3)
(4)
以上二式中的“E”表示有關(guān)缺失變量的期望值,其計(jì)算方法概述如下:
(7)
(8)
進(jìn)而有EM算法實(shí)現(xiàn)的極大似然估計(jì)步驟如下:
(4)重復(fù)(2)和(3)兩步,直至收斂為止。收斂時(shí)的參數(shù)估計(jì)值即為相應(yīng)參數(shù)的極大似然估計(jì)值。
1.4.3 似然比檢驗(yàn):本研究主要進(jìn)行兩方面檢驗(yàn),首先是是否有無(wú)QTL的檢驗(yàn),其次是關(guān)于該QTL是否存在核質(zhì)交互作用的檢驗(yàn),具體如下:
(9)
上式中的Xj=(1xcj)。獲得相關(guān)參數(shù)估計(jì)值后,計(jì)算H0假設(shè)下的對(duì)數(shù)似然函數(shù)值L0為:
其中
而H1下的對(duì)數(shù)似然函數(shù)lnL1,則以模型(1)中相應(yīng)參數(shù)的極大似然估計(jì)值代入(4)式計(jì)算獲得,從而有似然比測(cè)驗(yàn)統(tǒng)計(jì)量:
(10)
用于測(cè)驗(yàn)H0,該統(tǒng)計(jì)量服從自由度為4的χ2分布。
(11)
該統(tǒng)計(jì)量服從自由度為2的χ2分布。
1.4.4 核質(zhì)互作QTL定位:在進(jìn)行QTL定位和核質(zhì)上位性分析時(shí),首先利用(9)進(jìn)行全基因組搜索,獲得QTL的似然圖譜,并以之推斷各染色體上是否存在QTL,以及各個(gè)QTL可能的位置,然后進(jìn)一步進(jìn)行似然比檢驗(yàn),確定該QTL是否存在顯著的基因型效應(yīng),以及QTL與細(xì)胞質(zhì)遺傳物質(zhì)是否存在上位性效應(yīng)。本研究以L(fǎng)OD值3.0為顯著性的閾值。
細(xì)胞質(zhì)效應(yīng)分析,采用正反交之間比較,膽固醇相關(guān)性狀指標(biāo)的細(xì)胞質(zhì)效應(yīng)分析見(jiàn)表2。由表2可見(jiàn),僅HDL在不同的細(xì)胞質(zhì)背景下呈現(xiàn)出顯著的差異(P<0.05),該結(jié)果暗示了細(xì)胞質(zhì)效應(yīng)的存在,為進(jìn)一步進(jìn)行核質(zhì)互作QTL分析奠定了基礎(chǔ)。需要指出的是,細(xì)胞質(zhì)效應(yīng)不顯著,并不表示不存在QTL與細(xì)胞質(zhì)背景的互作效應(yīng)。
圖2~圖4展示了3個(gè)性狀全基因組掃描的結(jié)果,該結(jié)果表明,CHOL在第9染色體上存在一個(gè)QTL,HDL在第2,4,6染色體上共有4個(gè)QTL,nonHDL在第9染色體上存在1個(gè)QTL,各個(gè)QTL的參數(shù)估計(jì)見(jiàn)表3。采用上述顯著性檢驗(yàn)方法,對(duì)各個(gè)QTL是否存在顯著核質(zhì)互作效應(yīng)進(jìn)行了檢驗(yàn),表中LOD1為QTL似然比檢驗(yàn)統(tǒng)計(jì)量,LOD2為QTL與細(xì)胞質(zhì)交互作用似然比檢驗(yàn)統(tǒng)計(jì)量,該統(tǒng)計(jì)量大于3.0表示,存在QTL或存在顯著的核質(zhì)互作效應(yīng)。結(jié)果表明在第6染色體上,影響HDL的一個(gè)QTL存在顯著核質(zhì)效應(yīng),且以加性與細(xì)胞質(zhì)互作效應(yīng)為主。在第9染色體上,影響CHOL的QTL也存在較大的核質(zhì)互作效應(yīng),盡管沒(méi)有通過(guò)顯著性檢驗(yàn),仍然提示可能存在核質(zhì)交互作用。
表2 F2群體血漿總膽固醇、高密度脂蛋白、非高密度脂蛋白濃度分析
表3 核質(zhì)互作QTL定位結(jié)果
圖2 小鼠總膽固醇量各連鎖群QTL定位的似然圖譜
圖4 小鼠非高密度脂蛋白各連鎖群QTL定位的似然圖譜
本研究改進(jìn)了業(yè)已構(gòu)建的核質(zhì)互作統(tǒng)計(jì)遺傳模型,增加了對(duì)核質(zhì)效應(yīng)的檢驗(yàn),有利于發(fā)掘具有顯著核質(zhì)互作效應(yīng)的基因。利用公共數(shù)據(jù)庫(kù)的數(shù)據(jù),分析了小鼠正反F2家系數(shù)據(jù),不僅驗(yàn)證了前任研究的結(jié)果,而且進(jìn)一步明確了有關(guān)QTL的核質(zhì)互作作用,為進(jìn)一步解釋相關(guān)性狀的核質(zhì)互作機(jī)制奠定了初步的研究結(jié)果。
在前人的研究結(jié)果中[16-18],對(duì)CHOL,HDL和nsn-HDL 3個(gè)性狀,采用常用的區(qū)間作圖方法共定位到了6個(gè)QTL。它們分別是影響CHOL的QTL,位于第9染色體第8 cM位置的Chol6;影響HDL的4個(gè)QTL,分別位于第2染色體上48 cM處Hdl1,第4染色體的20 cM處Hdlq10,以及第6染色體的48 cM 處的Hdl11,和68 cM位置上的Hdl12;影響n(yōu)on-HDL的QTL,位于第9染色體8 cM處Chol6。本研究QTL的定位于上述QTL定位結(jié)果相似,特別是在QTL位置的置信區(qū)間上相互重疊。這證明了本研究的模型方法以及分析結(jié)果正確性,也說(shuō)明了這些QTL的事實(shí)存在。因此,本研究的意義在于,采用新的統(tǒng)計(jì)遺傳模型發(fā)掘現(xiàn)有數(shù)據(jù),并得出新的結(jié)論,為進(jìn)一步全面深入了解小鼠復(fù)雜性狀的遺傳機(jī)制奠定基礎(chǔ)。
參考文獻(xiàn):
[1] Malmberg RL, Held S, Waits A, et al. Epistasis for fitness-related quantitative traits in Arabidopsis thaliana grown in the field and in the greenhouse [J]. Genetics,2005, 171(4):2013-2027.
[2] Hua J, Xing Y, Wu W, et al. Single-locus heterotic effects and dominance by dominance interactions can adequately explain the genetic basis of heterosis in an elite rice hybrid [J]. Proc Nat Acad Sci U S A,2003, 100(5):2574-2579.
[3] Allen JO. Effect of teosinte cytoplasmic genomes on maize phenotype [J]. Genetics,2005, 169(2):863-880.
[4] Rand DM, Haney RA, Fry AJ. Cytonuclear coevolution: the genomics of cooperation [J]. Trends Ecol Evol,2004, 19(12):645-653.
[5] Roubertoux P L, Sluyter F, Carlier M, et al. Mitochondrial DNA modifies cognition in interaction with the nuclear genome and age in mice [J]. Nat Genet,2003, 35(1):65-69.
[6] Carlborg O, Haley CS. Epistasis: too often neglected in complex trait studies [J]. Nature Rev Genet,2004, 5(8):618-625.
[7] Tang Z, Wang X, Hu Z, et al. Genetic dissection of cytonuclear epistasis in line cross [J]. Genetics, 2007, 177:669-672.
[8] Hang Y, Jiang B, Zhu J, et al. Bayesian models for detecting epistatic interactions from genetic data [J]. Ann Hum Genet,2011b, 75(1):183-93.
[9] 王曦, 李紅霞, 王靖宇. 鼠數(shù)量性狀QTL定位的研究進(jìn)展 [J]. 中國(guó)比較醫(yī)學(xué)雜志, 2006, 16(4):249-254.
[10] Valdar W, Solberg LC, Gauguier D, et al. Genetic and environmental effects on complex traits in mice [J]. Genetics, 2006, 174:959-984.
[11] 周淑佩, 張曉紅, 劉國(guó)慶, 等. 混合性高甘油三酯/高膽固醇血癥小鼠模型的培育 [J]. 中國(guó)比較醫(yī)學(xué)雜志, 2005, 15(6):368-371.
[12] 楊小毅, 楊永宗, 譚健苗, 等. 一種純系小鼠動(dòng)脈粥樣硬化病理模型的建立 [J].中國(guó)動(dòng)脈硬化雜志, 1996, 4(1): 54-57.
[13] Allain CC, Poon LS, Chan CS, et al. Enzymatic determination of total serum cholesterol [J]. Clin Chem,1974, 20:470-475.
[14] Roeschlau P, Bernt E, Gruber W. Enzymatic determination of total cholesterol in serum [J]. Z Klin Chem Klin Biochem,1974, 12(9):403-407.
[15] Xu C, He X, Xu S. Mapping quantitative trait loci underlying triploid endosperm traits [J]. Heredity,2003, 90(3):228-235.
[16] Lyons MA, Wittenburg H, Li R, et al. Quantitative trait loci that determine lipoprotein cholesterol levels in DBA/2J and CAST/Ei inbred mice [J]. J Lipid Res,2003, 44(5):953-967.
[17] Lyons MA, Wittenburg H, Li R, et al. Lith6: a new QTL for cholesterol gallstones from an intercross of CAST/Ei and DBA/2J inbred mouse strains [J]. J Lipid Res,2003, 44(9):1763-1771.
[18] Li R, Lyons MA, Wittenburg H, et al. Combining data from multiple inbred line crosses improves the power and resolution of quantitative trait loci mapping [J]. Genetics,2005, 169(3):1699-1709.