陳究成,彭 靜,毛海光,郭曉令,潘玉春,徐寧迎*
(1.浙江大學動物科學學院,浙江杭州 310058;2.上海交通大學農業(yè)與生物學院,上海 200240)
嵊縣花豬產(chǎn)于浙江省紹興市的嵊州、上虞等縣市,2006年列入首批國家級畜禽遺傳資源保護名錄[1],其具有耐粗飼、早熟、產(chǎn)仔多、母性好、雜交配合力、抗病力強和肉質鮮嫩等優(yōu)良特性,是浙江省寶貴的地方豬良種資源。不同品種豬在體型外貌、生長性能、肉質性狀、繁殖性能等方面存在的表型差異是自然選擇與人工選擇對一些目標基因強烈定向選擇的結果,而選擇信號是與選擇相對應的基因組信息。隨著第二代測序技術的飛速發(fā)展,測序成本越來越低,在全基因組層面上檢測選擇信號成為可能,而利用選擇信號分析來揭示造成豬性狀表型差異的遺傳機制的相關研究已廣泛開展。Yang等[2]基于豬60K芯片數(shù)據(jù),利用REHH方法掃描通城豬及大白豬的基因組,找到了關于生長、繁殖及免疫應答相關的候選基因;Ai等[3]利用豬基因組芯片找到了18個中國地方豬種的選擇信號區(qū)域,發(fā)現(xiàn)中國地方豬在繁殖、免疫相關基因上有人工選擇的痕跡;Li等[4]利用全基因組測序技術的選擇信號檢測發(fā)現(xiàn)了巴克夏豬和藏豬一些經(jīng)濟性狀和攜氧相關的基因;Kim等[5]利用XP-EHH方法,找到尤卡坦微型豬在體型上的信號選擇區(qū)域;Xiao等[6-7]利用GGRS建庫方法發(fā)現(xiàn)浦東白豬在高繁殖力和抗病力上有選擇信號檢出。因此,本研究利用群體遺傳分化指數(shù)(FST)和核苷酸多態(tài)性(θπ)方法,通過對嵊縣花豬和其他豬種群體間的選擇信號差異分析,找到嵊縣花豬相比于其他豬種群體的選擇信號區(qū)域,從而對嵊縣花豬特性形成原因進行研究,為嵊縣花豬的保護和利用提供參考價值。
1.1 實驗動物以及樣品 本研究采用10個豬種共517頭豬作為實驗動物,其中浙江省地方豬種包括嘉興黑豬、金華豬、嵊縣花豬、淳安花豬、蘭溪花豬、碧湖豬和岔路黑豬7個品種共計390頭,外來豬種包括長白、大白、杜洛克3個品種共計127頭(表1)。所有樣本均采集耳組織樣,并浸沒于80%的酒精,置于-80℃冰箱保存?zhèn)溆??;蚪MDNA提取自采集的耳組織樣本,質控合格后進行后續(xù)文庫構建。
1.2 測序數(shù)據(jù) 本研究基于簡化基因組GGRS方法[8]進行基因組文庫構建,采用Illumina公司Hiseq2000平臺測序,測序方法為Paired-end。測序數(shù)據(jù)已經(jīng)上傳到NCBI的 SRA數(shù) 據(jù) 庫(https://www.ncbi.nlm.nih.gov/sra)。SRA號為SRP067498。
表1 實驗豬群信息
1.3 SNP檢出和基因型填補 本研究采用bwa和samtools軟件進行SNP檢出,檢出條件:①每個SNP 位點最少有30%個個體被檢測判型(當1個位點的分型質量值Q>30時,該個體才被認為檢測判型);②最小等位基因頻率(MAF)大于0.05;③每個位點的平均測序深度大于5 X。
1.4 Fst群體遺傳分化是指群體間的等位基因頻率存在明顯差異。FST是檢測群體遺傳分化程度的重要指標之一,其主要反映亞群體間的平均雜合性相較于整個群體的平均雜合性大小的差異。本研究采用Weir等[9]提出的無偏估計FST的方法對檢測到的SNP位點進行計算,具體計算公式:
其中,MSP和MSG分別為檢測的亞群間和整個群體內的位點的誤差均方,nc是指校正后的群體間的平均樣本數(shù)量,計算公式:
其中,S是總亞群體數(shù),ni代表第i個群體的樣本大小,i=1,2,3,……,S;PAi代表第i個群體SNP中等位基因A的基因頻率;PA是各群體的PA的加權平均值。
1.5 θπ一個不依賴于樣本大小m的DNA多態(tài)性的測度是2個序列間每個位點上核苷酸差異的平均值或是核苷酸多樣性。
其中,q是等位基因的總數(shù),xi是第i個等位基因的群體頻率,dij是第i個和第j個等位基因間每個座位的核苷酸差異數(shù)或者代替數(shù)。在一個隨機交配的群體中,π代表核苷酸水平上的雜合度,可由下式估算:
其中,m代表所研究的DNA序列的總條數(shù),dij代表第i條序列和第j條序列的核苷酸差異數(shù)或者代替數(shù),c代表序列總數(shù)的 [m×(m—1)/2]。
1.6 群體間選擇信號檢測 本研究采用FST/θπ的方法對浙江省地方品種間的選擇信號進行選擇。在基因組上以20 kb為單位,以10 kb為步長進行劃窗,計算窗口的平均FST/θπ值。一般認為,當FST值處在前5%以及θπ處在后5%區(qū)域有可能是選擇信號所在的區(qū)域,公式:
其中,θπA和θπB分別代表A群體和B群體的θπ值。
2.1 浙江省地方豬SNP檢測結果 依據(jù)材料方法部分給出的SNP檢測標準,對樣本進行了過濾,共有491個個體經(jīng)過篩選進行后續(xù)SNPs分型。在經(jīng)過填補和質控后,共計得到152 006個SNPs位點,其中MAF<0.05共計11 048個,哈迪-溫伯格平衡檢驗(HWE)<10-6共有32 355個。將以上位點過濾之后,最終得到分型完的SNP標記共計108 603個。SNP位點在染色體上的分布見圖1。
2.2 SNP 注釋結果 利用Python腳本,將獲得的SNPs和已經(jīng)下載的豬的基因注釋信息數(shù)據(jù)進行映射,得到SNPs在基因組上的區(qū)間分布。根據(jù)基因的不同功能,將基因區(qū)間分為基因間和基因內2類,基因內按基因的結構區(qū)域分類又包括起始/終止密碼子、外顯子、內含子、UTR區(qū)。SNPs映射結果見表2,SNPs在基因內的數(shù)量為34 293個,占SNPs總數(shù)的31.6%,其中分布在內含子上的SNPs有20 158個,占SNP總數(shù)的18.6%。由表2可知, 絕大多數(shù)SNPs分布在基因間,約占總數(shù)的68.4%,在基因內的34 293個位點中,大多數(shù)分布在內含子上,占到基因內位點總數(shù)的58.8%,另一部分分布在UTR區(qū),占33.9%,只有少部分分布在外顯子和起始/終止密碼子上,分別占到7.3%和0.03%。
圖1 SNP位點個數(shù)在染色體上的分布
2.3 嵊縣花豬與其他群體間選擇信號分析
圖2 嵊縣花豬與浙江省其他地方豬群體的FST/θπ統(tǒng)計分布結果
表2 SNPs在基因區(qū)間上的分布
2.3.2 嵊縣花豬與浙江省地方豬群體間選擇信號分析由圖2可知,嵊縣花豬與浙江省其他地方品種共檢測到正向選擇區(qū)域111個,蘭溪花豬最多,共29個,嘉興黑豬最少,只有9個。這些區(qū)域主要分布在2號染色體和12號染色體上。
為進一步了解這些信號選擇區(qū)域的功能,對選擇信號落入的基因及基因的功能進行了分析。經(jīng)統(tǒng)計,選擇信號落入的基因一共有9個,分別是SYT1、FAM135B、GLIS1、GALNT2、BIN1、LOC100627093、TG、SOX9、CH25H。嵊縣花豬與嘉興黑豬群體比較信號選擇區(qū)域落入的基因數(shù)最多,有5個,與金華豬群體比較信號選擇區(qū)落入的基因數(shù)有2個,與其他浙江省地方豬群體比較都只有1個基因落入信號選擇區(qū)域(表3)。
2.3.2 嵊縣花豬與外來豬群體間選擇信號分析 由圖3可知,嵊縣花豬與外來豬群體共檢測到正向選擇區(qū)域70個,杜洛克、大白、長白分別有28、26和26個信號選擇區(qū)域。經(jīng)注釋分析,選擇信號落入的基因一共有8個,分別是MGAT5、MAPK4K4、KSR2、RBP5、HDLBP、KCNE2、KIRREL3、BTBD11,這些基因大多與免疫、繁殖以及肉質性狀相關(表4)。
本研究利用FST/θπ法對嵊縣花豬和浙江省其他地方豬品種以及外來豬品種進行了選擇信號分析,一共檢測到179個選擇信號區(qū)域,落入選擇信號區(qū)域的基因一共有17個。其中,與浙江省其他豬種群體比較,在選擇信號區(qū)域共落入基因9個,分別是SYT1、FAM135B、GLIS1、GALNT2、BIN1、LOC100627093、TG、SOX9、CH25H。GLIS1被證實和卵巢發(fā)育和早期胚胎發(fā)育相關,是一種在卵細胞和受精卵一、二細胞期的高表達蛋白,在胚胎發(fā)育中起著重要的作用[10-11]。SYT1被認為是作為鈣離子在囊泡運輸和胞吐的過程傳感器突觸小泡的膜蛋白,其和卵母細胞減數(shù)分裂過程和皮質反應的影響[12]。GALNT2基因屬于多肽-N-乙酰氨基半乳糖轉移酶家族,其主要功能是參與O-糖基化的第一步反應。根據(jù)最新的GWAS研究報道GALNT2基因單核苷酸多態(tài)性可影響高密度脂蛋白膽固醇及甘油三酯水平,其可能參與脂肪代謝,該基因的突變會導致膽固醇脂沉積,而且其在卵巢中也有較高的表達,可能和繁殖力相關[13]。BIN1基因則和背最長肌生成相關,突變也會導致背最長肌生成[14]。SOX9基因屬于SOX家族,在哺乳動物個體發(fā)育中扮演重要角色,廣泛存在于各種組織,主要在睪丸組織表達,在下丘腦-垂體-睪丸生殖軸中發(fā)揮重要作用,并與睪丸細胞的增殖及分化過程有密切的關系[15-16]。因此,嵊縣花豬相比與浙江省其他地方豬群體檢測出的這些選擇信號區(qū)域可能和脂肪分解,繁殖力以及背最長肌肉生成相關。與外來豬種群體比較在選擇區(qū)域共落入基因8個,分別是MGAT5、MAPK4K4、KSR2、RBP5、HDLBP、KCNE2、KIRREL3、BTBD11。其中,MAPK4K4被報道和脂肪生成相關,KCNE2基因在其他物種的研究中發(fā)現(xiàn)和胃酸的分泌密切相關,因此可推測該基因和嵊縣花豬的消化功能有一定關系[17]。MGAT5基因被發(fā)現(xiàn)與腫瘤細胞轉移相關,且對T細胞的激活以及自身免疫具有一定的調節(jié)作用[18]。KSR2基因作為MAPK信號通路的支架蛋白,正向調節(jié) Ras/MAPK信號通路促進腫瘤形成和腫瘤細胞增殖,促進T細胞的分化,調節(jié)細胞的能量代謝并在炎癥中起到保護作用[19-20]。這暗示嵊縣花豬可能在免疫相關過程經(jīng)歷了一定的選擇作用,對揭示嵊縣花豬免疫性狀的遺傳機制具有一定意義。這也說明相比于外來豬群體,嵊縣花豬在抗病力強、耐粗飼這些優(yōu)良性狀上經(jīng)歷了較強的人工選擇。
表3 嵊縣花豬與浙江省其他地方豬群體信號選擇區(qū)域
圖3 嵊縣花豬與外來豬群體的FST/θπ統(tǒng)計分布結果
表4 嵊縣花豬與外來豬群體信號選擇區(qū)域
本研究利用10個豬種共計517個個體的測序數(shù)據(jù),對嵊縣花豬群體選擇信號進行了檢測分析,檢測到選擇信號的區(qū)域共計179個,落入這些區(qū)域的候選基因有17個。結果表明,相比于浙江省其他地方豬群體,嵊縣花豬在脂肪代謝、高繁殖力等性狀上經(jīng)歷了人工選擇;相比于外來豬群體,嵊縣花豬在免疫相關、耐粗飼等性狀經(jīng)歷了人工選擇。