吳姿儀,陳健梅,程博文,雷澤凱,王獻偉,王克君,喬瑞敏,韓雪蕾,李新建,李秀領(lǐng)*
(1.河南農(nóng)業(yè)大學(xué)動物科技學(xué)院,河南鄭州 450046;2.河南省畜牧總站,河南鄭州 450046)
豬生長性狀是影響豬生產(chǎn)力的重要經(jīng)濟性狀,對養(yǎng)豬業(yè)的經(jīng)濟效益有重要影響,也是養(yǎng)殖者和育種生產(chǎn)者最關(guān)心的性狀之一。豬育種中多個生長指標均可反映豬的生長性能,例如:生長速度、背膘厚、飼料轉(zhuǎn)化率、眼肌深度和眼肌面積等。豬的生長性狀是由多基因控制的較為復(fù)雜的數(shù)量性狀。了解調(diào)控這些性狀的遺傳決定因素對提高豬生產(chǎn)效益和遺傳進展具有決定性意義。
目前,全基因組關(guān)聯(lián)分析(Genome-Wide Association Study,GWAS)已廣泛用于檢測與豬重要經(jīng)濟性狀相關(guān)的SNP,然而,由于基因分型成本高,一個群體中只有少數(shù)個體進行基因分型,因此,大部分個體的表型信息和系譜信息在GWAS 分析中并未得到充分應(yīng)用。Wang等提出了一種基于單步基因組最佳線性無偏預(yù)測(Single-step Genomic Best Linear Unbiased Prediction,ssGBLUP)的GWAS 方法,并將其稱之為單步全基因組關(guān)聯(lián)分析(ssGWAS),它可以將基因分型和非基因分型個體的信息整合在一個簡單的步驟中。ssGWAS 方法已經(jīng)應(yīng)用在豬的生長和采食量等性狀,并發(fā)現(xiàn)了新的位點。
在本研究中,利用中芯一號50K SNP 芯片對296頭豬進行基因分型,使用ssGWAS 來鑒定與背膘厚、眼肌深度和眼肌面積相關(guān)的遺傳標記及候選基因,從而為生長性狀分子標記的開發(fā)、關(guān)鍵基因的功能驗證及后續(xù)的育種提供一定的參考。
1.1 動物群體與表型測定 本研究實驗動物為來源于河南省新大牧業(yè)股份有限公司一豬場的296 頭母豬,其中234 頭杜洛克豬和62 頭大白豬。所有豬種體質(zhì)健康,按照飼養(yǎng)標準配制飼料,自由飲水,定時飼喂,并及時進行科學(xué)管理及免疫防治。296 頭豬的記錄信息包括個體ID、父親ID、母親ID、場代碼、品種、初生重、結(jié)測重、起始測量年月日、結(jié)束測量年月日、飼養(yǎng)時間、背膘厚、眼肌深度、眼肌面積等。其中,具有表型數(shù)據(jù)的296 頭母豬均有基因型和系譜,從而選擇ssGWAS的方法整合系譜信息以提高研究結(jié)果的準確性。本實驗將296 頭母豬的背膘厚(Backfat Thickness,BF)、眼肌深度(Loin Muscle Depth,LMD)和眼肌面積(Loin Muscle Area,LMA)作為研究性狀。利用背膘測定儀測定豬活體背膘厚、B 超測定眼肌深度和眼肌面積。其中,為得到100 kg 體重時的BF 和LMA,對測定BF(單位:mm)和LMA(單位:cm)原始數(shù)據(jù)進行校正,公式如下:
使用Excel 對表型數(shù)據(jù)進行統(tǒng)計整理,并用R 軟件進行一般統(tǒng)計學(xué)分析,包括表型數(shù)據(jù)的最大值、最小值、平均數(shù)、標準差以及變異系數(shù)。
1.2 DNA 提取與基因分型 使用組織基因組DNA 提取試劑盒提取豬耳組織樣本的DNA,提取的DNA 使用NanoDrop2000 微量紫外分光光度計檢測樣本濃度及質(zhì)量。將濃度>50 ng/μL、A260/280 在1.8 和2.1 之間、A260/230>1.8 的樣本DNA,通過1% 瓊脂糖凝膠電泳檢測,經(jīng)凝膠成像系統(tǒng)拍攝DNA 膠圖,鑒定樣本DNA的質(zhì)量。質(zhì)量合格的DNA 樣本使用中芯一號芯片進行基因分型。
使用Beagle v5.2進行缺失基因型的填充,且在填充前后均使用Plink v1.9軟件進行SNP 數(shù)據(jù)的質(zhì)量控制,質(zhì)控條件如下:
①刪除SNP 缺失率高于0.10 的SNP 位點;
②刪除個體缺失率0.10 的個體;
③刪除最小等位基因頻率(Minor Allele Frequency,MAF)小于0.01 的SNP 位點;
④刪除哈迪-溫伯格平衡(Hardy-weiberg Equilibr ium,HWE)卡方檢驗值小于1×10的SNP 位點;
⑤刪除Y 染色體上的SNP 位點。
基因型數(shù)據(jù)經(jīng)過質(zhì)量控制后,篩選掉18 774 個SNP 標記,最終共得到296 個個體,32 541 個SNP 用于后續(xù)分析。
1.3 遺傳參數(shù)估計 本研究使用AIREMLF90對杜洛克和大白豬的生長性狀進行遺傳參數(shù)評估,其模型如下:
1.4 單步全基因組關(guān)聯(lián)分析 ssGWAS 是根據(jù)Wang等和Aguilar 等使用BLUPF90系列軟件進行的。表型和系譜數(shù)據(jù)使用RENUMF90進行處理;使用POSTGSF90將基因組估計育種值(Genomic Estimated Breeding Values,GEBV)效應(yīng)轉(zhuǎn)化為SNPs效應(yīng),并計算相鄰窗口的解釋方差。本實驗采用單性狀動物模型進行分析,統(tǒng)計模型寫成:
其中,是根據(jù)等位基因頻率編碼的標記矩陣(aa=0,Aa=1,AA=2),D 為SNP 方差的權(quán)值對角矩陣(最初=),為權(quán)重因子。根據(jù)SNP 可以推導(dǎo)出權(quán)重因子。
按照以下步驟①~⑥計算SNP 效應(yīng)值和權(quán)重:
在第1 次迭代中使=;
計算=;
使用ssGBLUP 計算整個數(shù)據(jù)的GEBV;
使SNP 權(quán)重標準化以保持總遺傳方差不變;
重新回到第②步計算。
通過步驟②~ ⑥循環(huán)迭代計算SNP 權(quán)重,迭代增加具有較大影響的SNPs 的權(quán)重,并吸收了那些具有較小影響的SNPs。該程序基于精度進行了不同的迭代,本研究選擇了一次迭代。第個SNP 窗口解釋的遺傳方差百分比計算如下:
Beissinger 等人曾報道,與較大的窗口尺寸相比,5 或10 個SNPs 的滑動窗口識別出的QTL 和假陽性的比率是所有方法中的誤報最少的,所以本實驗計算了由5 個相鄰SNPs 的滑動窗口解釋的加性遺傳方差的比例。
1.5 候選區(qū)域注釋 利用豬參考基因組數(shù)據(jù)庫SScrofa11.1(https://www.animalgenome.org/cgi-bin/QTLdb/)尋找顯著SNP 位點附近的基因是否與生長性狀有關(guān)的QTL。以Susscrofa11.1 為參考基因組,在Ensembl(http://asia.ensembl.org/index.html)數(shù)據(jù)庫中鑒定全基因組顯著SNPs 附近的基因,之后通過GeneCards(https://www.genecards.org/)和NCBI(https://www.ncbi.nlm.nih.gov/)公共網(wǎng)絡(luò)數(shù)據(jù)庫確認候選基因。使用KOBAS(http://kobas.cbi.pku.edu.cn/genelist/)對候選基因進行Gene Ontology(GO)功能注釋和KEGG 信號通路分析。
2.1 性狀表型統(tǒng)計 該研究對豬群體型性狀數(shù)據(jù)進行描述性統(tǒng)計分析,分析內(nèi)容包括:最大值、最小值、平均值、標準差、變異系數(shù)、遺傳力(表1)。描述性統(tǒng)計分析體現(xiàn)了表型性狀的基本特征,從表1 中得知,BF的平均值為15.80,但變異系數(shù)較高,達到22.34%;LMD 的平均值為54.34,標準差為5.79,變異系數(shù)較??;LMA 的平均值為45.17,標準差為6.02。性狀的頻率分布圖顯示均基本符合正態(tài)分布(圖1),可進行后續(xù)的關(guān)聯(lián)分析。
表1 表型性狀的描述性統(tǒng)計分析
圖1 3 個性狀的頻率分布圖
2.2 遺傳參數(shù)分析結(jié)果 利用AIREMLF90 軟件對遺傳方差、殘差方差和遺傳力進行了估算。遺傳力為遺傳方差除以遺傳方差和殘差方差之和。所有估計的遺傳參數(shù)見表2。由表2 可知,3 個性狀均屬于中等遺傳力,BF、LMA 和LMD 的遺傳力分別為0.48、0.49 和0.56。
表2 3 個性狀所估計的遺傳參數(shù)
本研究中豬的3 個生長性狀的表型相關(guān)系數(shù)和遺傳相關(guān)性分析結(jié)果見表3。由表3 可知,BF、LMD、LMA 3 個生長性狀的遺傳相關(guān)。其中LMD 與LMA 的相關(guān)系數(shù)最高,達到0.94,而BF 與其他2 個性狀之間的相關(guān)系數(shù)較低。
表3 生長性狀表型相關(guān)系數(shù)和遺傳相關(guān)性
2.3 單步全基因組關(guān)聯(lián)分析結(jié)果 本實驗選擇由5 個連續(xù)的SNPs 劃分為一個窗口,用于后續(xù)單步全基因組關(guān)聯(lián)分析的共有32 541 個窗口。如圖2 所示,x 軸表示染色體窗口的位置,y 軸表示每個窗口解釋的遺傳變異百分比,每個點代表1 個由5 個相鄰的SNPs 構(gòu)成的窗口,水平線表示顯著性水平(本研究中為遺傳變異比例=1%)。確定了26、29、43 個相關(guān)的5-SNP 窗口,分別解釋了BF、LMD 和LMA 總遺傳方差的1%及以上。共有35 個基因組區(qū)域與生長性狀相關(guān),分別包括BF、LMD 和LMA 的10、11、14 個區(qū)域(表4)。其中BF顯著SNPs 窗口主要分布于染色體1、2、4、5、10、12 和16 上的10 個基因組區(qū)域且最高區(qū)域解釋了5.030%的遺傳變異;LMD 顯著SNPs 窗口主要分布于染色體1、2、5、7、11、13、14 和17 上的11 個基因組區(qū)域且最高區(qū)域解釋了8.190%的遺傳變異;LMA 顯著SNPs 窗口主要分布于染色體1、4、5、8、9、10、11、13、14和15 上的14 個基因組區(qū)域且最高區(qū)域解釋了4.698%的遺傳變異。
表4 生長性狀相關(guān)基因組區(qū)域
圖2 生長性狀單步全基因組關(guān)聯(lián)分析曼哈頓圖
本研究利用Ensembl 數(shù)據(jù)庫,根據(jù)關(guān)聯(lián)分析所篩選出的顯著位點進行比對和分析,最終確定該位點開始至結(jié)束的物理信息、距該位點最近或與生長性狀有關(guān)的候選基因以及該候選基因與SNP 的距離。
2.4 GO 和KEGG 富集分析 為探究候選基因的生物學(xué)功能以及與其他基因或分子之間的聯(lián)系,對候選基因進行GO 和KEGG 富集分析,結(jié)果顯示,BF 富集顯著的GO 條目主要包括:細胞群增殖的調(diào)節(jié)(Regulation of Cell Population Proliferation)、組織發(fā)育(Tissue Development)和細胞周期調(diào)節(jié)(Regulation of Cell Cycle)等,KEGG 通路主要包括:代謝途徑(Metabolic Pathways)、脂肪細胞因子信號通路(Adipocytokine Signaling Pathway)和甲狀旁腺激素的合成、分泌和作用(Parathyroid Hormone Synthesis,Secretion and Action)等(<0.05);LMD 富集顯著的GO 條目主要包括:有絲分裂細胞周期相變的調(diào)節(jié)(Regulation of Mitotic Cell Cycle Phase Transition)、脂肪酸-氧化(Fatty Acid Beta-Oxidation)和微管組織中心(Microtubule Organizing Center)等(<0.05),KEGG 通路主要包括:脂肪酸降解(Fatty Acid Degradation)、纈氨酸、亮氨酸和異亮氨酸的降解(Valine,Leucine and Isoleucine Degradation)和脂肪酸代謝(Fatty Acid Metabolism)等;LMA 富集顯著的GO 條目主要包括:跨膜受體蛋白酪氨酸激酶接頭活性(Transmembrane Receptor Protein Tyrosine Kinase Adaptor Activity)、胚胎骨骼系統(tǒng)發(fā)育(Embryonic Skeletal System Development)和神經(jīng)元分化(Neuron Differentiation)等,KEGG 通路主要包括:丙酸酯新陳代謝(Butanoate Metabolism)、-丙氨酸新陳代謝(Beta-Alanine Metabolism)和脂肪酸代謝(Fatty Acid Metabolism)等(<0.05)。表5 為部分候選基因與生長性狀相關(guān)的富集通路。
表5 候選基因的顯著SNPs 窗口相關(guān)的GO 和KEGG 通路
生長性狀和家畜的骨骼生長及肌肉發(fā)育等多種過程直接相關(guān),在生豬產(chǎn)業(yè)中通常是直接衡量豬產(chǎn)肉能力及生長發(fā)育能力的標志,影響豬的生產(chǎn)效率和經(jīng)濟效益。GWAS 是檢測與目標性狀相關(guān)的候選基因最有效的方法之一。本實驗采用ssGWAS 的方法對296 頭豬BF、LD、LEA 性狀的遺傳變異進行研究,然后通過GO 和KEGG分析進一步探索了生長相關(guān)的基因及其參與途徑。
本研究在BF 性狀中檢測到10 個基因組區(qū)域分別解釋了超過1%的遺傳變異,在所確定的這些區(qū)域中,鑒定出了12 個相關(guān)候選基因(和基 因)。其中,BF 性狀富集到的顯著GO 條目:組織發(fā)育(Tissue Development)(GO:0009888,=0.012),調(diào)節(jié)細胞群增殖(Regulation of Cell Population Proliferation)(GO:0042127,=0.001)這可能與生長性狀有關(guān)。這2 個GO 條目包含和STAT3 基因。值得注意的是,位于上皮細胞分化(Epithelial Cell Differentiation)(GO:0030855)的GO 條目中,基因據(jù)研究可以增加神經(jīng)元分化和促進軸突生長,調(diào)節(jié)發(fā)育、分化相關(guān)過程,可能是胚胎發(fā)育的重要調(diào)節(jié)因子?;蚓幋a促腎上腺皮質(zhì)激素釋放因子家族的一個成員,被認為在哺乳動物的生長和發(fā)育中起重要作用。Seong 等表明可能是胴體性狀的候選基因并表明和原皮黑皮質(zhì)素(POMC)之間的相互作用強烈影響牛的胴體性狀。因此,基因可能在豬中有相同的作用,影響豬的生長發(fā)育。有研究證明的肝臟過表達會導(dǎo)致顯著的肝臟脂肪變性和血壓升高。此外,位于細胞群增殖的負調(diào)節(jié)(Negative Regulation of Cell Population Proliferation)(GO:0008285)的GO 條目中,信號傳感器和轉(zhuǎn)錄激活劑3()是一種細胞信號轉(zhuǎn)錄因子,在細胞增殖、存活和分化中起著至關(guān)重要的作用。這些基因與BF 直接相關(guān),也可能是BF 的潛在基因。
本研究在LMD 性狀中檢測到11 個基因組區(qū)域解釋了超過1%的遺傳變異,在所確定的這些區(qū)域中共鑒定出13 個候選基因(和基因)。LMD 性狀富集到的顯著GO 和KEGG 條目:脂肪酸-氧化(Fatty Acid Beta-Oxidation)(GO:0006635,=0.014),脂肪酸降解(Fatty Acid Degradation)(ssc00071,=0.020),纈氨酸、亮氨酸和異亮氨酸降解(Valine,Leucine and Isoleucine Degradation)(ssc00280,=0.024)和脂肪酸代謝(Fatty Acid Metabolism)(ssc01212,=0.028),這些條目中共同包含的基因為。除此之外,代謝途徑(Metabolic Pathways)(ssc01100)和脂肪酸伸長(Fatty Acid Elongation)(ssc00062)這2 個 條目中也包含基因,推斷與生長性狀相關(guān)。其中基因?qū)儆贜EK 基因家族,NEK 基因家族成員在細胞周期控制中具有重要作用,據(jù)報道與 DNA 損傷反應(yīng)有關(guān)。例如,Sabir 等研究表明耗竭會導(dǎo)致細胞活力的長期喪失。此外,據(jù)報道基因在體外和體內(nèi)結(jié)腸直腸癌細胞增殖、遷移和侵襲中發(fā)揮刺激作用。此外,另一個候選基因,葡糖胺基(N-乙酰基)轉(zhuǎn)移酶3()在研究中被證明促進細胞增殖和遷移,因此該基因可能與生長發(fā)育等過程相關(guān)。
本研究在LMA 性狀中檢測到14 個基因組區(qū)域解釋了超過1%的遺傳變異,在這些區(qū)域中還確定了14 個相關(guān)的候選基因(和基 因),其中LMA 富集到的顯著GO 和KEGG 條目:神經(jīng)元分化(Neuron Differentiation)(GO:0030182,=0.036)和脂肪酸代謝(Fatty Acid Metabolism)(ssc01212,=0.028),其中,大腦皮層發(fā)育(Cerebral Cortex Devel opment)(GO:0021987)條目也包含基因。基因位于脂肪酸伸長(ssc00062)、脂肪酸降解(ssc00071)和代謝途徑(ssc01100)的KEGG 條目中,可以推測是一個與生長性狀相關(guān)的候選基因。例如跨膜前后轉(zhuǎn)化1(),據(jù)推測是的下游效應(yīng)器,它可能通過在發(fā)育過程中轉(zhuǎn)導(dǎo)或傳輸軸向骨骼圖案形成所需的細胞外信息來發(fā)揮作用。此外,Liang 等研究發(fā)現(xiàn)人類中運輸?shù)鞍踪|(zhì)顆粒復(fù)合物亞基 9(9)中的功能喪失突變導(dǎo)致一種罕見的神經(jīng)發(fā)育綜合征,其特征是小頭畸形和肥胖,Bodnar 等也表明在中樞神經(jīng)系統(tǒng)發(fā)育和疾病中的作用正在得到新的揭示。ST8-N-乙酰神經(jīng)氨酸-2,8-唾液酸轉(zhuǎn)移酶6()被證明可能與脂質(zhì)代謝過程和肌肉脂肪含量有關(guān)。對接蛋白2()基因參與細胞周期和細胞增殖,但它們在肌肉發(fā)育和脂肪沉積中的作用機制尚不清楚。因此,有必要進一步研究這些基因在豬生長中的作用,為后續(xù)研究提供相應(yīng)參考依據(jù)。
本研究對豬場的296 頭母豬進行了ssGWAS 分析,共鑒定到35 個候選基因。其中BF 有12 個,分別為和基因;LMD 有13 個,分別為和基因;LMA 有14 個,分別為和基因。使用注釋基因進行GO 和KEGG 分析,主要參與MP、ESSD 和FAD 等通路。本研究篩選出了一些與生長有關(guān)的基因,為豬生長性狀的分子標記輔助選擇育種提供參考。但很多基因還沒有在畜禽中報道,這些候選基因的功能有待進一步探索。