路玉潔,莫家遠(yuǎn),朱思燃,楊麗麗,陳奎蓉,呂冬玲,李月月,劉笑笑,梁 靚,蘭干球,梁 晶
(廣西大學(xué)動(dòng)物科學(xué)技術(shù)學(xué)院,南寧 530004)
隆林豬是廣西六大地方豬種之一,具有生長(zhǎng)較快、體型較大、性早熟、抗病力強(qiáng)和耐粗飼等特點(diǎn)。由于西方商業(yè)豬種的沖擊,隆林豬的保有量持續(xù)下降,據(jù)隆林縣畜牧局統(tǒng)計(jì),2005年上半年存欄隆林豬僅剩765頭,其中公豬15頭[1]。特別是暴發(fā)非洲豬瘟以來,中國養(yǎng)豬業(yè)遭受了巨大損失,很多中國地方豬種的種群數(shù)量進(jìn)一步下降,進(jìn)而造成了種質(zhì)資源丟失和遺傳多樣性下降。中國地方豬種由于具有產(chǎn)仔數(shù)高、抗病性好、性早熟和肉質(zhì)優(yōu)良等特點(diǎn),歷來被作為豬育種的優(yōu)良材料,如通過隆林豬與杜洛克豬雜交對(duì)種質(zhì)資源進(jìn)行利用[2-3]??截悢?shù)變異(copy number variation,CNV)是指基因組中從50 bp到5 Mb不等的缺失或重復(fù),拷貝數(shù)變異區(qū)域(copy number variation region,CNVR)則是指具有重疊片段的相鄰CNV構(gòu)成的區(qū)域。由于CNVR的長(zhǎng)度均超過50 bp,所以其對(duì)基因結(jié)構(gòu)和基因劑量產(chǎn)生影響的可能性更大,研究也證明了CNVR可以影響豬的很多重要經(jīng)濟(jì)性狀。Qiu等[4]發(fā)現(xiàn)了9個(gè)CNVRs與杜洛克豬的平均日增重和達(dá)100 kg日齡有關(guān);Zheng等[5]發(fā)現(xiàn)AHR基因的拷貝數(shù)變異與繁殖性狀有關(guān);Wang等[6]發(fā)現(xiàn)GPER1基因拷貝數(shù)變異與大白豬的產(chǎn)仔數(shù)相關(guān)。本研究通過中芯一號(hào)50 K SNP芯片對(duì)廣西隆林豬進(jìn)行CNV檢測(cè),以期為進(jìn)一步提高隆林豬的種質(zhì)資源利用效率,深入挖掘隆林豬的優(yōu)良遺傳特性提供理論依據(jù)。
于廣西隆林縣采集33頭成年隆林母豬耳組織,使用酚-氯仿法提取耳組織DNA,經(jīng)過瓊脂糖凝膠電泳和微量紫外分光光度計(jì)鑒定質(zhì)量,符合分型標(biāo)準(zhǔn)后送北京康普森公司進(jìn)行豬中芯一號(hào)50K SNP芯片分型。
使用Genomestudio 2.0軟件對(duì)Grn和Red原始數(shù)據(jù)進(jìn)行讀取,并將每個(gè)個(gè)體的51 315個(gè)位點(diǎn)的BAF和LRR值單獨(dú)導(dǎo)出。使用Linux系統(tǒng)將文件整理為PennCNV軟件輸入格式。
使用Genomestudio 2.0軟件的插件CNVPartition 3.2.0對(duì)CNV進(jìn)行檢測(cè),參數(shù)為:置信閾值35,最小純合區(qū)域大小1 Mb,最小SNP數(shù)3。使用PennCNV 1.0.5對(duì)整理后的文件進(jìn)行CNV檢測(cè),參數(shù)為:最小SNP數(shù)3,最小CNV長(zhǎng)度1 kb。去除性染色體上檢測(cè)到的CNV。
使用Bedtools軟件分別對(duì)CNVPartition和PennCNV軟件檢測(cè)到的CNV進(jìn)行合并。將合并后的CNVR分為缺失、獲得和混合3種類型,對(duì)2種軟件檢測(cè)到的CNVR再次合并為共同CNVR。
使用BioMart軟件對(duì)CNVPartition檢測(cè)到的CNVR、PennCNV檢測(cè)到的CNVR和共同CNVR內(nèi)包含的基因比對(duì)豬基因組(Susscrofa10.2)進(jìn)行注釋,并通過David網(wǎng)站對(duì)3種CNVR注釋到的基因進(jìn)行GO和KEGG富集分析。使用豬QTL數(shù)據(jù)庫對(duì)與隆林豬共同CNVR重疊的QTL進(jìn)行注釋。
使用CNVPartition軟件在常染色體中共檢測(cè)到260個(gè)CNVs,合并后得到47個(gè)CNVRs,其中缺失型40個(gè)、獲得型5個(gè)、混合型2個(gè),長(zhǎng)度范圍為53.35~1 201.49 kb(圖1)。基因定位發(fā)現(xiàn)共有84個(gè)編碼蛋白基因位于CNVR內(nèi)。David分析富集到了20條通路,其中13條通路顯著富集(P<0.05),包括涉及嗅覺感官知覺的化學(xué)刺激檢測(cè)通路(GO:0050911)、嗅覺受體活性通路(GO:0004984)和嗅覺轉(zhuǎn)導(dǎo)通路(hsa04740)等(表1)。
圖1 CNVPartition軟件檢測(cè)到的CNVRFig.1 CNVR detected by CNVPartition software
使用PennCNV軟件在常染色體中共檢測(cè)到96個(gè)CNVs,合并后得到15個(gè)CNVRs,其中缺失型9個(gè)、獲得型1個(gè)、混合型5個(gè),長(zhǎng)度范圍為9.28~797.77 kb(圖2)。 基因定位發(fā)現(xiàn),OR6C4、OR6C65、OR6C76、OR8K5、OR9G4、TRAV10、TRAV14DV4、TRAV9-1共8個(gè)基因位于CNVR內(nèi)。David分析富集到了8條信號(hào)通路,均為顯著富集通路(P<0.05),包括涉及嗅覺感官知覺的化學(xué)刺激檢測(cè)通路(GO:0050911)、嗅覺受體活性通路(GO:0004984)和嗅覺轉(zhuǎn)導(dǎo)通路(hsa04740)等(表2)。
圖2 PennCNV軟件檢測(cè)到的CNVRFig.2 CNVR detected by PennCNV software
表2 8條顯著富集通路
使用Bedtools軟件對(duì)2個(gè)軟件檢測(cè)到的CNVR進(jìn)行合并后獲得了3個(gè)共同CNVRs,其中缺失型、獲得型和混合型各1個(gè),長(zhǎng)度范圍為600.70~1 201.49 kb(表3)。 基因定位發(fā)現(xiàn),OR10AG1、OR6C4、OR6C65、OR6C76、OR8K5、TRAV10、TRAV14DV4、TRAV9-1共8個(gè)基因位于共同CNVR內(nèi)。David分析富集到了7條信號(hào)通路,均為顯著富集通路(P<0.05),包括涉及嗅覺感官知覺的化學(xué)刺激檢測(cè)通路(GO:0050911)、嗅覺受體活性通路(GO:0004984)和嗅覺轉(zhuǎn)導(dǎo)通路(hsa04740)等(表4)。對(duì)共同CNVR進(jìn)行QTL注釋發(fā)現(xiàn),共有130個(gè)QTLs與3個(gè)共同CNVRs重疊,排名前11的性狀中,與背膘厚相關(guān)的性狀包括平均背膘厚、最后一根肋骨背膘和第十肋背膘,共有11個(gè)QTLs;肉質(zhì)相關(guān)的性狀包括肉色b*、pH24 h(死后腰部)和剪切力,共有9個(gè)QTLs;乳頭數(shù)性狀相關(guān)的QTLs為6個(gè)(圖3)。
表3 共同CNVR
表4 7條顯著富集通路
圖3 共同CNVR的QTL注釋圖Fig.3 QTL map annotation of common CNVR
豬的基因組中存在大量的單堿基和多堿基變異,如巴馬香豬包含14 691 086個(gè)SNPs,3 207個(gè)CNVs和4 191 263個(gè)Indels等[7]。其中由SNP構(gòu)成的商業(yè)芯片,如中芯一號(hào)[8]、60K芯片[9]和80K芯片[6]已被廣泛應(yīng)用于基因組選擇中來提高豬育種的遺傳進(jìn)展[10]。特別是Yang等[11]研究發(fā)現(xiàn),基于大樣本低深度重測(cè)序可以大大降低SNP分型的成本,為基因組選擇技術(shù)的發(fā)展作出了重要貢獻(xiàn)。但基因組選擇并不是育種工作的最終手段,未來的發(fā)展方向之一是精準(zhǔn)育種,即通過基因編輯等手段對(duì)性狀相關(guān)的因果突變進(jìn)行人工改造,從而改良動(dòng)物的表型。而CNV由于長(zhǎng)度比SNP更長(zhǎng),所以對(duì)基因的結(jié)構(gòu)和表達(dá)影響可能更大,因此未來在豬精準(zhǔn)育種工作中也應(yīng)該將CNV考慮進(jìn)去。本研究對(duì)隆林豬的CNV進(jìn)行分析,為深入挖掘隆林豬的遺傳特性和未來使用CNV進(jìn)行精準(zhǔn)育種提供參考。
本研究使用CNVPartition軟件檢測(cè)CNV,發(fā)現(xiàn)共有47個(gè)CNVRs,使用PennCNV軟件檢測(cè)發(fā)現(xiàn)共有15個(gè)CNVRs,而2個(gè)軟件共同檢測(cè)到的CNVRs僅有3個(gè),這可能是由于CNVPartition軟件使用的算法是將BAF與LRR值與作為二元高斯分布創(chuàng)建的14個(gè)預(yù)測(cè)拷貝數(shù)進(jìn)行比較來鑒定CNV,而PennCNV使用的算法是基于隱馬科夫模型來鑒定CNV[12]。因?yàn)?個(gè)個(gè)體鑒定的CNV具有重疊部分會(huì)被定義為一個(gè)CNVR[13],所以研究中使用的個(gè)體越多理論上能檢測(cè)到的CNVR也會(huì)越多,因此本研究鑒定到的CNVR較少可能與使用的個(gè)體較少有關(guān),這與邱恒清等[14]研究發(fā)現(xiàn)樣品越多CNV檢出率越高的結(jié)果一致。同時(shí)本研究使用的中芯一號(hào)芯片雖然是參照了中國本地豬種的SNP進(jìn)行設(shè)計(jì),但是其包含位點(diǎn)僅有51 315個(gè),即平均每47.92 kb才有1個(gè)SNP,因此很多較短的CNV使用中芯一號(hào)芯片難以被檢測(cè)到,而CNV出現(xiàn)的頻率與CNV長(zhǎng)度呈負(fù)相關(guān)[15],這與本研究發(fā)現(xiàn)共同CNVR范圍在600.70~1 201.49 kb一致,這也相應(yīng)導(dǎo)致了本研究得到的CNVR較少。
對(duì)2個(gè)軟件檢測(cè)到的CNVR進(jìn)行基因定位和富集分析發(fā)現(xiàn),用CNVPartition軟件定位到了84個(gè)編碼蛋白基因,其中INPP5B、NEURL1和GAPDHS基因顯著富集到精子活力通路(GO:0030317)中。Marcello等[16]對(duì)INPP5B基因雙敲除小鼠進(jìn)行研究顯示,INPP5B基因雙敲除小鼠的精子由于與卵質(zhì)膜的結(jié)合和融合的減少,導(dǎo)致受精顯著減少;NEURL1基因在人類的睪丸中高表達(dá)[17],可能與人類的繁殖能力有關(guān);GAPDHS基因作為一種精子特異性糖酵解酶,參與了精子發(fā)生和精子運(yùn)動(dòng)過程,并在次級(jí)精子和卵母細(xì)胞結(jié)合過程中具有重要作用[18],說明這3個(gè)基因相關(guān)的CNVR可能與隆林豬的繁殖性能有關(guān)。2個(gè)軟件富集到的顯著條目中有6條為共同顯著條目,包括涉及嗅覺感官知覺的化學(xué)刺激檢測(cè)通路(GO:0050911)、嗅覺受體活性通路(GO:0004984)、嗅覺轉(zhuǎn)導(dǎo)通路(hsa04740)、G-蛋白偶聯(lián)受體活性通路(GO:0004930)、G-蛋白偶聯(lián)受體信號(hào)通路(GO:0007186)和膜整體組件通路(GO:0016021),這些結(jié)果與張?bào)襕15]發(fā)現(xiàn)巴馬香豬和巴馬小型豬CNV定位到的基因大量富集在G-蛋白偶聯(lián)受體相關(guān)通路、嗅覺相關(guān)通路的結(jié)果一致。而G-蛋白偶聯(lián)受體在向細(xì)胞傳輸各種細(xì)胞外信號(hào)和調(diào)節(jié)各種生理功能方面發(fā)揮著關(guān)鍵作用,其廣泛參與了機(jī)體的各種功能和生命活動(dòng),如消化功能[19]、肥胖發(fā)生[20]、糖尿病發(fā)生[21]、繁殖能力[22]等。本研究中參與G-蛋白偶聯(lián)受體相關(guān)通路的基因中除了OR8K5、OR5D18、OR6C76、OR6C65、OR4C12、OR12D3、OR10AG1、OR6C4和OR5D16這9個(gè)嗅覺相關(guān)的基因外還有FFAR2和FFAR1基因,有研究發(fā)現(xiàn)FFAR2基因與免疫功能[23]、能量代謝[24]、骨重塑[25]等重要功能相關(guān);FFAR1基因與血管生成[26]、能量代謝[27]、母性行為[28]等有關(guān);其中FFAR2和FFAR1基因都與能量代謝和糖尿病發(fā)生有密切關(guān)系[29-30],甚至可作為糖尿病治療的藥物靶點(diǎn)[31],提示豬雖然肥胖但不容易發(fā)生糖尿病可能與糖尿病相關(guān)基因的CNV有關(guān)。
本研究使用2個(gè)軟件共同鑒定的CNVRs僅有3個(gè),定位到了8個(gè)編碼蛋白基因,嗅覺相關(guān)基因和免疫相關(guān)基因仍然是主要基因,其顯著富集通路同樣主要是嗅覺相關(guān)通路和G-蛋白偶聯(lián)相關(guān)通路。對(duì)與共同CNVR重疊的QTL進(jìn)行分析發(fā)現(xiàn)了排名前11的性狀分別是乳頭數(shù)、平均背膘厚、眼肌面積、胴體長(zhǎng)度、平均日采食量、最后一根肋骨背膘、第十肋背膘、腰部重量、肉色b*、pH24 h(死后腰部)和剪切力,其中背膘厚相關(guān)QTLs共有11個(gè);肉質(zhì)相關(guān)QTLs共有9個(gè),乳頭數(shù)相關(guān)QTLs共有6個(gè)。綜上,本研究的3個(gè)共同CNVRs可能與背膘厚、肉質(zhì)和乳頭數(shù)性狀相關(guān)。
本研究通過2種軟件對(duì)隆林豬CNV進(jìn)行檢測(cè),并進(jìn)行了基因定位、富集分析和QTL分析,共獲得了356個(gè)CNVs、62個(gè)CNVRs和3個(gè)共同CNVRs;基因主要富集在嗅覺相關(guān)通路和G-蛋白偶聯(lián)相關(guān)通路中,其中INPP5B、NEURL1和GAPDHS基因顯著富集在精子活力通路;分別有11、9和6個(gè)與背膘厚、肉質(zhì)和乳頭數(shù)性狀相關(guān)的QTLs與共同CNVR重疊;隆林豬CNV可能與嗅覺功能、繁殖性能、背膘厚、肉質(zhì)和乳頭數(shù)性狀相關(guān)。