路玉潔,莫家遠,綦文晶,朱思燃,楊麗麗,劉巧玲,卜亞歌,蘭干球,梁 晶
(廣西大學動物科學技術學院,南寧 530004)
豬與人類生活息息相關,其毛、皮和脂肪可作為工業(yè)原料,糞便可作為優(yōu)良的肥料使用,最重要的是豬能為人類提供優(yōu)質(zhì)的蛋白質(zhì)來源。雖然2020年我國豬肉產(chǎn)量為4 113萬噸,生豬出欄52 704萬頭,占全年肉類產(chǎn)量的53.84%,位居世界第一,但目前我國豬生產(chǎn)水平還較低,母豬年斷奶合格仔豬數(shù)(PSY)能達到25頭的規(guī)模豬場并不多,與國外先進水平差距達5~6頭[1]。產(chǎn)仔數(shù)是衡量母豬PSY高低的關鍵指標[2],按照2020年生豬出欄量計算,若我國母豬的平均PSY能提高1頭,預計可以減少82.52萬頭母豬的飼養(yǎng)量,這將節(jié)省大量的人力、物力和財力,大大有利于我國生豬產(chǎn)業(yè)的發(fā)展,因此提高產(chǎn)仔性能在養(yǎng)豬生產(chǎn)中尤為重要。
產(chǎn)仔數(shù)性狀是一個復雜的數(shù)量性狀,受微效多基因控制,其遺傳力約為0.1,屬于低遺傳力性狀[3-4],實踐證明基因組選擇是提高此類性狀的優(yōu)良育種手段[5],而性狀相關候選基因的確定與基因組選擇的準確性有很大關系,利用基因組序列信息對家畜品種進行選擇信號分析常作為一種鑒定性狀相關候選基因的方法。Bovo等[6]對歐洲豬種進行選擇信號分析,不僅發(fā)現(xiàn)OCA2基因與毛色有關,還發(fā)現(xiàn)NCAPG-LCORL和CASP10基因與豬的體型有關;Reimer等[7]對漢普夏、杜洛克等豬種進行選擇信號分析發(fā)現(xiàn),雄激素AR基因可能與豬的小體型有關;Trenhaile等[8]對西方雜交群體進行選擇信號分析發(fā)現(xiàn),P2X3R基因可能與產(chǎn)仔數(shù)性狀相關;Xu等[9]對梅山豬、金華豬等品種進行選擇信號分析發(fā)現(xiàn),EPAS1、CXCL2和TLR2等14個基因可能與豬傳染性肺炎易感性相關,李開軍等[10]對淮豬進行選擇信號分析發(fā)現(xiàn)了7個與粗纖維消化率相關的基因。本研究利用固定指數(shù)(Fst)方法進行選擇信號檢測,以鑒定可能影響中國地方豬產(chǎn)仔數(shù)性狀的候選基因,擬為中國地方豬種遺傳資源的開發(fā)利用和未來精準育種的實施提供理論依據(jù)。
本研究下載了102頭中國地方豬的Illumina PorcineSNP60芯片數(shù)據(jù)(http://dx.doi.org/10.5061/dryad.30tk6)[11],包括迪慶藏豬(dq)19頭、明光小耳豬(mg)16頭、五指山豬(wz)16頭、姜曲海豬(jq)11頭、藍塘豬(lt)20頭和梅山豬(ms)20頭。 根據(jù)各品種平均窩產(chǎn)仔數(shù)分為高、低產(chǎn)仔數(shù)組,其中高產(chǎn)仔數(shù)組包含姜曲海豬、藍塘豬和梅山豬3個品種共51頭豬,低產(chǎn)仔數(shù)組包含迪慶藏豬、明光小耳豬和五指山豬3個品種共51頭豬(表1)。
表1 6個中國地方豬種平均窩產(chǎn)仔數(shù)統(tǒng)計
使用plink 1.90軟件對下載的芯片數(shù)據(jù)進行質(zhì)控,去除最小等位基因頻率(MAF)小于0.05的位點,分型成功率小于0.9的個體和位點;將質(zhì)控后的數(shù)據(jù)按照品種劃分為6個群體,使用Beagle 5.0軟件進行基因型填充,將填充完畢的6個品種數(shù)據(jù)整合為一個vcf文件用于后續(xù)分析。
使用Tassel_v5軟件計算6個中國豬種個體之間的親緣關系(Kinship,K)矩陣和主成分(Principal component analysis,PCA)矩陣,并使用R 4.0.2繪圖;使用plink 1.90軟件對6個品種位點進行過濾,窗口大小設為100 kb,移動步數(shù)為10,R2閾值設為0.05,數(shù)據(jù)過濾后使用Structure軟件進行群體結構分析,并用R 4.0.2繪制群體結構圖;使用Tassel_v5軟件將vcf格式轉(zhuǎn)化為phy格式后,使用phylip 3.698軟件以鄰接法(NJ)構建進化樹。
使用vcftools 4.2軟件對6個品種分別與高產(chǎn)仔數(shù)組或低產(chǎn)仔數(shù)組進行Fst分析,包括:迪慶藏豬與高產(chǎn)仔數(shù)組、明光小耳豬與高產(chǎn)仔數(shù)組、五指山豬與高產(chǎn)仔數(shù)組、姜曲海豬與低產(chǎn)仔數(shù)組、藍塘豬與低產(chǎn)仔數(shù)組、梅山豬與低產(chǎn)仔數(shù)組。為進一步確定產(chǎn)仔數(shù)選擇信號,本研究進行以下4個步驟:1) 選取6個分析組中Fst值前1%的位點作為一組中受到選擇的選擇位點;2) 將迪慶藏豬與高產(chǎn)仔數(shù)組、明光小耳豬與高產(chǎn)仔數(shù)組、五指山豬與高產(chǎn)仔數(shù)組中相同的受選擇位點視為低產(chǎn)仔數(shù)品種與高產(chǎn)仔數(shù)組的選擇信號;3) 將姜曲海豬與低產(chǎn)仔數(shù)組、藍塘豬與低產(chǎn)仔數(shù)組、梅山豬與低產(chǎn)仔數(shù)組中相同的受選擇位點視為高產(chǎn)仔數(shù)品種與低產(chǎn)仔數(shù)組的選擇信號;4) 將第二和第三步篩選到的共同位點作為受到產(chǎn)仔數(shù)選擇的選擇信號。
使用vcftools 4.2軟件計算迪慶藏豬、明光小耳豬、五指山豬、姜曲海豬、藍塘豬和梅山豬各品種的連鎖不平衡衰減率與6個品種總的連鎖不平衡衰減率,并用R 4.0.2繪制連鎖不平衡(linkage disequilibrium,LD)衰減圖。將篩選到的受選擇SNP位點的上、下游12.68 kb作為候選區(qū)域,使用Biomart(https://may2017.archive.ensembl.org/biomart/martview/f80b3777e8381c63c577 d5980549139c)進行候選基因定位。對定位到的候選基因在David網(wǎng)站(https://david.ncifcrf.gov/conversion.jsp?VFROM=NA)進行GO和KEGG分析,使用R 4.0.2繪圖。通過文獻查閱基因的生物學功能,綜合分析確定與中國地方豬產(chǎn)仔數(shù)性狀相關的候選基因。
對6個中國地方豬種群的平均窩產(chǎn)仔數(shù)進行統(tǒng)計發(fā)現(xiàn),迪慶藏豬、明光小耳豬和五指山豬構建的低產(chǎn)仔數(shù)組的平均窩產(chǎn)仔數(shù)低于姜曲海豬、藍塘豬和梅山豬構成的高產(chǎn)仔數(shù)組(表2)。
本研究下載的102頭中國地方豬數(shù)據(jù)包含61 773個 SNPs位點,去除非常染色體和性染色體上的位點、MAF小于0.05和分型成功率小于0.9的位點,最終共有33 285個位點用于后續(xù)分析。
使用Tassel_v5軟件分析6個中國地方豬種的親緣關系和主成分關系,得到親緣關系矩陣與主成分矩陣,并用R 4.0.2繪制親緣關系圖和三維PCA圖。結果顯示,6個品種間的親緣關系較遠,品種內(nèi)親緣關系較近,在梅山豬的群體內(nèi)存在3個親緣關系較高的小群體(圖1);PC1、PC2和PC3分別解釋了變異的12.99%、9.74%和5.42%,迪慶藏豬、姜曲海豬、梅山豬和五指山豬4個豬種內(nèi)個體分別聚集在一起,明光小耳豬群體內(nèi)個體分布較分散,且與迪慶藏豬距離近,藍塘豬群體中有部分個體單獨聚集(圖2A)。
表2 高、低產(chǎn)仔數(shù)組平均窩產(chǎn)仔數(shù)統(tǒng)計
使用vcftools 4.2軟件計算我國6個豬品種的LD衰減率,對102頭中國地方豬整體LD進行計算發(fā)現(xiàn),在距離為12.68 kb時整體的R2只剩下0.17,而在126.6 kb以后的距離處觀察到R2小于0.10(表3)。其中迪慶藏豬和五指山豬的LD衰減很接近,在6個中國地方品種中衰減最快,在250 kb之后與整體的衰減速度基本一致;6個品種的LD衰減速率依次為梅山豬<藍塘豬<姜曲海豬<明光小耳豬<五指山豬或迪慶藏豬(圖2B)。
表3 102頭中國地方豬LD衰減率
Plink 1.90軟件質(zhì)控之后剩余932個SNPs位點,使用Structure軟件進行群體遺傳結構分析。結果顯示,當k=2時,迪慶藏豬、明光小耳豬和五指山豬低產(chǎn)仔數(shù)組與姜曲海豬、藍塘豬和梅山豬高產(chǎn)仔數(shù)組很明顯的分離出來;當k=3時,迪慶藏豬和梅山豬分離出來;當k=4時,明光小耳豬和五指山豬,姜曲海豬和藍塘豬仍然混在一起沒有分離開;當k=5時,五指山豬分離出來;當k=6時,藍塘豬分離出來(圖3A)。使用phylip 3.698繪制群體進化樹,結果顯示,姜曲海豬、藍塘豬、五指山豬、迪慶藏豬和明光小耳豬群體各自在一個分支上,梅山豬群體在1個分支上存在3個小分支,明光小耳豬群體中有1個個體并未和群體中的其他個體劃分在同一分支上(圖3B)。
分別對迪慶藏豬、明光小耳豬和五指山豬與高產(chǎn)仔數(shù)組之間進行Fst分析,保留其各自前1%的SNP位點,分別獲得331、332和331個位點,其中在3個對比組中都出現(xiàn)的SNP位點共有176個;分別對姜曲海豬、藍塘豬和梅山豬與低產(chǎn)仔數(shù)組之間進行Fst分析,保留其各自1%的SNP位點,分別獲得331、331和332個位點,其中在3個對比組中都出現(xiàn)的SNP位點共有176個;高、低組共同篩選到的受選擇位點為176個(表4)。
將篩選到的176個SNPs位點上、下游12.68 kb距離作為選擇區(qū)域,用Biomart進行基因定位,共獲得66個候選基因,并使用David網(wǎng)站進行GO和KEGG富集分析。GO富集分析結果顯示,66個基因在啟動子特異性染色質(zhì)結合(GO:1990841)、肌動蛋白細胞骨架組織的調(diào)節(jié)(GO:0032956)、RNA聚合酶Ⅱ調(diào)控區(qū)序列特異性DNA結合(GO:0000977)、Ras蛋白信號轉(zhuǎn)導(GO:0007265)和骨化結合(GO:0001503)通路中富集;KEGG富集分析顯示,66個基因只在谷氨酸能突觸傳遞(ssc04724)通路富集。通過查閱文獻發(fā)現(xiàn),有CHD7、FBXO43、RUNX1、STRBP和TEDDM1共5個基因與繁殖性狀相關,其中RUNX1基因參與RNA聚合酶Ⅱ調(diào)控區(qū)序列特異性DNA結合和骨化結合通路,CHD7參與啟動子特異性染色質(zhì)結合通路。
dq表示迪慶藏豬,mg表示明光小耳豬,wz表示五指山豬,jq表示姜曲海豬,lt表示藍塘豬,ms表示梅山豬;下同dq means Diqing Tibetan pig, mg means Mingguang Xiaoer pig, wz menas Wuzhishan pig, jq means Jiangquhai pig, lt means Lantang pig, ms means Meishan pig. The same as below圖1 6個豬種親緣關系圖Fig.1 Genetic relationship of 6 pig breeds
A. 三維PCA圖;B. LD衰減圖;圖中total表示所有個體A. Three-dimensional PCA map; B. LD attenuation diagram; The total means all of the pigs in this research圖2 6個中國地方豬品種的PCA圖和LD衰減圖Fig.2 The PCA map and LD attenuation map in 6 Chinese indigenous pig breeds
A.群體結構圖;B.進化樹A. Population structure diagram; B. Phylogenetic tree圖3 群體遺傳結構和進化樹Fig.3 Population structure and phylogenetic tree
表4 Fst分析受選擇位點
親緣關系分析可以使用親緣系數(shù)直觀地反映群體內(nèi)和群體間的相關性高低,PCA分析可對群體進行聚類分析,群體遺傳結構分析可以反映群體間是否存在基因交流,進化樹可以直觀地反映群體間的進化關系及親緣關系。對群體進行親緣關系、PCA、群體遺傳結構分析和進化樹構建,研究各群體之間的分化情況,可以更進一步了解不同品種的遺傳距離和進化關系等,為深入了解中國地方豬種的進化提供理論參考[18-19]。本研究中的親緣關系分析發(fā)現(xiàn),梅山豬群體內(nèi)有3個親緣關系較近的亞群,這可能是因為采集的樣品主要由3個家系構成導致的;PCA分析發(fā)現(xiàn),五指山豬、姜曲海豬、藍塘豬和梅山豬4個群體分離度高,在3個PC的情況下完整分離出來,迪慶藏豬和明光小耳豬兩個群體有部分個體聚集在一起,可能是因為這2個品種都來自云南地區(qū),基因間存在一定的交流。Structure分析發(fā)現(xiàn),當k=2時,迪慶藏豬、明光小耳豬、五指山豬低產(chǎn)仔數(shù)組和姜曲海豬、藍塘豬、梅山豬高產(chǎn)仔數(shù)組出現(xiàn)明顯分離,但品種之間無法分離,這可能與兩個分組的產(chǎn)仔數(shù)差異和體型差異等有關;當k=3時,迪慶藏豬和梅山豬首先被分離出來,可能因為迪慶藏豬與梅山豬是本研究中產(chǎn)仔數(shù)差異最大的兩個品種,且迪慶藏豬屬于生長在高海拔的小型豬種,而梅山豬屬于生長在平原的較大型地方豬品種。進化樹結果顯示,姜曲海豬、藍塘豬、五指山豬、迪慶藏豬和明光小耳豬群體各自在同一個分支上,梅山豬群體在1個分支上有3個小分支,與親緣關系結果一致;明光小耳豬群體中有1個個體出現(xiàn)離群,并和群體中的其他個體在同一個分支上,這可能與樣品來源不純等因素有關。從進化樹上看,群體間的距離基本上與各群體所在的地理位置距離一致,迪慶藏豬與明光小耳豬均位于云南,在進化樹上是距離最近的兩個品種;五指山豬與藍塘豬分別位于海南與廣東,其距離也較近;姜曲海豬和梅山豬均位于江蘇地區(qū),聚集在一個大分支上,且與五指山豬進化距離較遠,與Ai等[20]利用全基因組測序方法對中國地方豬進化關系研究的結果一致。
對102頭中國地方豬進行統(tǒng)計分析發(fā)現(xiàn),高產(chǎn)仔數(shù)組平均產(chǎn)仔數(shù)比低產(chǎn)仔數(shù)組高7.31頭,為低產(chǎn)仔數(shù)組的2.28倍,說明不同中國本地豬種在各地馴化后由于長時間的自然選擇和人工選擇在很多性狀上出現(xiàn)了極大的變異,是研究基因組選擇信號非常好的材料。Ai等[21]利用豬60K SNP芯片研究中西方豬的連鎖不平衡差異發(fā)現(xiàn),西方豬的平均R2為0.3時距離為125 kb,而中國地方豬僅為10.5 kb。本研究計算6個中國地方品種的LD衰減速度也有類似發(fā)現(xiàn),它們的衰減速度都非常快,在12.68 kb就已經(jīng)衰減到了0.17,與廣西地方豬種[19]和太湖地區(qū)6個中國地方豬品種[22]的群體遺傳結構研究結果一致。而西方商業(yè)豬種在500 kb時R2仍超過0.3[23],說明中國本地豬種在近代人工選育程度遠不如西方商業(yè)豬種,也說明中國本地豬種的諸多優(yōu)良性狀還有待進一步開發(fā)利用。在本研究中,6個群體在12.68 kb距離時其連鎖不平衡程度已經(jīng)較低,因此針對最終篩選到的176個受選擇位點,使用其上、下游12.68 kb作為候選基因定位的范圍。
前人研究發(fā)現(xiàn),多個基因與中國地方豬的繁殖性狀相關,如孫浩[24]利用撒壩豬基因組信息檢測到PRL、ADRA1B和BMP7等基因影響撒壩豬的繁殖力,管麗飛[25]利用測序技術和AS-PCR技術檢測到精子鞭毛2(SPEF2)基因與香豬產(chǎn)仔數(shù)之間有關聯(lián),張倩[26]利用分子標記技術鑒別到微管蛋白δ1(TUBD1)基因是影響二花臉豬產(chǎn)仔數(shù)的候選基因等。本研究對176個受選擇位點進行基因定位,發(fā)現(xiàn)66個蛋白編碼基因位于受選擇區(qū)間內(nèi),其中CHD7是編碼染色體結構域解旋酶DNA結合蛋白7的基因,其在常染色體顯性遺傳(AD)中發(fā)現(xiàn)的變體與生長發(fā)育遲緩和生殖器異常相關,并且攜帶CHD7的家庭在其他AD中的突變表現(xiàn)出了先天性性腺機能減退[27]。Schrimpf等[28]利用11匹馬進行下一代全基因組測序,對數(shù)據(jù)檢索到的稀有高影響力變體進行基因分型,結果發(fā)現(xiàn)了FBXO43等9個與種馬繁殖力相關的基因。有研究發(fā)現(xiàn),F(xiàn)BXO43在減數(shù)分裂過程中起作用[29],還影響呈圓周運動的精子數(shù)量[30]。RUNX1是一種核轉(zhuǎn)錄因子,在小鼠排卵前卵泡中被黃體生成素誘導,并促進孕激素的產(chǎn)生[31],還可以刺激山羊顆粒細胞增殖和孕酮分泌[32]。Zhong等[33]在對RUNX1在受H3K27me3調(diào)節(jié)的豬顆粒細胞中增殖作用的研究發(fā)現(xiàn),RUNX1通過調(diào)節(jié)與類固醇生成相關基因的表達而控制雌激素、雄激素和前列腺素的分泌,并且充當媒介,增強類固醇生成相關基因?qū)θ私q毛膜促性腺激素(HCG)的反應,促進核成熟和卵泡破裂而刺激排卵[34]。STRBP是精子核周RNA結合蛋白[35],Zou等[36]對雷州黑鴨卵泡發(fā)育過程中產(chǎn)卵量差異進行研究,發(fā)現(xiàn)了STRBP等25種與鴨卵巢發(fā)育有關的基因,它們可能影響卵子的產(chǎn)生。Juma等[37]對小鼠精子研究發(fā)現(xiàn),敲除TEDDM1的小鼠生育力下降[38]。此外,本研究依據(jù)產(chǎn)仔數(shù)劃分的高、低組豬的體型差異也正好與產(chǎn)仔數(shù)性狀差異分組相一致,但有研究證實,體型與產(chǎn)仔數(shù)之間并無較大的相關性[39-40],因此CHD7、FBXO43、RUNX1、STRBP和TEDDM1基因可能是影響中國地方豬產(chǎn)仔數(shù)性狀的候選基因。
本研究發(fā)現(xiàn),6個中國地方豬種基因組的LD衰減速度均較快,順序依次為梅山豬<藍塘豬<姜曲海豬<明光小耳豬<五指山豬或迪慶藏豬;梅山豬群體內(nèi)存在3個親緣關系較高的小群體,明光小耳豬有部分個體與迪慶藏豬聚集在一起,各個豬種間的進化距離與地理距離較一致。通過選擇信號分析發(fā)現(xiàn),CHD7、FBXO43、RUNX1、STRBP和TEDDM1基因可能作為中國地方豬產(chǎn)仔數(shù)性狀的候選基因。