李 恒,字向東
(西南民族大學(xué)動(dòng)物科學(xué)國(guó)家民委重點(diǎn)實(shí)驗(yàn)室,四川成都 610041)
山羊(Capra hircus)是最古老的家養(yǎng)動(dòng)物之一,起源于扎格羅斯山脈附近(伊朗地區(qū)),馴化時(shí)間大約是一萬(wàn)年前的新石器時(shí)代[1],此時(shí)人類生活方式由狩獵轉(zhuǎn)向農(nóng)耕[2],山羊能為人類提供穩(wěn)定的肉、奶、毛皮等生活物資,逐漸在經(jīng)濟(jì)、文化、宗教上與人類文明建立起密切的關(guān)系[3]。隨著人類的遷移和商業(yè)貿(mào)易,山羊迅速傳播到世界各地。根據(jù)聯(lián)合國(guó)糧農(nóng)組織統(tǒng)計(jì),全世界有超過(guò)579 個(gè)山羊品種,山羊存欄量10 億只,中國(guó)和印度的山羊共占世界存欄量的32%。
基因組學(xué)是解析生物表型變異和遺傳基礎(chǔ)的重要學(xué)科,可對(duì)生物基因序列進(jìn)行定位與功能分析[4]。全基因組測(cè)序是研究該學(xué)科的重要手段,主要集中在從頭組裝測(cè)序和重測(cè)序2 個(gè)方面。其中,重測(cè)序手段最為常見(jiàn),可對(duì)已知基因組序列物種的個(gè)體或群體進(jìn)行表型變異分析[5]。為實(shí)現(xiàn)早期選擇,降低育種成本,加速山羊的改良進(jìn)程,本文總結(jié)了山羊全基因組測(cè)序相關(guān)理論成果,旨在為后續(xù)山羊功能基因組學(xué)研究提供基礎(chǔ)資料,為山羊分子育種工作提供新視角。
2013 年,Dong 等[6]利用新一代測(cè)序、全基因組酶切圖譜等技術(shù)對(duì)云南黑山羊進(jìn)行深度測(cè)序,從頭組裝了首個(gè)山羊參考基因組序列CHIR_1.0,完成基因組的結(jié)構(gòu)和功能注釋工作,其中Contig N50 為18 720 bp,Scaffoled N50 為16.3 Mb。2014 年,Du 等[7]利用輻射雜交圖譜等數(shù)據(jù)對(duì)CHIR_1.0 進(jìn)行優(yōu)化,獲得了更準(zhǔn)確、更完整的山羊參考基因組 CHIR_2.0(表1)。2015 年,Dong 等[8]又對(duì)伊朗野山羊(Capra aegagrus,bezoar)從頭組裝測(cè)序,構(gòu)建了野山羊的參考基因組,并家養(yǎng)山羊代表品種的重測(cè)序數(shù)據(jù)分析進(jìn)行比較,發(fā)現(xiàn)毛色相關(guān)基因ASIP存在拷貝數(shù)變異(拷貝數(shù)越高,毛色越淺),CACNA1C與HTR3A基因分別在野山羊和家山羊中快速進(jìn)化,行為變化由警覺(jué)到溫順,推測(cè)與馴化有關(guān)。2017 年,隨著三代測(cè)序技術(shù)的逐漸成熟,BickHart 等[9]結(jié)合二代 Illumina、三代 Pacbio 單分子測(cè)序、光學(xué)圖譜BioNano 和Hi-C 等技術(shù)對(duì)圣克利門(mén)蒂山羊進(jìn)行從頭組裝,獲得了僅含663 個(gè)空白序列的高質(zhì)量山羊基因組精細(xì)圖譜ARS1。與之前的組裝版本CHIR_1.0 和CHIR_2.0 相比,ARS1 完善組裝了高度重復(fù)的著絲粒和端粒區(qū)域,解決了超過(guò)1 kb 的重復(fù)結(jié)構(gòu),不僅為山羊的基因組表型分析提供高質(zhì)量的遺傳信息,也為其他物種基因組的裝配提供參考。
表1 山羊不同版本的參考基因組比較
2.1 生理特征 山羊的馴化是多起源的[10-11]。馴化后的山羊隨著人類活動(dòng)快速擴(kuò)散并成功適應(yīng)不同生態(tài)地區(qū),極具地域特色。如生存在炎熱沙漠地區(qū)的Draa 山羊頻繁喘息,為解釋這一現(xiàn)象,Benjelloun 等[12]對(duì)Black、Draa 和Northern 3 個(gè)種群共36 只山羊全基因組掃描分析,在Draa 山羊群體中發(fā)現(xiàn)呼吸系統(tǒng)調(diào)節(jié)和氣體交換類別的GO 條目富集,可能與Draa 山羊利用喘氣散熱有關(guān)。西藏絨山羊可在高寒缺氧的惡劣生存環(huán)境中生存繁衍,為闡釋其表型適應(yīng)的遺傳機(jī)制,Song 等[13]對(duì)330 只絨山羊外顯子進(jìn)行測(cè)序分析,結(jié)果表明,EPAS1、PTPRJ、DSG3等心血管系統(tǒng)相關(guān)基因可能在高海拔適應(yīng)性中發(fā)揮重要作用。后續(xù)針對(duì)低海拔和高海拔山羊種群的DSG3基因16 個(gè)外顯子重測(cè)序分析也佐證了這一觀點(diǎn)[14]。也有研究發(fā)現(xiàn),CDK2、SOCS2、NOXA1、ENPEP基因也與高海拔適應(yīng)性密切相關(guān)[15]。土著山羊雖生產(chǎn)性能較低,但對(duì)當(dāng)?shù)貝毫拥纳姝h(huán)境或特定的疾病具有耐受性。據(jù)報(bào)道,烏干達(dá)本土山羊增強(qiáng)自身免疫能力以抵御非洲熱帶環(huán)境中寄生蟲(chóng)的感染[16];韓國(guó)本地山羊群體中發(fā)現(xiàn)了抗腰麻痹病基因(CCR3、CLNK、HM13、IGSF10、ROBO1)和抗沙門(mén)桿菌及革蘭氏陰性菌基因(NTMLBP、BPI)[17-18]。這些遺傳標(biāo)記均是山羊種質(zhì)保護(hù)的重要遺傳資源,為山羊品種改良及育種計(jì)劃提供了重要基礎(chǔ)。
2.2 羊絨性狀 山羊絨素有軟黃金之稱,其價(jià)值由顏色、長(zhǎng)度、細(xì)度和產(chǎn)量決定。羊絨顏色是單基因控制的質(zhì)量性狀,但其長(zhǎng)度、直徑與產(chǎn)量都屬于多基因控制的數(shù)量性狀。因此,探明羊絨性狀的遺傳機(jī)制難度較大。
Wang 等[15]對(duì)8 個(gè)不同地區(qū)的家養(yǎng)山羊品種(太行黑山羊、藏山羊、內(nèi)蒙古絨山羊、陜北絨山羊、安哥拉山羊、波爾山羊、嶗山奶山羊和貴州小山羊)進(jìn)行表型分析時(shí),鑒定了羊絨性狀候選基因LHX2、FGF9與WNT2。Li 等[19]在80 個(gè)絨山羊個(gè)體中也掃描到FGF5、ROCK1、PRKCD、SGK3等多個(gè)羊絨性狀的候選基因。絨由山羊的次級(jí)毛囊產(chǎn)生,LHX2基因調(diào)控毛發(fā)產(chǎn)生與再生[20],其循環(huán)表達(dá)參與山羊次級(jí)毛囊的發(fā)育[21];FGF9 能夠促進(jìn)毛囊損傷后的再生[22];WNT2參與毛囊的啟動(dòng)[23];ROCK在調(diào)節(jié)人角質(zhì)細(xì)胞的增殖和終末分化[24-25],這些基因均可能是調(diào)控羊絨周期生長(zhǎng)的關(guān)鍵基因。白絨因具有極大的可染性被視為最珍貴的羊絨,因此,白色被毛顏色基因MC1R和調(diào)節(jié)毛發(fā)長(zhǎng)度的基因FGF5[26]與絨山羊的選擇目的(白色和長(zhǎng)纖維)一致。Zhang 等[27]實(shí)驗(yàn)表明,PRDM6基因可能與羊絨性狀有關(guān),但因基因組測(cè)序的樣本量過(guò)小,該基因未得到明確的功能注釋。此外,66K SNP 捕獲芯片雖在內(nèi)蒙古絨山羊(二狼山型)群體中篩選出AKT1、ALX4、HK1和NT-34 個(gè)絨毛細(xì)度性狀的候選基因[28]。但目前商業(yè)化山羊SNP 芯片均是基于少數(shù)幾個(gè)品種全基因組測(cè)序數(shù)據(jù)設(shè)計(jì)而成,并不適配所有山羊品種。因此,全基因組測(cè)序研究的不斷深入有利于商業(yè)化SNP 芯片的設(shè)計(jì),從而提高山羊性狀全基因組關(guān)聯(lián)分析結(jié)果的準(zhǔn)確性。
為加速高產(chǎn)絨山羊品種選育進(jìn)程,吳海青等[29]在同一群體中選擇高產(chǎn)絨量(>1 000 g)和低產(chǎn)絨量(<480 g)的母羊各3 只進(jìn)行基因組重測(cè)序,選擇性消除分析高產(chǎn)組和低產(chǎn)組的全基因組數(shù)據(jù)發(fā)現(xiàn),CUL1、FBXL3、YY1和EZH2基因參與調(diào)控絨山羊次級(jí)毛囊發(fā)育的重要信號(hào)通路。
羊絨品質(zhì)直接受遺傳因素影響,不同品種的羊絨品質(zhì)差異極顯著[30]。除遺傳因素調(diào)控外,環(huán)境和營(yíng)養(yǎng)對(duì)羊絨的品質(zhì)和產(chǎn)量影響顯著[31-32]。上述研究加深了人們對(duì)羊絨性狀的了解,但并未完全解析羊絨性狀的遺傳基礎(chǔ)。因此,對(duì)受外界因素影響的絨山羊次級(jí)毛囊進(jìn)行轉(zhuǎn)錄組分析可能是強(qiáng)有力的手段[33-34]。蛋白質(zhì)是生物體內(nèi)生理功能的執(zhí)行者,毛囊以及皮膚中微環(huán)境對(duì)絨毛的生長(zhǎng)發(fā)育、凋亡至關(guān)重要。利用蛋白組學(xué)了解毛囊生長(zhǎng)周期相關(guān)的功能蛋白對(duì)絨毛的性狀、產(chǎn)量和質(zhì)量的調(diào)節(jié)也具有十分重要的意義[35]。
2.3 繁殖性狀 繁殖特征是山羊產(chǎn)業(yè)重要的經(jīng)濟(jì)指標(biāo)。山羊的繁殖性狀是多基因和多因素共同調(diào)控的數(shù)量性狀,遺傳力較低,采用傳統(tǒng)的育種技術(shù)很難對(duì)其改良。目前我國(guó)只有濟(jì)寧青山羊、大足黑山羊、川中黑山羊等少數(shù)幾個(gè)高繁殖力山羊品種,探明山羊繁殖性狀的遺傳機(jī)理對(duì)山羊的分子育種具有理論指導(dǎo)意義。
近年來(lái)雖然已發(fā)現(xiàn)較多與繁殖相關(guān)的候選基因,但山羊的繁殖力研究未取得突破性進(jìn)展。其原因可能是山羊繁殖性狀涉及多個(gè)基因、位點(diǎn)的相互作用[36]。因此,利用全基因組測(cè)序技術(shù)分析多基因與多位點(diǎn)對(duì)繁殖性狀的調(diào)控作用尤為必要。Lai 等[37]分別對(duì)嶗山奶山羊高、低繁殖力的2 個(gè)極端種群進(jìn)行基因組重測(cè)序,分別鑒定12 458 711 和12 423 128 個(gè)SNP,CCNB2、AR、ADCY1、DNMT3B、SMAD2、AMHR2、ERBB2、FGFR1、MAP3K12和THEM4在高繁殖力組中被特異性選擇,KDM6A、TENM1、SWI5和CYM在低繁殖力組中被特異性選擇。Lai 等[37]還認(rèn)為基因外顯子區(qū)域SNP 可能對(duì)山羊產(chǎn)羔數(shù)至關(guān)重要,統(tǒng)計(jì)分析非同義突變的同源SNP 發(fā)現(xiàn)高繁殖力組中僅鑒定出SETDB2基因c.C1540T 非同義突變,且該突變可能由人工選擇壓力導(dǎo)致;2 組共有候選基因的多個(gè)非同義SNP 在群體間具有較強(qiáng)的遺傳分化,如低繁殖力組CD3D基因中c.A65G,高繁殖力組CDH26基因中c.A1063G、c.G1035A、c.T1034C,以及EML1基因c.G560A 突變,均可能在奶山羊繁殖力調(diào)控中發(fā)揮重要作用。也有研究表明,基因表達(dá)調(diào)控的轉(zhuǎn)錄起始位點(diǎn)(TSSs)周圍SNP 分布和基因組拷貝數(shù)變異(CNVs)也可能影響嶗山奶山羊產(chǎn)羔數(shù)[38-39]。
以大足黑山羊?yàn)閷?shí)驗(yàn)動(dòng)物,在第3 胎產(chǎn)羔數(shù)的基礎(chǔ)上,分別構(gòu)建高產(chǎn)山羊群體(產(chǎn)羔3~5 只)和低產(chǎn)山羊群體(產(chǎn)羔1~2 只)基因組混池,通過(guò)混池重測(cè)序掃描山羊重要基因組區(qū)域及與產(chǎn)羔數(shù)相關(guān)的候選基因,共鑒定96 個(gè)候選基因,包括NR6A1、STK3、IGF2BP2、AR、HMGA2、NPTX1、ANKRD17、DPYD、CLRB、PPP3CA、PLCB1、STK3和HMGA2,通過(guò)信號(hào)通路的功能分類與注釋對(duì)候選基因進(jìn)行分析發(fā)現(xiàn),一些新的候選基因富集在生殖相關(guān)的通路中,如雌激素信號(hào)通路和卵母細(xì)胞減數(shù)分裂[40]。Wang 等[41]對(duì)濟(jì)寧青山羊群體按第1 胎產(chǎn)羔數(shù)1、2、3 只分成3 組進(jìn)行全基因組掃描,具有最高選擇特征的候選基因雙羔組為KIT、KCNH7、KMT2E,3 羔組為PAK1、PRKAA1、SMAD9,同時(shí),在細(xì)胞程序性死亡參與細(xì)胞發(fā)育的功能條目和胰島素受體調(diào)控的通路中,42 個(gè)候選基因的表達(dá)最為豐富,其中還包括類固醇代謝過(guò)程的生殖相關(guān)通路和激素刺激的細(xì)胞反應(yīng)。這些候選基因涉及到山羊產(chǎn)羔數(shù)的調(diào)節(jié),多個(gè)基因富集在雌激素信號(hào)通路和類固醇代謝過(guò)程的生殖相關(guān)通路中,暗示激素參與調(diào)節(jié)山羊產(chǎn)羔數(shù)的重要性。這些候選基因的發(fā)現(xiàn)拓展了人們對(duì)繁殖力遺傳基礎(chǔ)的認(rèn)識(shí),為繁殖性狀的研究提供重要線索。
山羊的季節(jié)性繁殖雖沒(méi)有綿羊明顯,但發(fā)情配種也多集中在秋季。光照信息通過(guò)視覺(jué)接收后經(jīng)視交叉上核傳入松果體,調(diào)節(jié)松果體褪黑素的分泌[42-44]。褪黑素調(diào)控下丘腦-垂體-性腺軸調(diào)節(jié)促卵泡素(FSH)和促黃體素(LH)等激素的釋放,從而影響配子的發(fā)生與性腺生殖激素分泌[45-46]。因此,季節(jié)性光照是決定山羊季節(jié)性繁殖活動(dòng)的重要因素。管代祿[47]對(duì)年光照時(shí)間差異極顯著的大足黑山羊(1 279 h)與內(nèi)蒙古絨山羊(3 000~3 400 h)進(jìn)行全基因組測(cè)序,篩選到光感受活性和藍(lán)光感受活性的關(guān)鍵基因BIRC6可能是調(diào)控山羊季節(jié)性繁殖的關(guān)鍵基因。下丘腦是調(diào)控動(dòng)物季節(jié)性繁殖的關(guān)鍵部位,不同光照時(shí)長(zhǎng)條件下的山羊下丘腦轉(zhuǎn)錄組中差異表達(dá)基因TACR1、TACR2、TACR3在山羊季節(jié)性繁殖活動(dòng)中可能發(fā)揮重要作用[48]。
Guo 等[49]利用比較種群基因組學(xué)在多胎美姑黑山羊群體中發(fā)現(xiàn)的基因KHDRBS2;Berihulay 等[50]在埃塞俄比亞本地山羊群體基因組數(shù)據(jù)掃描到強(qiáng)選擇信號(hào)基因CAMK2D、KANK4 NIN、RSPH6A和UGT2A2;努比亞山羊、隆林山羊和努隆雜交山羊F1代家系的表型差異基因ADAM2、ADAM18、AZIN2和RAN[51],均在山羊的繁殖過(guò)程中發(fā)揮重要作用。SRD5A2、MSMB、STAR和3BHSD等基因以及多個(gè)miRNA 在卵巢中的高表達(dá)與金堂黑山羊的多羔性狀相關(guān)[52-53]。
綜上,山羊高繁性狀調(diào)控基因的高通量測(cè)序挖掘雖取得較大進(jìn)展,但并未找其主效基因。筆者認(rèn)為其原因是山羊的繁殖性狀由多個(gè)主效基因共同調(diào)控,各主效基因間可能存在平行或者互作關(guān)系。因此,山羊繁殖性狀的候選基因調(diào)控網(wǎng)絡(luò)的構(gòu)建,仍有待基因組測(cè)序工作的深入挖掘。
2.4 產(chǎn)肉性狀與產(chǎn)奶性狀 隨著人們生活水平的提高,纖維細(xì)嫩、營(yíng)養(yǎng)豐富、風(fēng)味獨(dú)特的羊肉逐漸受到人們的喜愛(ài)。山羊的產(chǎn)肉性狀是重要的經(jīng)濟(jì)性狀。Zhang 等[27]對(duì)不同用途的品種山羊(雷州山羊、薩能奶山羊和遼寧絨山羊)進(jìn)行全基因組測(cè)序,發(fā)現(xiàn)在肉用山羊群體中強(qiáng)選擇信號(hào)基因(HMGXB3、SLC26A2、HITA1、SLC35A3、LPR4等)。除部分基因參與山羊的體型大小和骨骼發(fā)育[54],剩余基因具體功能還需進(jìn)一步探明,可能與參考山羊基因組功能和結(jié)構(gòu)并未完全注釋有關(guān),但這些基因也為肉用山羊的經(jīng)濟(jì)性狀研究提供了新思路。TGF4、ACACA、LPL基因是努比亞山羊的產(chǎn)肉性狀的關(guān)鍵調(diào)控基因[51]。之前研究表明,TGF4基因與西門(mén)塔爾牛的屠宰率和凈肉率性狀顯著相關(guān)[55],ACACA是反芻動(dòng)物肌肉沉積的主要因素,其表達(dá)水平與總脂肪酸和反式脂肪酸呈正相關(guān)[56],LPL基因編碼甘油三酯水解為游離脂肪酸的關(guān)鍵酶。TGF4、ACACA和LPL基因可能分別在努比亞山羊的產(chǎn)肉率、肉品質(zhì)和風(fēng)味方面發(fā)揮重要作用。
奶是人類膳食中一種重要的蛋白來(lái)源,其含有豐富的營(yíng)養(yǎng)成分與生物活性物質(zhì),對(duì)新生哺乳動(dòng)物的健康成長(zhǎng)至關(guān)重要。乳脂、乳蛋白是衡量產(chǎn)奶性狀的重要指標(biāo)?,敼蚚57]初步鑒定5 個(gè)調(diào)控山羊產(chǎn)奶性狀的候選基因,后續(xù)利用這些基因的保守SNP 位點(diǎn)擴(kuò)群驗(yàn)證,與產(chǎn)奶量關(guān)聯(lián)分析的結(jié)果提示EIF4G1、VPS13C均可能是調(diào)控山羊產(chǎn)奶性狀的關(guān)鍵基因,且EIF4G1基因中g(shù).9003G>A 位點(diǎn)有望作為奶山羊高產(chǎn)量的分子遺傳標(biāo)記。也有研究發(fā)現(xiàn),RPL3、VPS13C等基因?qū)λ_能奶山羊的泌乳至關(guān)重要[27]。
迄今為止,肉用山羊與奶山羊群體的全基因組測(cè)序研究較少,需進(jìn)一步深入。蛋白組學(xué)、轉(zhuǎn)錄組學(xué)分析技術(shù)的應(yīng)用,也有利于山羊產(chǎn)肉、產(chǎn)奶性狀功能基因的挖掘與定位[58-61]。
目前,基因組測(cè)序工作雖可深層次揭示山羊基因組蘊(yùn)藏的遺傳信息,加深人們對(duì)山羊基因組和功能關(guān)系的認(rèn)識(shí),但部分工作仍有待推進(jìn):①山羊參考基因組需繼續(xù)完善;②消除假陽(yáng)性信號(hào)、精確鑒定山羊性狀調(diào)控基因的大樣本深度測(cè)序工作有待進(jìn)行;③基于基因組測(cè)序已公布的SNP 位點(diǎn)和候選基因等遺傳標(biāo)記應(yīng)用于山羊奶、肉品質(zhì)的改良等品種培育工作,還需不斷實(shí)踐驗(yàn)證;④為闡明山羊性狀的復(fù)雜遺傳機(jī)制,以全基因組測(cè)序?yàn)榛A(chǔ),多組學(xué)協(xié)同構(gòu)建和完善“突變-基因-表達(dá)-蛋白”生物過(guò)程的工作有待開(kāi)展。多組學(xué)時(shí)代下的生命科學(xué)研究,全基因組測(cè)序不僅是探究生物表型變異的技術(shù)手段,更是多組學(xué)協(xié)同闡釋遺傳變異機(jī)理工作的基石。可考慮大規(guī)模深入開(kāi)展全基因組測(cè)序研究,從而發(fā)揮其基石作用,加速山羊分子育種進(jìn)程。