陳孟娟,李 鑫,袁冬冬,孫帥杰,于光晴,戶 國,欒培賢,王萬良,扎西拉姆,周建設(shè)
(1.西藏自治區(qū)農(nóng)牧科學(xué)院水產(chǎn)科學(xué)研究所,拉薩 850000;2.河南農(nóng)業(yè)大學(xué)動(dòng)物科技學(xué)院,鄭州 450046;3.中國水產(chǎn)科學(xué)研究院黑龍江水產(chǎn)研究所,哈爾濱 150070)
亞東鮭(Salmotruttafario)又名褐鱒、棕鱒,屬鮭形目鮭科魚類,原產(chǎn)于歐洲、非洲北部和西亞一些地區(qū),在19世紀(jì)初由英國引進(jìn),國內(nèi)僅在西藏自治區(qū)亞東縣內(nèi)有分布,為西藏自治區(qū)特有的冷水經(jīng)濟(jì)魚類[1,2]。該魚周身有紅色和灰色不規(guī)則圓點(diǎn),魚體肥滿,肉質(zhì)鮮美,其肌肉高度不飽和脂肪酸含量高并且具有豐富且平衡的氨基酸,營養(yǎng)價(jià)值較高[3],具有很大的商業(yè)價(jià)值。當(dāng)?shù)卣e極發(fā)展亞東鮭養(yǎng)殖業(yè),現(xiàn)已成為亞東縣重點(diǎn)發(fā)展的四大特色優(yōu)勢產(chǎn)業(yè)之一。但在亞東鮭產(chǎn)業(yè)化發(fā)展的過程也存在許多問題,如孵化率低、發(fā)病率高、體表色澤暗等,嚴(yán)重影響了養(yǎng)殖戶的養(yǎng)殖成本和銷售,亞東鮭由于引進(jìn)時(shí)間較長[4],經(jīng)過多代人工繁殖,缺乏人工選育,導(dǎo)致種質(zhì)生長速度緩慢、個(gè)體小型化等現(xiàn)象時(shí)有發(fā)生。亞東鮭的良種化問題已成為制約其產(chǎn)業(yè)化發(fā)展的瓶頸。因此,無論亞東鮭作為商品化生產(chǎn)還是野外種質(zhì)資源的養(yǎng)護(hù)需求,以其親本遺傳管理和建立選配策略解決亞東鮭良種化問題已成為當(dāng)務(wù)之急。然而,因近親繁殖導(dǎo)致的資源衰退,僅靠單純數(shù)量意義上的增殖放流在經(jīng)濟(jì)、環(huán)境和增殖放流效果等方面不可持續(xù),也不利于野生群體的種質(zhì)資源多樣性建立[5]。亞東鮭在無系譜背景的情況下,由于多代的人工繁殖缺乏實(shí)質(zhì)性選育,如何避免近親繁殖又成為一個(gè)難點(diǎn)。
分子標(biāo)記共祖分析是通過高通量測序獲得的SNP分子標(biāo)記來替代傳統(tǒng)系譜信息,結(jié)合多種統(tǒng)計(jì)學(xué)方法解析、分析群體遺傳特征,計(jì)算如基因組共祖系數(shù)(genomic coancestry coefficient,CC)、血緣同源(identity by descent,IBD)、基因組近交系數(shù)(genomic inbreeding coefficient)、多維標(biāo)度分析(multidimensional scaling,MDS)及群體遺傳結(jié)構(gòu)等估計(jì)值[6-8]。在沒有系譜資料的育種群體中,通過分子標(biāo)記共祖分析,獲得個(gè)體間的親緣關(guān)系信息,實(shí)現(xiàn)高效精準(zhǔn)估算近交系數(shù)和群體近交率,進(jìn)而從不同的角度揭示群體的近交關(guān)系,在水產(chǎn)動(dòng)物育種中建立以維持物種多樣性水平為保種目標(biāo)的親本選配策略。
本研究通過分子標(biāo)記共祖分析,在無系譜信息的亞東鮭育種群體中,基于SNP分子標(biāo)記替代系譜信息構(gòu)建實(shí)現(xiàn)分子親緣關(guān)系矩陣,精準(zhǔn)估算個(gè)體間親緣關(guān)系和群體近交率,以維持物種遺傳多樣性為目標(biāo),對亞東鮭育種群體遺傳背景進(jìn)行分析,為亞東鮭的家系選育及遺傳多樣性的管理提供新的技術(shù)方案。
實(shí)驗(yàn)所用245尾亞東鮭均來自雅魯藏布江漁業(yè)資源繁育基地,年齡為3~5齡,平均體長為(30.14±4.69)cm,平均體質(zhì)量為(533.19±331.28)g。采樣個(gè)體之間沒有系譜記錄。使用MS-222將采樣個(gè)體進(jìn)行麻醉后,采用PIT魚類芯片標(biāo)記的方法,將動(dòng)物芯片打入背部肌肉進(jìn)行標(biāo)記,并剪取脂鰭放入90%的乙醇保存?zhèn)溆谩?/p>
1.2.1 樣品DNA提取
利用無錫百泰克生物技術(shù)有限公司生產(chǎn)的海洋動(dòng)物基因組DNA提取試劑盒提取亞東鮭脂鰭基因組DNA,通過瓊脂糖檢測和NanoDrop2000紫外分光光度計(jì)(Thermo fisher Scientific)對抽提的DNA質(zhì)量和濃度進(jìn)行檢測。DNA產(chǎn)物置于-20 ℃保存?zhèn)溆谩?/p>
1.2.2 文庫構(gòu)建和測序質(zhì)量分析
按照 double digest restriction site-associated DNA sequencing(dd-RAD)的方式構(gòu)建文庫,參考基因組大小為2 371.88 Mb,選用的限制性內(nèi)切酶為EcoRⅠ和BfaⅠ,插入片段在220~450 bp之間。利用第二代測序技術(shù)(Next-Generation Sequencing,NGS),基于Illumina NovaSeq測序平臺(tái),對文庫進(jìn)行雙末端(Paired-end,PE)測序。得到的原始圖像數(shù)據(jù)文件經(jīng)堿基識(shí)別轉(zhuǎn)化成原始測序序列,將拼接好的測序序列進(jìn)行過濾以保證數(shù)據(jù)分析結(jié)果準(zhǔn)確性。首先采用AdapterRemoval(version 2)[9]去除3′端的接頭污染;隨后進(jìn)行質(zhì)量過濾和長度過濾,過濾去除雙末端長度≤50 bp的reads,由此獲得可用于后續(xù)標(biāo)記篩查、分型的高質(zhì)量序列即SLAF標(biāo)簽。
1.2.3 全基因組序列比對和SNP標(biāo)記檢測
采用BWAmem[10]程序?qū)⑦^濾后得到的高質(zhì)量數(shù)據(jù)比對到參考基因組上,均使用默認(rèn)參數(shù)。采用GATK[11]軟件進(jìn)行SNP的檢測,進(jìn)一步對獲得的SNP位點(diǎn)進(jìn)行過濾,以獲得高質(zhì)量的SNPs用于遺傳多樣性分析。將獲得的SNP結(jié)果進(jìn)行統(tǒng)計(jì),采用ANNOVAR[12]軟件對SNP位點(diǎn)進(jìn)行注釋。
1.2.4 群體遺傳結(jié)構(gòu)分析
利用全基因組SNP標(biāo)記對245個(gè)個(gè)體的遺傳結(jié)構(gòu)進(jìn)行分析,設(shè)置K值為1-20個(gè),迭代10 000次,通過ADMIXTURE[13]的5倍交叉驗(yàn)證來選擇適宜的K值。使用PLINK軟件進(jìn)行多維標(biāo)度(MDS)分析,以獲得個(gè)體間的基因組關(guān)系。
1.2.5 群體遺傳多樣性分析
使用R軟件包(DiveRsity)[14]估計(jì)群體內(nèi)平均觀測雜合度(Ho)和平均期望雜合度(He)。所有 SNPs的Ho和He值在群體內(nèi)逐一計(jì)算,然后將平均值作為群體的Ho和He值。使用VCFtools[15]以10 Mb滑窗為單位,步長為2 Mb在整個(gè)基因組測量核苷酸多樣性(Pi)。每個(gè)群體的平均Pi是由所有滑窗的Pi值的平均值計(jì)算出來的,使用R軟件[16]對6個(gè)組別的均值進(jìn)行多重比較,并進(jìn)行Scheffe檢驗(yàn)。
1.2.6 群體近交水平和親緣關(guān)系
通過基因組共祖系數(shù)(CC)和血緣同源率(IBD)兩個(gè)參數(shù)來衡量個(gè)體間的基因組親緣關(guān)系?;蚪M共祖系數(shù)的估算是基于每個(gè)SNP自身效應(yīng)的跨SNP標(biāo)準(zhǔn)化的混合模型獲得的,并被計(jì)算為基因組成對加性關(guān)系的半值(基因組加性關(guān)系矩陣的非對角線元素),并由GVCBLUP軟件[17]中的GCORRMX程序而得出,通過PLINK軟件個(gè)體加性關(guān)系矩陣對角線元素計(jì)算個(gè)體近交系數(shù)(f)[18]。
1.2.7 群體遺傳分化和基因流分析
通過VCFtools對全基因組以10 Mb滑窗為單位,長為2 Mb進(jìn)行SNP掃描,估算群體間個(gè)體遺傳分化指數(shù)(FST)[19],個(gè)體FST的顯著性檢驗(yàn)使用置換檢驗(yàn)(10 000個(gè)置換)。通過高斯近似法從全基因組等位基因頻率數(shù)據(jù)中發(fā)現(xiàn)遺傳漂變,然后使用Treemix軟件推斷6個(gè)群體的歷史分裂和混合的基因流。
對245個(gè)個(gè)體通過NGS測序,平均每個(gè)樣本獲得17.01 M clean reads,平均GC含量為42.28%,平均Q20百分比為97.84%,平均Q30堿基百分比率93.55%。平均測序深度為14.56,共獲得1 092 509個(gè)SNP標(biāo)記,經(jīng)過篩選后獲得17 058個(gè)SNP數(shù)據(jù)集,可用于后續(xù)的群體遺傳分析。
群體結(jié)構(gòu)是群體遺傳分析的重要內(nèi)容。本研究對245個(gè)個(gè)體進(jìn)行Admixture檢測分析,首先假設(shè)測試群體來源于1~20個(gè)祖先(K=1~20),交叉驗(yàn)證結(jié)果表明在K=11時(shí)錯(cuò)誤率最低,其次為K=10。當(dāng)K=10和11時(shí),遺傳聚類分析結(jié)果顯示245個(gè)個(gè)體可明顯地聚為6個(gè)群體(圖1),其中StfA1、StfC2和StfC3群體中的遺傳組成較為復(fù)雜,多數(shù)個(gè)體來源于不同祖先;StfB1、StfC1和StfC4群體遺傳結(jié)構(gòu)較為簡單,多數(shù)個(gè)體具有單一的祖先來源(圖1)。
圖1 當(dāng)K=10和11時(shí),245個(gè)個(gè)體的遺傳結(jié)構(gòu)Fig.1 Genetic structure of 245 individuals when K=10 and 11
245個(gè)個(gè)體的多維標(biāo)度(MDS)視圖結(jié)果如圖2a和圖2b所示,遺傳距離接近的群體會(huì)聚集在一起,從圖中可以得到StfA1群體、StfB1群體各單獨(dú)聚為一簇,并且與其它群體之間的遺傳距離相距較遠(yuǎn);StfC1、StfC2、StfC3、StfC4四個(gè)群體遺傳距離較近,并且在二維圖中4個(gè)群體間的個(gè)體有重疊部分(圖2b)。
圖2 245個(gè)個(gè)體的相互遺傳距離多維標(biāo)度分析(a,b)Fig.2 Multidimensional scaling analysis of mutual genetic distance of 245 individuals(a,b)
分別統(tǒng)計(jì)了6個(gè)群體的Ho、He和Pi,結(jié)果顯示(表1),6個(gè)群體的Ho范圍為0.283~0.295,其中StfC3群體中遺傳多樣性最高,StfA1群體中遺傳多樣性最低。He范圍為0.238~0.274,其中StfC2和StfC3群體遺傳多樣性相對更高,StfC1群體遺傳多樣性最低。Pi范圍為1.658×10-6~1.884×10-6,He的趨勢與Pi相似。
表1 6個(gè)群體的遺傳多樣性分析Tab.1 Genetic diversity among six sampling populations
根據(jù)全基因組SNP數(shù)據(jù)估計(jì)的6個(gè)群體平均基因組近交系數(shù)如表2所示,StfA1群體基因組近交系數(shù)最高,平均基因組近交系數(shù)為0.046;StfC3群體基因組近交系數(shù)最低,平均基因組近交系數(shù)為0.007。StfC3群體的平均基因組近交系數(shù)顯著小于StfA1群體,與其他4個(gè)群體比較差異不顯著。
245個(gè)體中,基因組近交系數(shù)大于0.062 5的個(gè)體比例占所有檢測個(gè)體的19.6%(48/245),其中StfA1群體為36.3%(37/102),StfC2群體為5.9%(3/51),StfC3群體為4.3%(2/47),StfC4群體為50%(6/12);基因組近交系數(shù)大于0.125的個(gè)體有14個(gè),其中StfA1群體中12個(gè),StfC3和StfC4群體中各有1個(gè);基因組近交系數(shù)大于0.25的個(gè)體1個(gè),在StfA1群體中(圖3)。
圖3 245個(gè)個(gè)體的基因組近交系數(shù)Fig.3 Genomic inbreeding coefficients of the 245 individuals
群體內(nèi)和群體間個(gè)體對親緣關(guān)系可以通過CC和IBD來確定,并且可以通過兩者的一致性來進(jìn)行驗(yàn)證。六個(gè)群體內(nèi)基因組平均成對親緣關(guān)系見表2。StfC1群體中個(gè)體對的基因組親緣關(guān)系最高(CC=0.169 5±0.043 7,IBD=0.346 4±0.086 7),StfC2和StfC3群體內(nèi)個(gè)體對的基因組親緣關(guān)系相對較遠(yuǎn)。群體內(nèi)CC和IBD熱圖如圖4所示,6個(gè)群體內(nèi)共有115對個(gè)體為全同胞近交類型(CC≥0.25),近交程度屬嫡親,其中StfA1、StfB1、StfC1、StfC2、StfC3和StfC4群體內(nèi)的個(gè)體對分別為55、1、12、22、12和13;958對個(gè)體為半同胞、祖孫或叔侄近交類型(0.125≤CC<0.25),近交程度屬嫡親,其中StfA1、StfB1、StfC1、StfC2、StfC3和StfC4群體內(nèi)的個(gè)體對分別為487、36、142、176、85和32;3 653對個(gè)體為堂兄妹、半叔侄或曾祖孫近交類型(0.062 5≤CC<0.125),近交程度屬近親,其中StfA1、StfB1、StfC1、StfC2、StfC3和StfC4群體內(nèi)的個(gè)體對分別為3 052、54、17、172、337和21。
圖4 245個(gè)個(gè)體間的基因組配對關(guān)系的概圖Fig.4 The overview diagram of genomic pairwise relatedness between the 245 sequenced individualsa為基因組共祖系數(shù)(CC),b為血緣同源率(IBD)。
6個(gè)群體間個(gè)體親緣關(guān)系如表3所示,無全同胞近交類型;半同胞、曾孫或叔侄近交類型的個(gè)體對為101對,其中StfC2和StfC3群體間28對,StfC3和StfC4群體間73對;堂兄妹、半叔侄或曾祖孫近交類型的個(gè)體對為584對,其中StfC1和StfC2群體間123對,StfC1和StfC3群體間45對,StfC2和StfC3群體間159對,StfC2和StfC4群體間3對,StfC3和StfC4群體間254對。不同群體間個(gè)體對基因組共祖系數(shù)有的無限接近零或?yàn)樨?fù)數(shù),血緣同源率分析結(jié)果除了無負(fù)數(shù)值出現(xiàn)外,與基因組共祖系數(shù)分析結(jié)果基本一致(圖4b,表3)。
6個(gè)群體間FST值在0.015~0.164之間(表4),其中StfA1群體與StfC1、StfC4群體之間的遺傳分化指數(shù)較大,分別為0.164、0.160。BALLOUX等[20]以0.05、0.15和0.25為臨界值將群體遺傳分化劃分為很小、中等、較大和很大4個(gè)等級(jí)。根據(jù)此劃分依據(jù),StfC3群體與StfC2、StfC4群體之間遺傳分化程度很小(0≤FST≤0.05);StfA1群體與StfC1、StfC4群體之間表現(xiàn)出較大的分化水平(0.15≤FST≤0.25);其它種群之間表現(xiàn)為中等分化水平。
表4 群體間的成對FSTTab.4 Pairwise FST between populations
基因流結(jié)果顯示,群體從StfC2群體分裂為兩個(gè)分支,一個(gè)繼續(xù)分裂為StfC1和StfC3群體,另一個(gè)繼續(xù)分裂為兩個(gè)子分支,一個(gè)分裂為StfC4群體,一個(gè)繼續(xù)分裂為StfA1和StfB1群體。其中StfC3群體和StfC4群體基因交流最大,流向?yàn)镾tfC4群體到StfC3群體,其余各種群間也存在相當(dāng)程度的基因交流(圖5)。
圖5 基因流分析和傳播史推斷Fig.5 Gene flow analysis and spread history inferring for the six populations黑線表示種群擴(kuò)散的模式,帶箭頭的線表示推斷的遷移方向。
群體遺傳結(jié)構(gòu)[21]指遺傳變異在物種或群體中的一種非隨機(jī)分布,按照地理分布或其他標(biāo)準(zhǔn)可將一個(gè)群體分為若干亞群,處于同一亞群內(nèi)的不同個(gè)體親緣關(guān)系較高,而亞群與亞群之間則親緣關(guān)系稍遠(yuǎn)。亞東鮭最早是由英國引進(jìn)養(yǎng)殖的[4],現(xiàn)已形成穩(wěn)定的地方種群,并被農(nóng)業(yè)農(nóng)村部等八部門認(rèn)定為第三批中國特色農(nóng)產(chǎn)品。然而,由于引進(jìn)時(shí)間長,未進(jìn)行有效的人工選育,近親繁殖導(dǎo)致的種質(zhì)退化現(xiàn)象逐漸顯現(xiàn),戶國等[22]對野生亞東鮭和褐鱒(Salmotrutta)日本品系群體進(jìn)行個(gè)體親緣關(guān)系聚類分析,結(jié)果顯示野生型亞東鮭遺傳結(jié)構(gòu)較為簡單,推測野生亞東鮭群體可能正經(jīng)歷遺傳衰退的情況。亞東鮭群體系譜信息的缺失,使得人工選育工作不可避免地繼續(xù)產(chǎn)生不同程度的近親繁殖后代,使得選育周期延長。本研究基于分子標(biāo)記共祖分析技術(shù)替代亞東鮭群體系譜信息,對雅魯藏布江漁業(yè)資源繁育基地養(yǎng)殖的亞東鮭繁殖群體進(jìn)行了遺傳結(jié)構(gòu)分析,結(jié)果顯示,245尾亞東鮭明顯地分為6個(gè)群體,從PCA主成分分析來看(圖2a,圖2b),6個(gè)群體中StfC1、StfC2、StfC3和StfC4群體間個(gè)體有摻雜的情況,說明這4個(gè)群體間遺傳距離較近,在實(shí)際的育種應(yīng)用中,避免這4個(gè)群體內(nèi)個(gè)體間的選配,以防止近親繁殖帶來的種質(zhì)退化。StfA1和StfB1兩個(gè)群體在PCA主成分分析中分別單獨(dú)聚為一簇,并與其他4個(gè)群體相聚較遠(yuǎn),推斷這2個(gè)群體個(gè)體間及與其他4個(gè)群體個(gè)體間遺傳距離較遠(yuǎn),在實(shí)際的亞東鮭育種應(yīng)用中可以形成強(qiáng)雜種優(yōu)勢,為后代種質(zhì)的提純復(fù)壯提供育種基礎(chǔ)。
遺傳多樣性是優(yōu)良性狀選育的物質(zhì)基礎(chǔ)[23],表現(xiàn)在性狀、控制性狀位點(diǎn)的基因型在個(gè)體、群體或種的差異等方面,也是評(píng)價(jià)優(yōu)良品種或品系的標(biāo)準(zhǔn)之一。本實(shí)驗(yàn)采用Ho、He和Pi遺傳參數(shù),從多個(gè)角度來估測亞東鮭繁殖群體的遺傳多樣性,Ho和He是衡量種群遺傳變異程度的重要參數(shù),與種群遺傳多樣性呈正相關(guān)[23]。實(shí)驗(yàn)結(jié)果顯示6個(gè)群體的Ho范圍為0.283±0.189~0.295±0.196,He范圍為0.238±0.190~0.274±0.164,核苷酸多樣性(Pi)范圍為1.658×10-6~1.884×10-6,可以看出6個(gè)種群的平均觀測雜合度均高于平均期望雜合度,群體的雜合度能夠較準(zhǔn)確反映群體遺傳多樣性,觀測雜合度高一般情況下表明群體遺傳多樣性較豐富,王芳等[24]統(tǒng)計(jì)了日本品系褐鱒和亞東鮭He值分別為0.651 7和0.717 1,豪富華[25]發(fā)現(xiàn)亞東鮭野生群體的平均觀測雜合度是0.708 3,而本研究中亞東鮭繁殖群體6個(gè)抽樣群體的平均觀測雜合度范圍為0.283~0.295,均顯著低于之前的研究結(jié)果,揭示了雅魯藏布江魚類資源繁育基地亞東鮭繁殖群體遺傳多樣性在下降,這與目前亞東鮭表現(xiàn)出來的生長速度慢、抗病能力低、體表色澤暗淡等均與種質(zhì)退化相關(guān),進(jìn)一步說明目前該基地養(yǎng)殖的亞東鮭存在較嚴(yán)重的近親繁殖現(xiàn)象。此外,6個(gè)群體的亞東鮭在絕大多數(shù)位點(diǎn)的Ho值都大于He值,提示在今后的人工選育過程中,從遺傳多樣性上適當(dāng)增加群體的豐富性,避免遺傳多樣性的降低。
近親繁殖系數(shù)一定程度上反映了群體間親緣關(guān)系遠(yuǎn)近和遺傳變異程度。近親繁殖系數(shù)越高,遺傳距離越近,近交的程度越高。雜交親本間遺傳差異越大,親緣關(guān)系越遠(yuǎn),其后代雜種優(yōu)勢越明顯[26]?;蚪M共祖系數(shù)(CC)和血緣同源率(IBD)是用來直接衡量個(gè)體間的親緣關(guān)系的,用來反映近親交配的程度。研究結(jié)果發(fā)現(xiàn)6個(gè)群體中,StfC1、StfC2、StfC3和StfC4四個(gè)群體(表3)個(gè)體間均達(dá)到了近親繁殖的程度(0.031 25 遺傳分化指數(shù)(FST)被認(rèn)為是度量群體間基因分化相對大小的一個(gè)較好的指標(biāo),F(xiàn)ST值高于0.15說明群體間存在顯著性遺傳分化[32]。本研究結(jié)果顯示,StfA1群體與StfC1、StfC4群體間的遺傳分化指數(shù)為0.164、0.160,遺傳分化程度顯著,說明StfA1群體與StfC1、StfC4群體間的遺傳差異較大,其他群體間遺傳分化程度都處于中等水平,說明群體間遺傳差異處于中等及以上的程度?;蛄魇怯绊懭后w間遺傳分化水平的重要因素,它能夠減少群體間的遺傳分化,使群體趨向于一致,當(dāng)群體間基因流值大于1時(shí),能夠有效地抑制群體間遺傳分化的產(chǎn)生[33]。在自然群體中,群體的分化差異程度與群體間的基因流大小緊密相關(guān),即如果不同群體間的基因流強(qiáng)度越高,則該群體間的分化差異程度則相對越小[34]。本研究中6個(gè)群體的基因流均小于0.05,表明各群體間基因交流較少,產(chǎn)生了相應(yīng)的遺傳分化,這與FST的統(tǒng)計(jì)結(jié)果相一致。3.4 亞東鮭繁殖群體遺傳分化分析