鄒 杰,彭慧婧,鄭德斌,張守都
( 1.廣西科學(xué)院,廣西 南寧 530000; 2.廣西海洋研究所有限責(zé)任公司,廣西 北海 536000; 3.天津渤海水產(chǎn)研究所,天津 300457; 4.山東省海洋科學(xué)研究院,山東 青島 266000 )
合浦珠母貝(Pinctadafucatassp.martensii),又稱馬氏珠母貝,是我國培育海水珍珠的主要貝類。廣西為合浦珠母貝主產(chǎn)地和南珠發(fā)源地,近年來,養(yǎng)殖環(huán)境日漸劣化、養(yǎng)殖群體生長性狀衰退、繁育個體趨小型化等因素,均限制了南珠產(chǎn)業(yè)的健康可持續(xù)發(fā)展。由于重新選育合浦珠母貝優(yōu)良品種所需成本高、時間長,為適應(yīng)新的養(yǎng)殖形勢和環(huán)境變化,需要快速改良廣西合浦珠母貝的種質(zhì)資源,雜交育種是能夠短時間內(nèi)提升種質(zhì)資源的方式之一。有關(guān)不同地理群體合浦珠母貝雜交研究較多[1-2],其具有一定的雜種優(yōu)勢[3],但關(guān)于廣西合浦珠母貝地理群體內(nèi)雜交的研究較少。要加快廣西合浦珠母貝群體雜交育種應(yīng)用,首先要了解廣西合浦珠母貝主要群體的遺傳背景。目前廣西合浦珠母貝地理群體內(nèi)經(jīng)人工繁育或選育分化成3個主要群體:選育群體“海選1號”、養(yǎng)殖群體和野生繁育群體。選育群體是以廣西潿洲島海域野生群體選育出的優(yōu)質(zhì)新品種,已在廣東和廣西應(yīng)用多年,生長性狀具有顯著優(yōu)勢[4];養(yǎng)殖群體則是合浦傳統(tǒng)南珠養(yǎng)殖區(qū)繼代繁育養(yǎng)殖群體,存在一定的抗逆優(yōu)勢;野生群體表型分化較大,遺傳資源可能具有潛在的復(fù)雜多態(tài)性。這3個分化群體可作為廣西合浦珠母貝群體雜交親本的潛在來源群。由于長期混雜養(yǎng)殖,3個分化群體間理論上存在基因交流,在進(jìn)行雜交育種時應(yīng)首先掌握選擇親本群體的真實遺傳分化狀況,分析不同群體的近交水平遺傳分化程度,進(jìn)而提升雜交育種的預(yù)期效果。鑒于遺傳標(biāo)記多態(tài)性可有效分析合浦珠母貝的遺傳差異[5-6],筆者通過對3個群體中的適齡種貝作為樣本進(jìn)行簡化基因組測序,通過單核苷酸多態(tài)標(biāo)記解析3個樣本群間的遺傳關(guān)系,從一定程度上反映3個群體的遺傳背景,探索出不同群體間的最佳雜交組合方式,為廣西合浦珠母貝雜交育種中的親本選擇提供參考。
分別從野生群體(F1)、選育群體(“海選1號”F4)和養(yǎng)殖群體中隨機(jī)挑選15個2齡種貝,組成3個樣本群體,分別采集軟體部-80 ℃保存(3個月內(nèi)),利用1端EcoRⅠ(G^AATTC)和2端NlaⅢ(Hin1Ⅱ,CATG^)進(jìn)行雙酶切,將質(zhì)檢合格的DNA樣品500 ng采用ddRAD建庫方式構(gòu)建長度在300~500 bp的雙端測序文庫,基于Illunima HiSeq 2500高通量測序。
1.2.1 數(shù)據(jù)質(zhì)控
對片段測序得到的原始讀長進(jìn)行數(shù)據(jù)評估,得到各個樣品的原始數(shù)據(jù),通過堿基質(zhì)量值(Q)進(jìn)行質(zhì)控獲得高質(zhì)量數(shù)據(jù)。
堿基質(zhì)量值(Q)與錯誤率(Re)的關(guān)系式為:
Q=-10lgRe
1.2.2 信息分析
將序列讀長使用BWA比對到近緣[7]參考物種覆瓦珠母貝(P.imbricata)染色體上(GCA_002216045.1_PinMar1.0),根據(jù)高質(zhì)量數(shù)據(jù)在參考染色體的定位結(jié)果,未掛載上染色體的拼接序列共同作為參考基因組,使用Picard(0.7.17-r1188)的Mark Duplicate工具去除重復(fù),屏蔽PCR重復(fù)數(shù)據(jù)的影響,使用GATK進(jìn)行變異檢測,變異位點質(zhì)量值重新校正,后進(jìn)行測序深度過濾,平均測序深度為5×,最小等位基因頻率為0.05,樣品信息完整度為0.70,變異位點質(zhì)量值Q>30,過濾獲取可靠變異結(jié)果形成單核苷酸多態(tài)標(biāo)記,用于后續(xù)分析?;趩魏塑账岫鄳B(tài)標(biāo)記,對序列雙端比對基因組率超90%個體,通過軟件GCTA(1.92.1,http://cnsgenomics.com/software/gcta/#Overview)進(jìn)行主成分分析,得到樣品的主成分,運用R軟件繪制主成分分析圖,利用軟件FastTree(2.1.9)中的極大似然法構(gòu)建極大似然進(jìn)化樹;使用軟件PopLDdecay(https://github.com/BGI-shenzhen/PopLDdecay)進(jìn)行連鎖不平衡衰減分析,參數(shù)為:-OutPairLD5;在軟件vcftools(0.1.16)中,參數(shù)設(shè)為以100 kb為一個滑動窗口,10 kb為步長取一個區(qū)域,計算群體在這個區(qū)域內(nèi)的群體分化指數(shù)(Fst);在R軟件(R包:detectRUNS)中,設(shè)定每一個滑動窗口至少要有20個單核苷酸多態(tài)標(biāo)記,滑動窗口閾值使用默認(rèn)參數(shù)0.05,每一個滑動窗口中允許的相反基因型數(shù)目為1個,每一個滑動窗口中允許丟失的基因型為1個,組成長純合片段(ROH)之間的單核苷酸多態(tài)標(biāo)記的最大間隔為1 Mb,長純合片段的最小長度設(shè)為0.25 Mb,基于參考染色體統(tǒng)計長純合片段,基于每條染色體分析近交系數(shù)(FROH)。
FROH=∑LROH/Lgenome
式中,∑LROH為染色體上長純合片段的長度之和,Lgenome為染色體的物理總長度。
45個樣品共產(chǎn)生49.79 Gb高質(zhì)量數(shù)據(jù),對測序數(shù)據(jù)進(jìn)行質(zhì)控評估結(jié)果見表1,質(zhì)控平均Q30為92.17%,3群體GC含量34.59%~35.04%,低于AT含量。組裝參考基因組大小為990 984 031 bp,未掛載參考染色體的基因組大小為137 058 386 bp,樣品平均比對讀長為768 337 bp,平均覆蓋基因組大小為85 103 126 bp,平均覆蓋深度為13.84,平均基因組覆蓋深度為0.99,選育群體的平均比對、雙端比對讀長均較低。
表1 不同群體測序堿基分布和與參考基因組比對結(jié)果(均值)Tab.1 Distribution and comparison of sequencing bases with reference genome in different populations (mean)
樣品與參考基因組之間單核苷酸多態(tài)標(biāo)記檢測平均轉(zhuǎn)換數(shù)量為206 641個,平均顛換數(shù)量為184 471個(圖1a),轉(zhuǎn)換/顛換為1.12,轉(zhuǎn)換發(fā)生率高于顛換,平均雜合類型單核苷酸多態(tài)標(biāo)記數(shù)量為151 042個,野生群體雜合程度最高,平均純合單核苷酸多態(tài)標(biāo)記數(shù)量為240 070個,選育群體平均純合單核苷酸多態(tài)標(biāo)記數(shù)量高于野生群體和養(yǎng)殖群體。群體單核苷酸多態(tài)標(biāo)記過濾后,1、3、9和10號染色體單核苷酸多態(tài)標(biāo)記數(shù)量較多(圖1b),以20 kb為一個窗口,統(tǒng)計窗口內(nèi)的單核苷酸多態(tài)標(biāo)記數(shù)量,單核苷酸多態(tài)標(biāo)記在染色體上的密度分布較均勻(圖1c),染色體單核苷酸多態(tài)標(biāo)記較多與其長度相關(guān)。統(tǒng)計單群體內(nèi)的雙等位基因型群體遺傳指標(biāo)平均值,群體信息統(tǒng)計見表2,群體內(nèi)單核苷酸多態(tài)標(biāo)記統(tǒng)計數(shù)量超過58萬個,選育群體的觀測雜合度最低,平均近交系數(shù)(Fis)與養(yǎng)殖群體相近,野生群體觀測雜合度最高,近交系數(shù)(Fis)最低,野生群體相對具有較好的群體遺傳多態(tài)。
表2 群體遺傳信息統(tǒng)計Tab.2 The statistics of population genetic information
圖1 單核苷酸多態(tài)標(biāo)記統(tǒng)計Fig.1 SNP statisticsa.單核苷酸多態(tài)類型變異數(shù)量統(tǒng)計;b.染色體單核苷酸多態(tài)標(biāo)記數(shù)量統(tǒng)計;c.染色體單核苷酸多態(tài)標(biāo)記密度分布.a.SNP type variation statistics; b.statistics of chromosome SNPs; c.distribution of chromosome SNP density.
利用與參考染色體高比對(>90%)樣品的單核苷酸多態(tài)標(biāo)記進(jìn)行系統(tǒng)進(jìn)化樹(圖2)和主成分(圖3)分析,結(jié)果顯示,選育群體與養(yǎng)殖群體部分樣品親緣關(guān)系較近,預(yù)示選育群體和養(yǎng)殖群體可能有部分相同的親本來源,主成分分析基本將樣品分成3個類群,主成分1顯示野生群體分類較好,主成分2顯示選育群體和養(yǎng)殖群體存在群體交雜,分析結(jié)果與進(jìn)化樹分析一致。通過計算區(qū)域平均遺傳分化指數(shù)(Fst),野生群體-選育群體、野生群體-養(yǎng)殖群體和選育群體-養(yǎng)殖群體的遺傳分化指數(shù)均值分別為0.068、0.065和0.030,選育群體和養(yǎng)殖群體之間的遺傳分化指數(shù)最低,多態(tài)性相近,進(jìn)一步表明部分親本來源相同的可能性較大。
圖2 系統(tǒng)進(jìn)化樹Fig.2 Phylogenetic tree個體編號中,M1表示野生群體,M2表示選育群體,M3表示養(yǎng)殖群體.In the individual number, M1 represents wild population, M2 represents breeding population and M3 represents cultured population.
圖3 主成分分析Fig.3 Analysis of principal component analysis
野生群體、選育群體和養(yǎng)殖群體的平均長純合片段數(shù)分別為59.1、49.5個和56.6個,長純合片段平均長度分別為0.312、0.313Mb和0.311Mb,平均單核苷酸多態(tài)標(biāo)記含量為59、50個和73個,1號和10號染色體長純合片段平均含量較多,為6.5個,7號最少,為1.9個?;陂L純合片段分布和比例計算的近交系數(shù)(FROH)見圖4,野生群體、選育群體和養(yǎng)殖群體的近交系數(shù)(FROH)分別為0.0149~0.0240、0.0159~0.0201和0.0170~0.0246,14號染色體近交系數(shù)(FROH)最高,野生群體近交系數(shù)(FROH)略高于選育群體和養(yǎng)殖群體,3個群體近交系數(shù)(FROH)均低于0.060。整個染色體內(nèi)的連鎖不平衡衰減結(jié)果見圖5。一般把連鎖不平衡系數(shù)(r2)降低至0.1~0.2時的遺傳距離認(rèn)為是該物種的衰減距離。r2為0.2時,野生群體、選育群體和養(yǎng)殖群體的平均連鎖不平衡的距離為0.4、0.4 kb和0.2 kb;r2降為0.1時,野生群體、選育群體和養(yǎng)殖群體的平均連鎖不平衡距離增至40.5、>300.0 kb和4.0 kb。衰減速度為養(yǎng)殖群體>野生群體>選育群體,養(yǎng)殖群體具有較高的群體內(nèi)核酸多態(tài)性(表2),結(jié)果與其衰減速度最快相一致,選育群體由于連續(xù)多年人工選育,群體內(nèi)核酸多態(tài)性較低,衰減速度最慢。
圖4 不同染色體近交系數(shù)統(tǒng)計Fig.4 Statistics of FROH in different chromosomes紅色代表野生群體,綠色代表選育群體,藍(lán)色代表養(yǎng)殖群體.Wild population is shown in red color, breeding population is shown in green color and cultured population is shown in blue color.
圖5 不同群體連鎖不平衡衰減Fig.5 Linkage disequilibrium decay in different populations
為獲取有效的雜種優(yōu)勢,雜交親本應(yīng)選用不同分化亞群或具有較好遺傳資源的群體(系)或品系,并從來源群體中選擇具備一定表型優(yōu)勢的親本,野生群體作為來源時應(yīng)該純化親本[8]。合浦珠母貝養(yǎng)殖性狀中生長速度[9]和存活率均是影響產(chǎn)珠的重要選擇性狀,在難以估計存活性狀的情況下,生長相關(guān)表型性狀成為親本的首選性狀,筆者均利用人工繁選群體作為親本的來源群,保證了親本的純化和優(yōu)勢性狀親本的選擇,方便準(zhǔn)確分析適合作為雜交親本的遺傳信息。
本研究中,3個群體經(jīng)過群體多態(tài)指數(shù)比較、主成分分析交叉位點和系統(tǒng)進(jìn)化樹分析得出,選育群體和養(yǎng)殖群體群體分化程度最低。遺傳分化指數(shù)是衡量群體間的遺傳分化程度的重要指標(biāo),當(dāng)0<遺傳分化指數(shù)<0.05時,表明各群體之間分化很小,幾乎可以忽略;當(dāng)遺傳分化指數(shù)>0.05時,各群體之間才存在中度以上的遺傳分化[10]。馬氏珠母貝的不同殼色家系間遺傳分化指數(shù)為0.113~0.793[11],表明各個家系之間存在極大的分化,可能與連續(xù)多年的家系選育以及近交引起家系內(nèi)基因頻率發(fā)生較大變化有關(guān);在馬氏珠母貝近交與雜交4個家系間的平均遺傳分化指數(shù)為0.1049[12],表明4個家系間存在中度的遺傳分化,同雜交和近交的不同交配方式對基因頻率改變存在重要關(guān)系;本研究的平均遺傳分化指數(shù)相對較低,其中野生群體-選育群體和野生群體-養(yǎng)殖群體的遺傳分化指數(shù)均值分別為0.068和0.065,表明野生群體-選育群體、野生群體-養(yǎng)殖群體之間存在中等程度的分化,與選育群體的連續(xù)多年選育,以及養(yǎng)殖群體在養(yǎng)殖中被有意識作為一個獨立群體繁育有關(guān)。選育群體-養(yǎng)殖群體的遺傳分化指數(shù)均值為0.030,表明選育群體和養(yǎng)殖群體間幾乎沒有遺傳分化,表明本研究中的2個群體間的基因頻率差別不大,群體來源相同或部分個體來源相同的可能性較大,這可能與本研究選用來源群體的粗放保種以及生產(chǎn)中的不當(dāng)操作串種有較大關(guān)系。廣西合浦珠母貝產(chǎn)業(yè)受養(yǎng)殖環(huán)境的影響,導(dǎo)致傳統(tǒng)養(yǎng)殖群體萎縮,而隨著選育群體在廣西的推廣應(yīng)用力度加大,一定程度上造成傳統(tǒng)養(yǎng)殖群體與選育群體的混雜并存,且選育群體本身具有優(yōu)勢生長表型性狀[4],所以在選擇同質(zhì)種貝樣本時,樣本同源的概率較大。連鎖不平衡衰減速度能夠反映群體選擇強(qiáng)度或群體多態(tài)性[13],野生群體受人工選擇的壓力較小,養(yǎng)殖群體雖然多態(tài)性標(biāo)記數(shù)量(546 380個)最多,但與選育群體分化程度偏低。為了引入更多的優(yōu)秀基因,在沒有專門化群系條件下,進(jìn)行快速育種時可優(yōu)先考慮野生群體×選育群體或野生群體×養(yǎng)殖群體雜交組合方式。而通過全基因組關(guān)聯(lián)分析時,連鎖不平衡衰減越快,分析所需的標(biāo)記密度越大,與目標(biāo)性狀表型變異關(guān)聯(lián)的顯著性位點離功能基因位點距離會越近,進(jìn)行全基因組關(guān)聯(lián)分析時,野生群體×養(yǎng)殖群體雜交組合方式可提高基因定位精度。
水產(chǎn)動物具有較強(qiáng)的繁殖力,在短期內(nèi)經(jīng)過高強(qiáng)度的人工選擇可以實現(xiàn)性狀的快速改良,同時也意味著繁育的大部分個體父母本可能來自少數(shù)個體,育種群體的近交系數(shù)可能升高很快[14-15]。已有研究表明,貝類存在明顯的近交衰退問題[16-18]。了解群體的繁殖規(guī)律并掌握群體近交系數(shù),有助于了解父母本的親緣關(guān)系,并通過雜交的方式降低近交的影響[12]。本研究結(jié)果顯示,野生群體、選育群體和養(yǎng)殖群體的群體內(nèi)近交系數(shù)(Fis)分別為0.2075、0.3449和0.3465,選育群體和養(yǎng)殖群體接近近交系(Fis>0.375)[19]的水平,選育群體和養(yǎng)殖群體可以被視為具有一定純化水平的群系,無論是雜交育種或通過雜交方式降低群體近交系數(shù),野生群體均可作為主要親本群。近交系數(shù)在進(jìn)行雜交子代的遺傳參數(shù)分析時,可作為重要的參考依據(jù)。一般雜交父本和母本分別來自不同群體(系),父本和母本被默認(rèn)為無親緣關(guān)系,但父本或母本個體間卻存在一定的親緣關(guān)系,利用基因型作為固定效應(yīng)計算親緣系數(shù)會優(yōu)于系譜計算。長純合片段反映了子代從有共同祖先的親代遺傳了相同的染色體片段[20],也可以幫助了解群體近交程度和群體多樣性,相較于群體內(nèi)近交系數(shù)Fis,基于長純合片段所計算的近交系數(shù)FROH更接近于真實近交水平,已在畜禽遺傳研究中普遍應(yīng)用[21-22],而本研究結(jié)果中,野生群體、選育群體和養(yǎng)殖群體的近交系數(shù)(FROH)分別為0.0149~0.0240、0.0159~0.0201和0.0170~0.0246,3個群體近交系數(shù)(FROH)相近并低于多數(shù)畜禽(FROH>0.05)[23-25],同時結(jié)果也明顯低于群體信息統(tǒng)計計算的近交系數(shù),除物種差異因素外,結(jié)果偏低也與簡化測序結(jié)果與基因組覆蓋率低有關(guān),且多數(shù)貝類沒有明顯性染色體[26],計算時以全基因組長度作為參數(shù)。近交系數(shù)(FROH)可作為群體內(nèi)無直接親緣關(guān)系個體的親緣關(guān)系參考系數(shù),在缺少基因型計算親緣系數(shù)時,近交系數(shù)(FROH)可直接作為合浦珠母貝選擇群體的近交系數(shù)進(jìn)行因子計算,不同染色體長純合片段的分布也表明了3個群體從共同祖先遺傳染色體概率相近。
筆者通過分析廣西合浦珠母貝3個不同群體間的遺傳關(guān)系,發(fā)現(xiàn)不同群體間存在一定程度的遺傳分化,并指出通過野生群體×選育群體或野生群體×養(yǎng)殖群體組合方式開展雜交育種,具有較大獲得雜種優(yōu)勢的潛力。研究結(jié)果可為廣西合浦珠母貝通過雜交育種對種質(zhì)資源改良提供新的思路和途徑。