李春娟,閆彩霞,石程仁,趙小波,王 娟,單世華
(山東省花生研究所,山東 青島 266100)
栽培種花生是大約3500年前由二倍體AA(A.duranensis)和BB(A.ipaensis)野生種基因組重組進化形成的異源四倍體植物[1]。在植物分類系統(tǒng)上,栽培種花生(ArachishypogaeaL.)隸屬于豆科(Leguminosae),蝶形花亞科,花生屬(Arachis)。目前,花生屬已經(jīng)命名的有81個種,絕大部分是二倍體野生種(2n=20),少量四倍體種(2n=40)和非整倍體種(2n=18)。1994年,Krapovickas和Gregory根據(jù)近代分類學研究結果,將花生屬植物進一步劃分為9個區(qū)組(花生區(qū)組、大根區(qū)組、直立區(qū)組、圍脈區(qū)組、異形花區(qū)組、匍匐?yún)^(qū)組、根莖區(qū)組、三葉區(qū)組和三子粒區(qū)組)。其中,花生區(qū)組(sect.Arachis)包含花生栽培種(A.hypogaeaL,2n= 40)、 25個二倍體野生種和一個四倍體野生種,研究表明它們之間雜交親和[2-3]。
栽培種花生是我國重要的經(jīng)濟作物和油料作物。我國是花生種植大國,已有500多年的種植歷史。孫大容等發(fā)表的《中國栽培花生品種的分類》中指出,我國種植的花生品種主要由2個亞種組成,即密枝亞種ssp.hypogaea和疏枝亞種ssp.fastigiata[4]。栽培種花生種植面積廣泛,但是遺傳基礎相對狹窄,因此拓寬栽培種花生的種質(zhì)資源遺傳基礎顯得尤為重要[5]?;ㄉ鷮僖吧N質(zhì)資源豐富,基因型多樣,在熱帶亞熱帶氣候環(huán)境下有廣泛的適應性。和栽培種花生相比,野生種質(zhì)具有葉斑病、銹病、青枯病等抗病蟲害基因,是用于花生品種改良的重要基因源。盡管有些種質(zhì)資源并無栽培價值,但可根據(jù)不同的目的,通過雜交選育利用其有利基因,獲得新種或達到改良現(xiàn)有栽培種的目的。對花生屬種間親緣關系的準確揭示將有助于實現(xiàn)這一目標。
簡化基因組測序(Genotyping-by Sequencing;GBS),是一種高通量、高性價比的二代測序技術。通過對花生屬的不同物種進行測序,獲得酶切位點附近基因序列信息,能夠檢測出大量的遺傳變異位點[5-7]。本研究利用GBS測序結果獲取能夠比對到葉綠體全基因組的序列信息,由于葉綠體基因組具有單倍性、母系遺傳、結構和功能高度保守等特點,因此通過比較花生栽培種與其近緣野生種葉綠體基因組序列差異,能夠揭示系統(tǒng)演化關系。同時,葉綠體基因組有一些高突變區(qū),在漫長的進化中會有差別,可以解決低階分類單元問題。此外,Prabhudas等首先發(fā)表了一個花生栽培品種(A.hypogaeaL. Co7 variety)的葉綠體全基因組,指出基因組大小有156 391bp,注釋到110個基因,這為花生屬各物種葉綠體遺傳信息的獲得提供了參考信息[8]。因此,本研究能夠較好地揭示栽培種花生與花生屬花生區(qū)組其他野生種之間的親緣關系,對野生資源的引入和遺傳資源的保存有重要參考。
55份花生種質(zhì)材料包括11份花生區(qū)組的野生種質(zhì)(A.monticola,A.duranensis,A.stenosperma,A.paraguariensis,A.helodes,A.hoehnei,A.chacoensis,A.villosa,A.correntina,A.batizocoi,A.cardenasii),11份來自印度、美國及阿根廷等地的國外種質(zhì)以及33份(普通型10份,龍生型9份,珍珠豆型8份,多粒型6份)國內(nèi)不同產(chǎn)區(qū)的花生種質(zhì)材料。每份材料隨機選取3粒完整種子,培養(yǎng)皿中浸種1~2 d后,置入培養(yǎng)盒,28℃下培養(yǎng)10 d。使用植物基因組DNA提取試劑盒(天根,北京),依次取每個樣品的鮮葉進行基因組DNA的提取并檢測DNA的完整性和純度(單位濃度不少于50 ng/μL,總質(zhì)量大于2μg;相關試劑來自US Everbright Inc.)。-80°C下保存?zhèn)溆谩?/p>
首先,選取EcoRI和NiaIII酶切組合對質(zhì)量合格的DNA進行酶切[9]。其次,GBS建庫,酶切好的每個樣本加不同的一級接頭(adapter),區(qū)分混合測序中不同樣本后,再通過PCR加入二級接頭(adapter),并且通過控制PCR的退火時間,控制擴增片段大小(300~500 bp),實現(xiàn)片段選擇的目的。最后,確認檢測建庫質(zhì)量后,在Illumina Hiseq 4000平臺上進行PE150雙末端測序。
利用Q30標準對序列質(zhì)量進行評估,采用FastQC軟件(http://www.bioinformatics.babraham. ac.uk/projects/fastqc/)對所測得的原始數(shù)據(jù)進行過濾:①去掉接頭;②去掉N的含量超過該條read長度比例 10%的reads;③去除單端序列低質(zhì)量堿基(Q≤5)比例超過read長度 50%的reads。
以花生葉綠體基因組(Genbank號為:KX257487)為參考基因組,全長為156391 bp。利用 BWA version 0.6.2[10]軟件進行reads比對(mem-t4-k32-M)。輸出文件通過SAM tools 軟件和VCF tools軟件獲取葉綠體全基因組上的遺傳變異位點。其中,參數(shù)“view”轉化sam為bam文件;參數(shù)“sort”對bam文件進行排序;參數(shù)“rmdup”去除重復比對的reads(reads比對到多個位置);參數(shù)“mpileup”檢測SNP。為了提高遺傳變異位點的準確性,按照以下標準進行過濾:①雙等位基因;②Q>20;③MAF(Minor Allele Frequency)≥0.05;④個體覆蓋度不低于80%;⑤reads深度≥3。
R軟件包中adegenet程序用于主成分判別分析(Discriminant Analysis of Principal Components,DAPC)[11]。在不設置種群的先驗信息情況下,利用參數(shù)“find.clusters”在貝葉斯信息準則基礎上(BIC)尋找最合理的簇數(shù)目。利用MEGA最大似然法(Maximum Likelihood,ML)和鄰接法(Neighbor-Joining,NJ)兩種方法分別構建系統(tǒng)進化樹,缺隙(Gap)設為缺失狀態(tài),同時以自展法(Bootstrap)進行檢驗,重復5000次。其他均使用默認參數(shù)。
GBS測序reads與葉綠體全基因組比對,reads平均深度達到231x(113x ~922x),平均覆蓋度為69%(54%~88%)。從55份花生材料中獲得遺傳變異位點1102個。在此基礎上,經(jīng)過上述過濾標準,剩余SNP位點約372個。此外,去除雜合SNP位點,共保留121個變異位點,其中包含10個InDel位點,111個SNP位點。篩選得到的SNP變異位點將用于后續(xù)分析。
首先,PCA分析將55份花生區(qū)組的材料分成了5個組: ① 栽培種花生和A.monticola;②A.duranensis,A.batizocoi,A.paraguariensist,A.correntina和A.hoehnei;③A.villosa和A.stenosperma;④A.chacoensis;⑤A.helodes和A.cardenasii。
圖1 PCA分析顯示五個相似的遺傳組分 Fig. 1 PCA analysis revealed five genetic groups
其次,構建了最大似然法(ML)和鄰接法(N-J)兩棵系統(tǒng)演化樹。與花生區(qū)組的其他物種相比,栽培種花生種內(nèi)遺傳變異較少,聚為平行枝。該枝還包括野生四倍體A.monticola。此外,野生種A.duranensis,A.batizocoi,A.paraguariensist和A.hoehnei聚為一枝,其余6個野生種聚為一枝。與NJ樹不同的是,ML樹的平行枝中還包含野生種A.correntina。
花生屬花生區(qū)組種間親緣關系的揭示對利用野生種優(yōu)良基因改良栽培種花生具有重要意義。研究提出,區(qū)組內(nèi)種間雜交具有一定親和性,區(qū)組間種間雜交不親和或雜種完全不育[2]。由于種間形態(tài)差異的復雜性,通過細胞水平和分子水平揭示它們之間的親緣關系更為準確[12]。唐榮華對花生屬六個區(qū)組九個種進行核型分析,根據(jù)著絲點位置區(qū)分花生遺傳距離。指出A.batizocoi與花生區(qū)組中其它二倍體核型差異較大,遺傳距離較大[13]。Singh從種子蛋白質(zhì)電泳譜帶分析中指出花生區(qū)組大多數(shù)二倍體種都有一個共同的A染色體組,而A.batizocoi則是B染色體組[14]。Moretzsohn等根據(jù)SSR聚類結果分析,認為栽培種花生與花生區(qū)組的二倍體種A.duranensis、A.villosa和A.diogoi的關系較近[15]。唐榮華等用SSR和AFLP兩種分子標記技術證明A.cardenasii、A.batizocoi與栽培種的親緣關系較遠,不大可能是花生栽培種的祖先,而認為A.duranensis是花生栽培種的祖先之一[16]。楊森以花生栽培種四粒紅及其與野生種光葉花生的種間雜種為材料,根據(jù)ITS1-5.8S-ITS2序列擴增獲得長度約800bp的單一條帶,在對 PCR 產(chǎn)物進行克隆測序的基礎上構建了花生屬進化樹,具備鑒定種間雜種的優(yōu)勢[17]。
由于葉綠體基因組具有單倍性、母性遺傳、結構和功能高度保守等特點,使得通過比較栽培種花生與其近緣野生種葉綠體基因組序列差異成為闡明種間親緣關系的理想研究方法。本研究聚類結果表明,44份栽培種花生材料盡管來自不同國家,屬于不同花生類型,但種內(nèi)遺傳變異程度較小,明顯聚在一起。不同的野生種間遺傳距離不同?;ㄉ鷮僦信c栽培種花生親緣關系最近的是A.monticola。A.monticola是花生區(qū)組中唯一的四倍體野生種,基因組類型AABB。Grabiele et al. 推測這個物種是通過自然雜交和自然加倍后,但未經(jīng)人工選擇的四倍體物種,即可能是栽培種花生祖先種[18]。親緣關系較近的有A.duranensis,A.batizocoi,A.paraguariensist和A.hoehnei。其中,A.duranensis被證實是栽培種花生的野生親本之一(A染色體組供體)[1]。通過上述文獻報道推測A.batizocoi與另一個親本(A.ipaensis)的親緣關系較近,因為它們都具備B染色體組。系統(tǒng)樹結果也支持以上聚類關系。
圖2 花生屬花生區(qū)組內(nèi)種間親緣關系樹 Fig. 2 Phylogenetic tree among the species of sec. Arachis 注:(A)N-J樹;(B)ML樹。 Note: (A) N-J tree; (B) ML tree
由于花生區(qū)組存在雜交親和性,根據(jù)栽培種花生與野生種親緣關系遠近,通過雜交、選育利用其有利基因,能夠獲得新種或改良現(xiàn)有栽培種,從而實現(xiàn)對野生資源的引入和遺傳資源保存的目標。