馬 奉,周青松,曹煥喜,陳婧婷,4,王明強(qiáng),5,謝婷婷,楊娟娟,4,陶雙倫,張 峰,羅阿蓉*,朱朝東,4
(1. 吉首大學(xué)生物資源與環(huán)境科學(xué)學(xué)院,湖南吉首 416000;2. 中國科學(xué)院動(dòng)物研究所動(dòng)物進(jìn)化與系統(tǒng)學(xué)(院)重點(diǎn)實(shí)驗(yàn)室,北京 100101;3. 中國科學(xué)院動(dòng)物研究所國家動(dòng)物標(biāo)本資源庫,北京 100101;4. 中國科學(xué)院大學(xué)生命科學(xué)學(xué)院,北京 100049;5. 中國科學(xué)院成都生物 研究所山地生態(tài)恢復(fù)與生物資源利用重點(diǎn)實(shí)驗(yàn)室與生態(tài)恢復(fù)生物多樣性保護(hù)四川省重點(diǎn)實(shí)驗(yàn)室,成都 610041;6. 南京農(nóng)業(yè)大學(xué)植物保護(hù)學(xué)院,南京 210095)
昆蟲種類繁多,生物學(xué)特性復(fù)雜多樣,在生態(tài)系統(tǒng)中發(fā)揮著植食、分解、傳粉、寄生、捕食等服務(wù)功能,是生物多樣性的重要組成部分,在生態(tài)系統(tǒng)中占有重要地位(彩萬志等, 2011;Kunin, 2019;王明強(qiáng)等, 2022)。準(zhǔn)確、快速地進(jìn)行物種鑒定是昆蟲生物多樣性監(jiān)測評估等研究的基礎(chǔ)(Dayrat, 2005)。在DNA分類學(xué)出現(xiàn)以前,昆蟲分類學(xué)家在發(fā)現(xiàn)和描述物種時(shí)通?;谛螒B(tài)學(xué)特征,不僅耗時(shí)、費(fèi)力,而且需要長時(shí)間形態(tài)學(xué)知識和經(jīng)驗(yàn)的積累(Hongetal., 2022; Zhuetal., 2022)。因此,面對大量昆蟲物種鑒定需求,形態(tài)分類學(xué)在描述昆蟲物種多樣性時(shí)往往很難提供高效、及時(shí)的支撐(Hebertetal., 2003; Yuetal., 2012)。此外,雌雄二型、變態(tài)發(fā)育、表型可塑與遺傳可變性等問題,還會導(dǎo)致模棱兩可甚至相互矛盾的鑒定結(jié)果(Knowlton, 1993; Jarman and Elliott, 2000; Hebertetal., 2003)。因此,加強(qiáng)對多類群和大樣本量物種界定方法的探索,提升昆蟲分類學(xué)效率,在昆蟲多樣性研究工作中顯得非常重要而緊迫。
本世紀(jì)初以來,DNA條形碼(DNA barcoding)技術(shù)為分類學(xué)研究提供了新的技術(shù)支撐,促使昆蟲物種鑒定和多樣性監(jiān)測方法更加經(jīng)濟(jì)、高效,極大地提升了對已知物種、研究尚不充分或有待發(fā)現(xiàn)類群的物種界定效力(Hebertetal., 2003)。該技術(shù)利用標(biāo)準(zhǔn)化的基因片段作為分子標(biāo)記,基于種內(nèi)遺傳距離小于種間遺傳距離的原則,在很多類群中實(shí)現(xiàn)物種識別及鑒定(Hebertetal., 2003; Hebert and Gregory, 2005)。選取合適的分子標(biāo)記是使用DNA條形碼開展物種鑒定的關(guān)鍵因素(Waugh, 2007; Luoetal., 2011)。相較于核基因,線粒體基因具有母系遺傳、進(jìn)化速率快、基因重組率發(fā)生率低等特點(diǎn)(劉青青和董志軍, 2018)。其中,線粒體細(xì)胞色素C氧化酶亞基I基因(Cytochromecoxidase subunit I, 簡稱COI)不存在內(nèi)含子,在保證足夠變異的情況下,容易被通用引物擴(kuò)增,被普遍用作動(dòng)物各類群的通用條形碼區(qū)域(Hebertetal., 2003)。目前,基于COI基因的DNA條形碼在昆蟲物種鑒定、隱存種發(fā)現(xiàn)及種間互作關(guān)系等研究中已得到廣泛應(yīng)用和驗(yàn)證。例如:Hebert等(2004a)利用DNA條形碼對哥斯達(dá)黎加鱗翅目弄蝶科昆蟲Astraptesfulgerator的研究,發(fā)現(xiàn)了隱存種;Pentinsaari等(2014)對北歐1 872個(gè)甲蟲的COI條形碼區(qū)域進(jìn)行了測序和有效識別,加速了甲蟲新物種的發(fā)現(xiàn);Wang等(2020, 2021)利用COI基因?qū)Υ罅亏[翅目幼蟲進(jìn)行了物種界定,進(jìn)一步闡明了植食性昆蟲與植物之間的互作關(guān)系。此外,部分學(xué)者甚至單獨(dú)應(yīng)用DNA條形碼開展昆蟲分類研究(Meierottoetal., 2019; Sharkeyetal., 2021)。
隨著基因組測序技術(shù)的發(fā)展,DNA宏條形碼(DNA metabarcoding)作為DNA條形碼技術(shù)的拓展,已經(jīng)在一定程度上克服了物種多樣性研究中的取樣瓶頸,能解決易獲得但形態(tài)較難區(qū)分的昆蟲及土壤、水體等環(huán)境樣品分析中的問題(Thomsen and Willerslev, 2015; Deineretal., 2017; 高養(yǎng)春等, 2020)。不過,盡管新的技術(shù)在測序通量和效率等方面有了大幅提升,DNA宏條形碼在數(shù)據(jù)產(chǎn)生過程中容易受PCR擴(kuò)增偏差、測序深度等因素的影響;其后續(xù)的數(shù)據(jù)處理需要較復(fù)雜的生物信息學(xué)分析;所獲數(shù)據(jù)在物種注釋過程中能鑒定到的物種水平也依賴于物種數(shù)據(jù)庫的建立和完整性(Yuetal., 2012; 王萌等, 2021)。因此,DNA宏條形碼所恢復(fù)的生物多樣性信息,仍然可能與實(shí)際情況存在較大偏差。相比之下,DNA條形碼在物種鑒定準(zhǔn)確性、高效性等方面依然具有綜合優(yōu)勢,在昆蟲物種鑒定和生物多樣性研究中仍占據(jù)重要地位(Zahirietal., 2017; DeSalle and Goldstein, 2019; Wangetal., 2020; Wangetal., 2021)。
長期以來,昆蟲DNA條形碼研究工作大多局限于某個(gè)具體類群,因此其對不同昆蟲類群物種多樣性評估的功效一直存在爭議。例如,Meier等(2006)利用1 333條COI序列,對449種雙翅目昆蟲進(jìn)行了分子分類學(xué)研究,獲得了較低的物種鑒定成功率(<70%);不過,Ashfaq等(2018)在利用DNA條形碼開展多樣性調(diào)查中,則發(fā)現(xiàn)雙翅目具有較高的物種分辨率(92%)。又如:Hebert等(2003)曾提出鱗翅目昆蟲的物種區(qū)分閾值為3%;蜉蝣目、毛翅目的有效閾值卻為2% (Zhouetal., 2010; Webbetal., 2012)。本研究對來自中國江西新崗山的昆蟲樣品開展DNA條形碼研究,比較不同類群所獲MOTU(Molecular operational taxonomic unit)的種內(nèi)遺傳距離,期望進(jìn)一步闡釋DNA條形碼在不同昆蟲類群的作用功效。
采樣地點(diǎn)位于我國江西省新崗山,其為中國亞熱帶森林生物多樣性與生態(tài)系統(tǒng)功能實(shí)驗(yàn)樣地(Biodiversity-ecosystem functioning experiment China, 簡稱BEF-China)(29°08′~29°11′N、117°90′~117°93′E)(馬克平, 2013);其地處亞熱帶,年平均氣溫16.7℃,年均降雨量1 821 mm,具典型的季風(fēng)氣候(Yangetal., 2013; Bruelheideetal., 2014)。
本研究于2020年利用馬來氏網(wǎng)在BEF-China樣地中采集昆蟲標(biāo)本,并保存在無水乙醇中。從所獲樣品中隨機(jī)選取5瓶樣品,手動(dòng)分揀其中昆蟲個(gè)體。鑒于DNA提取、易操作性等因素,本研究僅選取個(gè)頭較大的個(gè)體(體長>0.5 cm),以建立方法流程。隨后,按形態(tài)特征將所選樣品初步分成不同的類群(即非嚴(yán)格的“形態(tài)種”),并對每個(gè)類群選取1~3頭用無水乙醇沖洗,再分別取腿置于離心管中保存于-20℃下用于DNA提取。
首先將樣品取出并在室溫下晾干殘余酒精,再用液氮速凍后研磨。使用天根生化科技(北京)有限公司或凱杰(QIAGEN GmbH, Hilden, Germany)公司提供的血液和組織DNA提取試劑盒提取全基因組DNA,具體實(shí)驗(yàn)步驟參照相應(yīng)試劑盒說明書操作。所提取的基因組DNA于-20℃保存。
本研究所有聚合酶鏈?zhǔn)椒磻?yīng)(PCR)均使用LongGene PCR儀進(jìn)行擴(kuò)增。PCR總體系為30 μL:15 μL Premix PrimeSTAR HS (TaKaRa),正反引物(10 μM)各1 μL,ddH2O 10 μL ,DNA模板3 μL。針對擴(kuò)增目標(biāo),即線粒體COI基因5′端長度為658 bp區(qū)域,首選通用引物L(fēng)CO1490和HCO2198(Folmeretal., 1994),其具體反應(yīng)程序見表1。對于以上程序擴(kuò)增不成功的,則采用引物L(fēng)CO1490和HCOout(Carpenter and Wheeler, 1999),并結(jié)合PCR反應(yīng)程序Ⅵ(PCR Ⅵ,表1)(Huangfuetal., 2022)進(jìn)行擴(kuò)增。
表1 PCR使用引物及反應(yīng)程序
取6 μL PCR產(chǎn)物用于1%瓊脂糖凝膠電泳,觀察電泳目標(biāo)條帶是否明亮,并拍照記錄電泳結(jié)果。將凝膠電泳檢測出目標(biāo)條帶的樣品送北京天一輝遠(yuǎn)生物科技有限公司進(jìn)行Sanger測序。
1.3.1序列處理及初步鑒定
記錄測序公司返回的序列測序情況,并采用BioEdit(Hall, 1999; 2011)、MAFFT v7(https://mafft.cbrc.jp/alignment/server/)和MEGA v7 (Kumaretal., 2016)軟件對序列進(jìn)行處理。首先,將所有COI序列采用MAFFT進(jìn)行比對,用MEGA翻譯為氨基酸序列以核查閱讀框是否中斷,用BioEdit軟件對序列進(jìn)行校對、剪切,并統(tǒng)計(jì)序列的堿基位點(diǎn)情況;將序列導(dǎo)入到BOLD system v4在線系統(tǒng),使用IDENTIFICATION程序查看物種鑒定結(jié)果;若在BOLD中無法獲得分類信息,則采用NCBI中的Blast程序再次比對查詢;將從BOLD和NCBI中獲得的物種信息進(jìn)行整合,并結(jié)合挑選樣本時(shí)的形態(tài)分類情況以確定獲得的序列即為目的基因片段。
1.3.2MOTU界定
上述數(shù)據(jù)庫鑒定可將所有序列清晰確定到目水平(與形態(tài)分類一致),因此后續(xù)分子分類將針對涉及的昆蟲各目分別展開。先將修剪好的序列采用Mothur (Schlossetal., 2009)處理成單倍型,隨后采用jMOTU (Jonesetal., 2011)、ABGD (Puillandreetal., 2012)、bPTP (Zhangetal., 2013)、GMYC (Fujisawa and Barraclough, 2013) 4種方法對6個(gè)目昆蟲序列分別進(jìn)行物種界定,劃分出MOTU。
(1)jMOTU 分析。分歧閾值設(shè)置為1~20 bp,聚集參數(shù)為97%。
(2)ABGD分析。種內(nèi)差異先驗(yàn)值P(prior intraspecific divergence)最小值為0.001,最大值為0.1,最小相對gap寬度值X(minimum relative gap width)=0.5~1,Steps=5,Nb bins=20,基于K2P模型(Kimura, 1980)計(jì)算遺傳距離。
(3)bPTP分析。首先,采用IQ-TREE(Nguyenetal., 2015)以最大似然法及默認(rèn)模型構(gòu)建有外群的ML系統(tǒng)發(fā)生樹;隨后,基于ML樹并設(shè)置默認(rèn)參數(shù)(MCMC代數(shù)為100 000,Burn-in值為0.1,seed值為123)進(jìn)行物種界定結(jié)果分析。
(4)GMYC分析?;谝陨蠘?gòu)建的ML樹采用r8s軟件構(gòu)建超度量樹(ultrametric tree),繼而通過R軟件“SPLITS”包(Monaghanetal., 2009)中單閾值(single-threshold)GMYC模型進(jìn)行物種界定分析。
基于以上方法分別獲得MOTU后,采用R “clues”包的Hubert &Arabie調(diào)整蘭德指數(shù)(Hubert and Arabie’s adjusted Rand index)(Millgan and Cooper, 1986; Changetal., 2010)對4種方法的劃分結(jié)果進(jìn)行兩兩比較分析,評估不同界定結(jié)果的穩(wěn)定性,并結(jié)合所構(gòu)建的ML樹情況,選擇一致性最高的分類結(jié)果確定為最終的MOTU或物種界定結(jié)果用于后續(xù)分析(Wangetal., 2019; Lietal., 2022)。
1.3.3遺傳距離
根據(jù)上述確定的MOTU結(jié)果,按不同昆蟲目將序列導(dǎo)入MEGA中,進(jìn)行序列堿基含量分析;并根據(jù)物種界定所得MOTU劃分情況將序列分成不同的“group”。當(dāng)某MOTU中包含兩條或以上序列時(shí),根據(jù)兩兩平均距離(p-distance模型)計(jì)算種內(nèi)遺傳距離。隨后,分別計(jì)算6個(gè)昆蟲目的種內(nèi)平均遺傳距離。
本研究共計(jì)擴(kuò)增479個(gè)昆蟲樣本,并成功獲得475條COI序列,擴(kuò)增成功率達(dá)99.2%。經(jīng)與BOLD和NCBI在線物種數(shù)據(jù)庫比對,結(jié)果顯示:樣本序列物種目級信息與形態(tài)學(xué)初步分類結(jié)果一致,475條序列分屬于6個(gè)昆蟲目(鱗翅目、雙翅目、膜翅目、鞘翅目、半翅目、直翅目);其中雙翅目最多,152條(占32.4%);其次為膜翅目和鱗翅目,均超過100條;鞘翅目、半翅目和直翅目均不到40條。物種數(shù)據(jù)庫鑒定到科水平的COI序列共計(jì)205條,其中數(shù)量占優(yōu)勢的雙翅目鑒定到科共70條(46.1%),屬于14科;其次為鱗翅目69條(58.5%),屬于15科;膜翅目46條(36.5%),屬于7科;最少為直翅目,僅5條,屬2科(表2)。
表2 不同目昆蟲物種鑒定
堿基組成計(jì)算結(jié)果顯示:6個(gè)目昆蟲的序列堿基含量均具有明顯的AT偏向性。其中,半翅目、鱗翅目、膜翅目和雙翅目等4個(gè)目的A+T含量均比G+C含量高出2倍多,膜翅目A+T含量最高,達(dá)72.6%,直翅目最少為64.3%(表3)。
表3 不同目昆蟲COI序列堿基組成信息
所獲序列經(jīng)比對修剪后433條序列(占90.4%)用于物種界定分析。各昆蟲目序列數(shù)從高到低依次為雙翅目、鱗翅目、膜翅目、鞘翅目、半翅目和直翅目。采用jMOTU、ABGD、bPTP和GMYC這4種方法進(jìn)行界定共得到288個(gè)MOTU,其中鱗翅目獲得的MOTU最多,半翅目、鞘翅目和膜翅目獲得MOTU均超過樣本量的60%,雙翅目和直翅目的MOTU不到樣本量的50%(表4)。
表4 各目昆蟲物種界定及種內(nèi)遺傳距離統(tǒng)計(jì)情況
具體而言,鞘翅目昆蟲用4種方法界定的結(jié)果完全一致。鱗翅目昆蟲除用GMYC方法界定結(jié)果少一個(gè)MOTU外,其余3種方法界定結(jié)果完全一致。半翅目昆蟲的jMOTU和GMYC方法界定結(jié)果完全一致,而ABGD和bPTP方法存在兩處差異,涉及5條序列。bPTP和GMYC對直翅目昆蟲的界定結(jié)果完全一致,但ABGD和jMOTU方法存在兩處差異,涉及5條序列。4種方法對雙翅目昆蟲的結(jié)果均不一致,存在6處差異,涉及28條序列。GMYC外的另外3種界定方法對膜翅目昆蟲界定結(jié)果均不一致,存在7處差異,涉及16條序列(圖1)。根據(jù)R “clues”包Hubert &Arabie調(diào)整蘭德指數(shù)對不同方法界定結(jié)果的穩(wěn)定性評估情況,選取一致性最高的為最終結(jié)果。因此,鞘翅目昆蟲基于4種方法劃分為20個(gè)MOTUs;鱗翅目昆蟲基于ABGD、jMOTU、bPTP方法劃分為85個(gè)MOTUs;半翅目昆蟲基于jMOTU和GMYC方法劃分為21個(gè)MOTUs;直翅目昆蟲基于bPTP和GMYC方法劃分為8個(gè)MOTUs;雙翅目昆蟲基于GMYC的界定結(jié)果,劃分為74個(gè)MOTUs;膜翅目昆蟲基于jMOTU方法的界定結(jié)果劃分為80個(gè)MOTUs。
圖1 不同物種界定方法對不同目昆蟲的物種界定結(jié)果Fig.1 Species delimitation results from different methods for different insect orders注:圖中僅顯示4種方法劃分MOTU有差異的部分序列情況。Note:Figure only shows partial sequences for which species delimitations from the four methods differed.
基于物種界定所得MOTU計(jì)算種內(nèi)遺傳距離顯示,不同昆蟲類群的種內(nèi)遺傳距離最小值差異很小,鱗翅目、膜翅目、鞘翅目、雙翅目均為0.17%;但最大值差異較大,從0.51%至2.69%(圖2,表4)。不同昆蟲類群的種內(nèi)遺傳距離中,膜翅目種內(nèi)遺傳距離均值及標(biāo)準(zhǔn)偏差最大(0.89%±0.87%,mean±SD),其次為雙翅目(0.73%±0.58%)、半翅目(0.71%±0.31%)和鞘翅目(0.60%±0.47%),鱗翅目的最小(0.28%±0.20%)(圖2)。
圖2 不同目昆蟲種內(nèi)遺傳距離的平均值、最大值和最小值(a)、平均值±標(biāo)準(zhǔn)差(b)Fig.2 Average, maximum and minimum value (a) and mean±SD (b) of the intraspecific genetic distance of different insect orders
DNA條形碼通常被認(rèn)為是一種經(jīng)濟(jì)、簡便、可靠的分子鑒定工具,在后生動(dòng)物類群中具有廣泛的適用性(Hebertetal., 2004a; Hebert and Gregory, 2005; Virgilioetal., 2010)。本研究對測得的COI條形碼序列與在線物種庫進(jìn)行了比對鑒定,并基于劃分的MOTU進(jìn)行種內(nèi)遺傳距離分析。結(jié)果表明:不同的昆蟲類群的種內(nèi)遺傳距離,雖然整體在一定范圍內(nèi)(如小于3%),但呈現(xiàn)一定程度的差異。因此,雖然曾有研究提出10倍法則或3%的遺傳距離閾值作為物種水平差異診斷的標(biāo)準(zhǔn)(Hebertetal., 2003; Hebertetal., 2004b; Waugh, 2007),但是昆蟲分子分類不能簡單地依賴于某具體距離閾值。本研究計(jì)算了6個(gè)昆蟲目的種內(nèi)遺傳距離,發(fā)現(xiàn)種內(nèi)遺傳距離最小值小于1%,而且鱗翅目、雙翅目、膜翅目、鞘翅目昆蟲的種內(nèi)遺傳距離范圍具有相似性;雙翅目、膜翅目昆蟲的種內(nèi)遺傳距離和種內(nèi)平均遺傳距離最大值范圍均大于2%。這些均與Hebert等(2003)所認(rèn)為的種內(nèi)遺傳距離多小于1%的說法不完全一致。此外,Zhang &Bu (2022)對BOLD數(shù)據(jù)庫中64 414種昆蟲進(jìn)行遺傳距離分析發(fā)現(xiàn):大約四分之一的昆蟲物種存在較高的遺傳變異(>3%)。然而,新近的研究中,Sharkey等(2021)依然使用2%的遺傳距離閾值開展膜翅目昆蟲物種劃分。顯然,在對昆蟲進(jìn)行分子分類研究中針對不同昆蟲類群的劃分方案還存在爭議。本研究也再次證明不同的昆蟲類群遺傳距離存在差異性,使用特定遺傳距離閾值進(jìn)行物種劃分時(shí)需要慎重考慮。
其實(shí),DNA條形碼用于昆蟲物種鑒定在實(shí)驗(yàn)環(huán)節(jié)還受到取樣、DNA提取、PCR擴(kuò)增和測序等因素的影響。其中,非常關(guān)鍵的環(huán)節(jié)是使用引物擴(kuò)增目的基因片段。本研究以昆蟲線粒體COI條形碼擴(kuò)增的常用引物L(fēng)CO1490+HCO2198為主,以LCO1490+HCOout作為補(bǔ)充進(jìn)行擴(kuò)增,總體獲得了較高的成功率,達(dá)99.2%。不同目昆蟲表現(xiàn)出一定差異:鱗翅目、鞘翅目、雙翅目擴(kuò)增成功率都達(dá)100%,而半翅目的擴(kuò)增成功率只有96.8%。值得一提的是,對于雙翅目昆蟲使用引物L(fēng)CO1490+HCOout將擴(kuò)增成功率從61%提高到了98%。
同時(shí),盡管BOLD和NCBI數(shù)據(jù)庫都包含有大量的COI數(shù)據(jù),但本研究獲得的6個(gè)昆蟲目400余條COI序列與在線物種數(shù)據(jù)庫進(jìn)行比對鑒定時(shí),能注釋到科及屬、種水平的尚不足50%。Virgilio等(2010)對DNA條形碼在鱗翅目、雙翅目、膜翅目、鞘翅目、直翅目、半翅目這6個(gè)目昆蟲中的性能比較研究中,也證實(shí)了在缺少數(shù)據(jù)庫資料作參考的情況下,會影響DNA條形碼的物種鑒定效率。Chesters &Zhu (2014)發(fā)現(xiàn)現(xiàn)有的物種數(shù)據(jù)庫仍然有較大的物種信息缺口,需要不斷完善。因此,昆蟲多樣性研究需要分類學(xué)者提供足夠的物種信息,才能在測序技術(shù)和分析效率等方面有大幅提升的同時(shí),為更加高效地利用分子物種鑒定方法(如:DNA宏條形碼)提供基礎(chǔ)。
本研究對亞熱帶森林中數(shù)量居多的鱗翅目、雙翅目、膜翅目、鞘翅目、半翅目、直翅目這 6大目昆蟲進(jìn)行了DNA條形碼研究,在目內(nèi)科、屬、種等多個(gè)水平探討了DNA對不同昆蟲類群的檢測和界定效率,可以豐富本地昆蟲分子數(shù)據(jù)庫,為森林蟲害防治提供基礎(chǔ)數(shù)據(jù);同時(shí)也為進(jìn)一步探索基于DNA條形碼的分子分類學(xué)研究提供參考。但本研究仍然存在一定的采樣局限性(有的目樣本只有30余個(gè)),不同物種的個(gè)體數(shù)量也分布不均衡,然而不影響DNA條形碼在昆蟲多樣性研究工作中的物種鑒定有效性。后續(xù)的研究有必要擴(kuò)大采樣量,并進(jìn)行更深入的探討;同時(shí)應(yīng)當(dāng)在形態(tài)分類學(xué)的基礎(chǔ)上加大對DNA條形碼的研究,不斷豐富DNA條形碼數(shù)據(jù)庫,從而可以為利用更加高效的分子分類方法開展多樣性調(diào)查提供基礎(chǔ)。