李紫涵,張徐祥,任洪強
(污染控制與資源化研究國家重點實驗室,南京大學(xué)環(huán)境學(xué)院,江蘇 南京 210023)
整合子是一種攜帶多種耐藥基因并能夠使其在不同細(xì)菌間進行水平轉(zhuǎn)移的可移動遺傳元件[1],主要由整合酶基因(Integrase gene,intI)和可攜帶耐藥基因(Antibiotic resistance genes,ARGs)的基因盒2部分組成[2-3]。據(jù)文獻報道,目前至少有9類整合酶基因[4],有研究表明Ⅰ、Ⅱ、Ⅲ類整合酶基因和耐藥基因的關(guān)系最密切[5]。
由于人類生產(chǎn)生活的影響,大量整合子和耐藥基因進入水環(huán)境[6-7]。醫(yī)療廢水被認(rèn)為是污水處理廠和自然環(huán)境中人為釋放整合子和耐藥基因的主要來源,含高濃度抗生素與抑菌劑的水體為耐藥細(xì)菌、可移動遺傳元件和耐藥基因提供了選擇性環(huán)境[8-9]。生活污水則是整合子和耐藥基因排放到自然水體中的主要途徑,污水處理設(shè)施中高密度、多種類的細(xì)菌環(huán)境成為了整合子及其攜帶的耐藥基因的巨型反應(yīng)器[10]。由于抗生素在養(yǎng)殖業(yè)中的使用,水產(chǎn)養(yǎng)殖廢水分離菌株亦被檢測出含有整合酶基因[11-12]。飲用水是與人體健康息息相關(guān)的極為重要的水體環(huán)境,已有報道發(fā)現(xiàn)飲用水?dāng)y帶Ⅰ、Ⅱ類整合子[13],而Ⅲ類整合子少有文獻報道。
目前對水環(huán)境介質(zhì)中整合酶基因的檢測大多集中于用熒光實時定量聚合酶鏈?zhǔn)椒磻?yīng)(PCR)擴增整合酶基因的特定片段[7, 14-16],該方法對樣品濃度和整合酶基因豐度有一定要求,引物的選擇也會影響整合酶基因的檢測結(jié)果。宏基因組測序技術(shù)可以全面地對不同環(huán)境樣品進行針對性分析,近年來,宏基因組測序技術(shù)也運用到整合酶基因的檢測中[7, 17],其主要依賴整合子數(shù)據(jù)庫,如INTEGRALL[18-19]?,F(xiàn)選取4種典型水環(huán)境介質(zhì):飲用水、生活污水、水產(chǎn)養(yǎng)殖廢水和醫(yī)療廢水,通過宏基因組高通量數(shù)據(jù)與數(shù)據(jù)庫比對的方法對數(shù)據(jù)庫中已有的多種整合酶基因同時進行比對,全面地檢測樣品中的整合酶基因和ARGs的種類,分析不同種類整合酶基因的多樣性及均勻度特征,并采用多元統(tǒng)計分析方法揭示水環(huán)境介質(zhì)中整合酶基因和ARGs豐度的相關(guān)性。從而有助于識別水環(huán)境中ARGs的水平轉(zhuǎn)移風(fēng)險,為水環(huán)境中ARGs的有效控制提供科學(xué)依據(jù)。
選擇4種典型水環(huán)境介質(zhì)(飲用水、生活污水、水產(chǎn)養(yǎng)殖廢水及醫(yī)療廢水)作為研究對象。
飲用水樣品分別采集自上海、蘇州、無錫、南京、蕪湖、安慶、九江、武漢、岳陽、荊州、萬州、重慶12個城市的自來水管網(wǎng);生活污水樣品采集自中國東部某城市的2個生活污水處理廠的進、出水口及活性污泥工藝段。采集得到的樣品使用FastDNA SPIN試劑盒提取樣品總DNA并送至生工生物工程(上海)有限公司進行宏基因組測序,測序平臺為Hiseq 2500。
水產(chǎn)養(yǎng)殖廢水和醫(yī)療廢水?dāng)?shù)據(jù)下載自美國國家生物技術(shù)信息中心(NCBI)的序列讀取存檔(Sequence Read Archive,SRA)平臺,上傳時間為2017—2019年。樣品宏基因組數(shù)據(jù)信息見表1。
表1 4種典型水環(huán)境樣品的宏基因組高通量測序數(shù)據(jù)的基本信息
(1)數(shù)據(jù)格式轉(zhuǎn)化。水產(chǎn)養(yǎng)殖廢水、醫(yī)療廢水?dāng)?shù)據(jù)下載自NCBI的SRA平臺,使用sratoolkit工具包中fastq-dump工具將下載的SRA數(shù)據(jù)轉(zhuǎn)換為fastq文件。
(2)雙端測序數(shù)據(jù)質(zhì)量控制。為確保數(shù)據(jù)分析的準(zhǔn)確性,采用fastp軟件對下載數(shù)據(jù)和SRA轉(zhuǎn)化數(shù)據(jù)進行質(zhì)量控制,得到最終的高質(zhì)量序列。
(1)數(shù)據(jù)庫構(gòu)建。整合酶基因數(shù)據(jù)庫選用INTEGRALL數(shù)據(jù)庫(http://integrall.bio.ua.pt/),包含整合酶基因1 498條及基因盒8 562條。
(2)數(shù)據(jù)庫比對結(jié)果篩選。將質(zhì)控后的fastq文件轉(zhuǎn)化為fasta文件與下載到本地的INTEGRALL數(shù)據(jù)庫進行BLAST比對,比對軟件為BLAST 2.2.7,比對條件:E-value≤ 10-5,num_alignments為1。
(3)整合酶基因注釋。按相似性≥90%、比對長度≥50%篩選比對結(jié)果,將篩選后的BLAST比對結(jié)果與INTEGRALL數(shù)據(jù)庫中整合酶基因列表進行再次比對,保留注釋結(jié)果為整合酶基因的條目。
ARGs數(shù)據(jù)庫比對選用耐藥基因分析工具ARGs-OAP v2.0[20],該數(shù)據(jù)庫包含24個ARGs類型、1 208個抗性亞型、12 307條ARGs參考序列。比對共有2個步驟:(1)對高通量數(shù)據(jù)進行比對及過濾,以E-value≤10-7,相似度≥80%為過濾條件輸出meta-data文件;(2)使用SARGfam數(shù)據(jù)庫,將ARGs基因進行定性定量分析和types及subtypes分類。
根據(jù)公式(1)、(2)計算出整合酶基因及ARGs絕對豐度[21]。
(1)
(2)
式中:CAbundance——基因絕對豐度;n——屬于某ARGs類型的映射ARGs參考序列的數(shù)量;NARG-like sequence——注釋到某特定ARGs參考序列的類ARGs序列的數(shù)量;Lreads——該類ARGs reads的長度;LARG reference sequence——對應(yīng)的特定ARGs參考序列的序列長度;Ncell number——細(xì)胞數(shù);N16S sequence——16S rRNA基因序列的數(shù)量;L16S sequence——16S rRNA基因的全長;m——根據(jù)提取的超可變區(qū)域信息,從宏基因組數(shù)據(jù)檢測出的總類群;Mi——CopyRighter數(shù)據(jù)庫中分類單元i的拷貝數(shù);ai——宏基因組數(shù)據(jù)集中分類單元i的豐度;A——所有m分類群的總豐度。
使用SPSS軟件對整合酶基因和ARGs豐度相關(guān)性進行Pearson檢驗,顯著性分析則選用雙側(cè)檢驗并標(biāo)記顯著性相關(guān)關(guān)系,判斷不同典型水環(huán)境介質(zhì)中,不同種類整合酶基因和24個類型ARGs相關(guān)性關(guān)系,當(dāng)r≥0.6且P<0.05時,認(rèn)為結(jié)果具有統(tǒng)計學(xué)意義。為分析不同典型水環(huán)境介質(zhì)中整合酶基因豐度和類型的多樣性,使用R語言中vegan包對整合酶基因進行alpha多樣性分析,計算其Shannon-wiener多樣性指數(shù)和Pielou均勻度指數(shù)。Vegan包和ggplot2包還被用于分析與繪制Bray-Cutis距離下4種典型水環(huán)境介質(zhì)中整合酶基因相似性,并使用多元方差分析(Adonis)、相似性分析(ANOSIM)和多響應(yīng)置換過程分析(MRPP)3種統(tǒng)計學(xué)方法對其組間與組內(nèi)差異進行顯著性檢驗。
將4種典型水環(huán)境高通量數(shù)據(jù)與整合子數(shù)據(jù)庫INTEGRALL進行比對及結(jié)果篩選,各類整合酶基因的檢出率見表2。intI1和intI3基因在4種水環(huán)境介質(zhì)中均有檢出。除飲用水外,intI2在其他3種水環(huán)境介質(zhì)樣品中部分檢出,分別為生活污水26.7%(8/30個),水產(chǎn)養(yǎng)殖廢水4.8%(1/21個)、醫(yī)療廢水41.7%(10/24個)。
表2 4種典型水環(huán)境介質(zhì)中各類整合酶基因檢出率 %
4種典型水環(huán)境介質(zhì)中整合酶基因總豐度見圖1,圖中*為P<0.05;**為P<0.01。由圖1可見,生活污水、水產(chǎn)養(yǎng)殖廢水和醫(yī)療廢水中整合酶基因相對豐度顯著大于飲用水整合酶基因(P<0.05),生活污水相對豐度顯著大于水產(chǎn)養(yǎng)殖廢水(P<0.05),而其與醫(yī)療廢水和水產(chǎn)養(yǎng)殖廢水的整合酶基因相對豐度無顯著性差異(P>0.05)。生活污水的整合酶基因在30個樣品中分布最為集中,相對豐度為2.23×10-2~6.31×10-1copy/cell,有研究表明生活污水中整合酶基因豐度變化受時間的影響較小[22]。醫(yī)療廢水中整合酶基因相對豐度最低為7.43×10-3copy/cell,最高為1.34 copy/cell,顯著高于飲用水(P<0.05),但與生活污水和水產(chǎn)養(yǎng)殖廢水中整合酶基因相對豐度無顯著性差異(P>0.05)。水產(chǎn)養(yǎng)殖廢水的整合酶基因相對豐度為1.64×10-3~2.11×10-1copy/cell,介于生活污水和飲用水之間。飲用水中整合酶基因相對豐度雖在4種水環(huán)境介質(zhì)中最低(P<0.05),為2.47×10-4~1.40×10-1copy/cell,但其分布范圍廣,在采樣的12個城市飲用水管網(wǎng)末梢均有檢出。
圖1 4種典型水環(huán)境介質(zhì)中整合酶相對豐度
4種典型水環(huán)境介質(zhì)中各類整合酶基因相對豐度見圖2(a)(b)(c)(d),除文獻中已明確報道的intI1—intI9外,將數(shù)據(jù)庫比對結(jié)果中未分類的整合酶基因統(tǒng)一歸為“others”。
圖2 4種典型水環(huán)境介質(zhì)中各類整合酶基因相對豐度
由圖2可知,4種典型水環(huán)境介質(zhì)中intI1的檢出率和相對豐度均高于其他種類整合酶基因。intI2在生活污水和醫(yī)療廢水中相對豐度分別為1.74×10-4~4.27×10-3copy/cell和2.80×10-4~1.31×10-1copy/cell,只在一個水產(chǎn)養(yǎng)殖廢水樣品中檢測出intI2基因,飲用水樣品中未檢測出intI2基因。intI3在生活污水、水產(chǎn)養(yǎng)殖廢水和醫(yī)療廢水中豐度分別為6.48×10-5~6.60×10-2,3.51×10-5~3.59×10-5和5.05×10-5~1.59×10-2copy/cell,僅在1個飲用水樣品中檢測出intI3基因,其相對豐度為2.13×10-5copy/cell。intI9基因也在生活污水、水產(chǎn)養(yǎng)殖廢水和醫(yī)療廢水中檢出。intI6基因僅在1個醫(yī)療廢水樣品中檢測出。intI1和intI2基因在醫(yī)療廢水中平均豐度最高,生活污水次之,而intI3和intI9在生活污水中平均豐度最高,醫(yī)療廢水次之。
4種典型水環(huán)境介質(zhì)中整合酶基因種類多樣性及均勻度相關(guān)性分析結(jié)果見圖3(a)(b),圖中*為P<0.05;**為P<0.01。Shannon-Wiener指數(shù)用于表征整合酶基因組成的豐富程度,指數(shù)越大,表明該種水環(huán)境介質(zhì)中整合酶基因的多樣性越高[23]。Pielou指數(shù)用于表征環(huán)境中不同基因分布的均勻程度(Species evenness)[24-25],Pielou指數(shù)越高,表明環(huán)境中各類整合酶基因豐度越接近,均勻度越大。
圖3 4種典型水環(huán)境介質(zhì)中整合酶基因種類多樣性及均勻度
由圖3(a)可見,4種典型水環(huán)境介質(zhì)兩兩之間Shannon-Wiener指數(shù)均有顯著性差異(P<0.05),醫(yī)療廢水中含intI1、intI2、intI3、intI6和intI9共5種整合酶基因,多樣性最高,其次是生活污水,水產(chǎn)養(yǎng)殖廢水整合酶基因多樣性顯著大于飲用水。由圖3(b)可見,4種典型水環(huán)境介質(zhì)中,醫(yī)療廢水均勻度最大,說明醫(yī)療廢水中各類整合酶基因的分布較為平均,飲用水的Pielou指數(shù)最小,生活污水和水產(chǎn)養(yǎng)殖廢水均勻度指數(shù)無顯著性差異。綜上所述,4種典型水環(huán)境介質(zhì)中整合酶基因多樣性大小為:醫(yī)療廢水>生活污水>水產(chǎn)養(yǎng)殖廢水>飲用水;均勻度大小為:醫(yī)療廢水>水產(chǎn)養(yǎng)殖廢水、生活污水>飲用水。
為探討4種典型水環(huán)境介質(zhì)中整合酶基因組成的相似性,對111個樣品進行主坐標(biāo)分析(PCoA),結(jié)果見圖4。Bray-Cutis距離是根據(jù)均一化豐度表定量度量基因組成差異的距離計算方式。由圖4可見,在Bray-Cutis距離下,生活污水整合酶基因豐度和飲用水差異較大,與水產(chǎn)養(yǎng)殖廢水的相似性較高,飲用水、水產(chǎn)養(yǎng)殖廢水和醫(yī)療廢水的整合酶基因差異性小,即這3種水環(huán)境的整合酶基因豐度及組成結(jié)構(gòu)的相似性較高。通過Adonis、ANOSIM、MRPP 3種統(tǒng)計方法對Bray-Cutis距離下4種水環(huán)境整合酶基因組成的組間差異進行顯著性檢驗,結(jié)果見表3。Adonis利用距離矩陣對總方差進行分解,常用于分析不同分組因素對樣品差異的解釋度,r2越大時,分組方案對差異的解釋度越高,表3中Adonis的r2=0.261,說明整體上4種典型水環(huán)境整合酶基因的組成有顯著性差異(P<0.001)。ANOSIM是一種非參數(shù)檢驗,主要用于比較組內(nèi)和組間差異的大小,r值趨近1時,組間差異大于組內(nèi)差異,r值趨近-1時,組內(nèi)差異大于組間差異。MRPP是另一種基于組內(nèi)和組間差異的置換檢驗,當(dāng)Expected δ>Observed δ時,組間差異大于組內(nèi)差異。表3中,ANOSIM的r=0.305,MRPP的Expected δ=0.686>Observed δ=0.576,說明4種典型水環(huán)境介質(zhì)中整合酶基因的組成有顯著性差異,且組間差異大于組內(nèi)差異(P<0.001)。
圖4 4種典型水環(huán)境介質(zhì)中整合酶基因組成基于Bray-Cutis距離的PCoA分析
表3 Bray-Cutis距離下3種統(tǒng)計方法對4種典型水環(huán)境介質(zhì)中整合酶基因組成的顯著性檢驗
水環(huán)境介質(zhì)中intI1基因與磺胺類、大環(huán)內(nèi)酯-林肯酰胺-鏈陽霉素、四環(huán)素類、氯霉素和甲氧芐氨嘧啶5類抗生素耐藥基因豐度具有強相關(guān)性(r≥0.6且P<0.05);intI2基因與磺胺類抗生素耐藥基因豐度具有強相關(guān)性(r≥0.6且P<0.05);intI3基因與18種抗生素耐藥基因豐度均為弱相關(guān)或無相關(guān)性(r<0.4)。
對4種典型水環(huán)境介質(zhì)中整合酶基因豐度和抗生素耐藥基因豐度相關(guān)性分別進行分析,結(jié)果見圖5。由圖5可見,飲用水中I類整合酶基因intI1豐度與氨基糖苷類和磺胺類耐藥基因豐度呈顯著相關(guān)。由于磺胺類耐藥基因是I類整合子3′保守末端的組成部分,因此氨基糖苷類耐藥基因可能是飲用水中I類整合子基因盒中的常見ARGs。Adesoji等[26]研究發(fā)現(xiàn)飲用水中分離的假單胞菌intI1基因盒內(nèi)含有2種抗氨基糖苷類耐藥基因(aadA1和aadA2)和一種抗磺胺類耐藥基因(sul1),胡亞茹等[27]也發(fā)現(xiàn)飲用水水源地中intI1與磺胺類耐藥基因sul1、sul2存在正相關(guān)關(guān)系,認(rèn)為intI1在磺胺類ARGs的水平轉(zhuǎn)移過程中起到了重要作用,與本研究分析結(jié)果一致。
生活污水中intI1基因與磺胺類、氯霉素、β-內(nèi)酰胺類、氨基糖苷類等15種抗生素耐藥基因顯著相關(guān),Harnisz等[28]用實時熒光定量(qPCR)方法檢測17個污水處理廠的污水樣品中ARGs和intI1基因豐度,發(fā)現(xiàn)intI1基因與磺胺類sul1、β-內(nèi)酰胺類blaTEM、氨基糖苷類aac(6′)-lb-cr、大環(huán)內(nèi)酯類ermF和四環(huán)素類tet(A)基因具有良好的正相關(guān)性(Spearman相關(guān)系數(shù)r= 0.69~0.83,P<0.05),An等[29]在污水樣品I類整合子基因盒克隆文庫中檢測出氯霉素catB8基因、β-內(nèi)酰胺類blaOXA-101基因、氨基糖苷類aadA2基因、甲氧芐氨嘧啶drfA14基因等。生活污水中intI2基因與博來霉素、大環(huán)內(nèi)酯-林肯酰胺-鏈陽霉素和四環(huán)素耐藥基因顯著相關(guān),有文獻還發(fā)現(xiàn)Ⅱ類整合子可與I類整合子攜帶相同基因盒,且I類整合子的整合酶基因可能協(xié)助Ⅱ類整合子基因盒內(nèi)ARGs表達(dá)[30]。intI3基因與比對出的18種耐藥基因均無顯著相關(guān)性。生活污水中攜帶耐藥基因盒的主要為I類整合子和Ⅱ類整合子。
水產(chǎn)養(yǎng)殖廢水中intI1、intI2、intI3基因與18種耐藥基因均無顯著相關(guān),僅有intI1與喹諾酮(r= 0.462,P<0.05)、利福霉素(r= 0.442,P<0.05)和四環(huán)素(r=0.439,P<0.05)呈中等相關(guān)。
醫(yī)療廢水中intI1與磺胺類、氨基糖苷類、β-內(nèi)酰胺類、甲氧芐氨嘧啶、大環(huán)內(nèi)酯-林肯酰胺-鏈陽霉素和四環(huán)素類6種抗生素耐藥基因豐度呈顯著相關(guān)(r>0.6,P<0.05)。intI2與磺胺類、氨基糖苷類、β-內(nèi)酰胺類和甲氧芐氨嘧啶4種抗生素耐藥基因顯著相關(guān)(r>0.6,P<0.05),有文獻發(fā)現(xiàn)Ⅱ類整合子基因盒中攜帶drfA1、aadA1、blaCARB-4、catB2、ereA、sat2等耐藥基因,其中抗甲氧芐氨嘧啶類、氨基糖苷類和鏈陽霉素(dfrA1-sat2-aadA1)耐藥基因盒最為常見[31-32]。intI3與喹諾酮、膦胺霉素、春日霉素和多粘菌素4種耐藥基因有顯著相關(guān)性(r> 0.6,P<0.05)。
近年來,有關(guān)Ⅲ類整合子基因盒攜帶耐藥基因的報道較少,Elizabeth、Yamamoto等[33-34]分別在分離菌株發(fā)現(xiàn)1株基因盒中攜帶blaCTX-M的Ⅲ類整合子和1株攜帶aacA31-fosE-blaIMP-1的Ⅲ類整合子,本研究中氨基糖苷類和β-內(nèi)酰胺類耐藥基因與intI3的相關(guān)性系數(shù)分別為0.22和0.30(P>0.05),無顯著相關(guān)關(guān)系,可能是由于Ⅲ類整合子基因盒中大多為功能基因,如insB、iroB、glpK等,而耐藥基因攜帶的數(shù)量和種類有限,無法從豐度上顯示其相關(guān)關(guān)系。
圖5 4種水環(huán)境介質(zhì)中3種整合酶基因與各類ARGs豐度的Pearson相關(guān)性
(1)在4種典型水環(huán)境介質(zhì)中檢測出intI1、intI2、intI3、intI6和intI9共5種已明確分類的整合酶基因,整合酶基因相對豐度為:生活污水>水產(chǎn)養(yǎng)殖廢水>飲用水,且醫(yī)療廢水>飲用水;多樣性為:醫(yī)療廢水>生活污水>水產(chǎn)養(yǎng)殖廢水>飲用水;均勻度為:醫(yī)療廢水>水產(chǎn)養(yǎng)殖廢水、生活污水>飲用水,生活污水與水產(chǎn)養(yǎng)殖廢水的均勻度無顯著性差異。
(2)在Bray-Cutis距離下進行主成分分析,結(jié)果表明4種典型水環(huán)境介質(zhì)中整合酶基因的組成有顯著性差異(P<0.001),且組間差異大于組內(nèi)差異(Expected δ = 0.686>Observed δ = 0.576)。生活污水和飲用水中整合酶基因的組成差異性最大,而生活污水和水產(chǎn)養(yǎng)殖廢水中整合酶基因組成和豐度的相似性較高,飲用水、水產(chǎn)養(yǎng)殖廢水和醫(yī)療廢水中整合酶基因的相似性較高。
(3)4種典型水環(huán)境介質(zhì)中整合酶基因和ARGs豐度相關(guān)性分析結(jié)果表明,生活污水整合酶基因豐度最高,其I類整合子的基因盒攜帶磺胺類、氯霉素、β-內(nèi)酰胺類、甲氧芐氨嘧啶等15種ARGs的可能性較高,Ⅱ類整合子攜帶博來霉素、大環(huán)內(nèi)酯-林肯酰胺-鏈陽霉素和四環(huán)素ARGs的可能性高;醫(yī)療廢水I類整合子的基因盒中磺胺類、氨基糖苷類、β-內(nèi)酰胺類、甲氧芐氨嘧啶等6種ARGs較為常見,而Ⅱ類整合子基因盒中磺胺類、氨基糖苷類、β-內(nèi)酰胺類和甲氧芐氨嘧啶4種ARGs較為常見;飲用水中主要存在I類整合子,其基因盒中可能攜帶氨基糖苷類ARGs;而水產(chǎn)養(yǎng)殖廢水中整合子豐度較高,但與ARGs的相關(guān)性較弱,無法從數(shù)據(jù)分析上判斷其主要攜帶的ARGs類型,亟待進一步研究。