魏琦超,王亞麗,張琛,趙加迪
(河南科技學院生命科技學院,河南新鄉(xiāng) 453003)
木質纖維素(lignocellulose)主要包括纖維素(cellulose)、半纖維素(hemicellulose)和木質素(lignin),是自然界含量最豐富的生物質原料。其中,纖維素的豐度最高,約占其總量的30%~50%;半纖維素的豐度次之,約占其總量的15%~35%[1-2]。半纖維素的主鏈由葡萄糖(glucose)、甘露糖(mannose)和木糖(xylose)等β-D-吡喃糖(pyranose)殘基通過β-1,4-糖苷鍵連接,可分為甘露聚糖(mannan)、木聚糖(xylan)和木葡聚糖(xyloglucans)3大類[3]。木聚糖由β-D-吡喃木糖通過β-1,4-糖苷鍵連接形成主鏈,是植物半纖維素的主要組分,約占植物干重的1/3[4]。
木聚糖酶(xylanase,EC.3.2.1.8)是一類能夠將木聚糖降解成低聚木糖和少量木糖、阿拉伯糖(arabinose)的一組酶系的總稱,在飼料、食品、化工等領域的用途非常廣泛[5]。王佳玉等[6]的研究表明,在全麥粉中木聚糖酶的添加量達到0.03%,經過90min酶解反應,面筋結構可得到明顯改善。班志彬等[7]在肉雞的不同類型飼料中添加木聚糖酶,研究了對其生長性能的影響,發(fā)現(xiàn)木聚糖酶可提高平均日增重并降低料重比。王陽等[8]研究了木聚糖酶預處理對檀皮纖維漂白的影響,認為預處理可有效疏松纖維結構,提高后期處理過程中漂白劑的可及性,進而提高檀皮纖維白度。
雖已在真菌、細菌、酵母菌、海藻和植物種子、甲殼類動物、蝸牛等物種中發(fā)現(xiàn)了木聚糖酶[9-10],但普遍認為,真菌和細菌是該酶的主要來源[11]。利用基因工程異源表達木聚糖酶,可在一定程度上解決木聚糖酶原始來源微生物目標酶表達量低、純化困難等酶生產和應用領域的限制性因素。木聚糖酶基因傳統(tǒng)發(fā)掘方式為分離自然環(huán)境中的產酶微生物,經純培養(yǎng)后克隆目標基因。然而,就土壤微生物而言,其可培養(yǎng)微生物僅占1%~10%[12-13],因此通過傳統(tǒng)方式分離木聚糖酶產酶菌株、發(fā)掘新穎木聚糖酶基因較為困難。
宏基因組最初是指土壤細菌混合基因組[14]。Rondon 等[15]以 細菌人工染色體(bacterial artificial chromosome,BAC)載體構建了土壤宏基因組DNA文庫,文庫克隆的表型包括脂肪酶、淀粉酶、核酸酶等,該研究為基于土壤宏基因組發(fā)掘新穎工業(yè)、醫(yī)藥用酶基因奠定了基礎。本研究擬以土壤宏基因組DNA為聚合酶鏈式反應(PCR)模板,使用CODEHOP方法[16]設計木聚糖酶基因核心序列的簡并引物,采用hiTAILPCR技術[17]獲悉其側翼序列,并最終克隆非培養(yǎng)木聚糖酶基因全長序列,為有效利用土壤微生物資源,發(fā)掘新穎木聚糖酶基因奠定基礎。
土壤樣品采自河南科技學院校園內常年潮濕的花壇土。除去地表植被和枯枝落葉,鏟除表面5cm左右的表土,取樣深度距土壤表面5~10cm,置于無菌采樣袋后帶回實驗室。
土壤基因組DNA提取試劑盒購自天根生化科技(北京)有限公司,大腸桿菌(Escherichia coli)感受態(tài)細胞、微柱濃縮DNA凝膠回收試劑盒購自北京莊盟國際生物基因科技有限公司,2×Taq PCR MasterMix、DNA分子量標準品購自北京博邁德基因技術有限公司,pMD?19-T Vector Cloning Kit、PrimeSTAR?GXL DNA Polymerase 購 自 Takara Bio,pEASY?-Blunt Zero Cloning Kit購自北京全式金生物技術有限公司,瓊脂糖、50×TAE緩沖液,購自北京索萊寶科技有限公司。
剔除土壤中的石礫和植物殘根等雜物,按照土壤基因組DNA提取試劑盒說明書提取其DNA,經瓊脂糖凝膠電泳檢測判斷所提取DNA樣品的完整性。使用微生物16S rRNA通用引物進行PCR擴增,檢驗DNA樣品是否滿足PCR擴增的純度要求。使用引物為 27F(5’AGAGTTTGATCCTGGCTCAG)/1525R(5’AAGGAGGTGATCCAGCC)[18]。反應程序為:95℃,5min;95℃,30s;55℃,30s;72℃ 45s,30個循環(huán);72℃,5min。
1.4.1 簡并引物設計
在UniProt網站(https://www.uniprot.org/)以檢索詞“xylanase”檢索并下載登錄號為Q8GJ44、Q9HFH0、B3A0S5等的多條已公開木聚糖酶氨基酸序列,使用CODEHOP設計基因核心區(qū)簡并引物[19]。Xyn-GH10(F):CTACGACTGGGAYGTNIBSAAYGA;Xyn-GH10(R):GTGACTCTGGAWRCCIABNCCRT。下劃線為核心序列的簡并區(qū)域,Y=C/T、N=A/T/G/C、I為次黃嘌呤、B=C/G/T、S=C/G、W=A/T、R=A/G。
1.4.2 核心序列擴增
以經27F/1525R檢測正常的土壤宏基因組DNA為模板,使用Xyn-GH10(F)/Xyn-GH10(R)進行PCR擴增。鑒于核心序列擴增用引物為簡并引物,反應程序采用降落PCR的方式進行,即以66℃為首個循環(huán)的退火溫度;前15個循環(huán),每循環(huán)的退火溫度降低1℃;以51℃為退火溫度循環(huán)25輪。
1.4.3 核心序列克隆與分析
將PCR產物進行瓊脂糖凝膠電泳和切膠回收,膠回收產物與pMD?19-T克隆載體連接,連接產物轉化DH5α感受態(tài)細胞,隨機挑取單克隆轉化子經PCR鑒定后送測序。測序結果通過以下流程進行分析:(1)測序結果去除簡并引物序列;(2)多條測序結果使用Vector NTI的Alignment子程序進行序列比對,如發(fā)現(xiàn)一致率為100%的序列,則僅保留一條序列用于后續(xù)分析;(3)序列提交至NCBI,使用blastx程序進行同源序列檢索;(4)綜合考慮檢索到同源序列的注釋信息及序列一致率,篩選相關核心序列進行側翼序列的擴增。
如表1所示,根據候選基因核心區(qū)測序結果,按照hiTAIL-PCR特異性引物設計規(guī)則,設計3條特異性上游引物和3條特異性下游引物,分別與hiTAILPCR通用引物配合使用,擴增核心區(qū)3’端和5’端側翼序列。
將前期克隆的木聚糖酶基因核心區(qū)及其5’端、3’端側翼序列進行拼接,根據拼接序列,設計2對引物(表2),以前期相應的土壤宏基因組DNA為模板,通過巢式PCR擴增木聚糖酶基因編碼區(qū)全長序列。
表1 側翼序列擴增用引物
表2 編碼區(qū)全長序列擴增用引物
克隆序列經DNAMAN軟件翻譯為氨基酸序列后,使用各工具網站(表3)進行同源序列的比對和理化性質、蛋白結構等的分析。
表3 生物信息學分析用工具網站
土壤中因富含腐殖酸、多酚等雜質,其高質量微生物總DNA的提取頗有困難困難較大。本研究使用試劑盒法提取總DNA。所提樣品經瓊脂糖凝膠電泳檢測,結果如圖1所示。發(fā)現(xiàn)其條帶單一,泳道內無彌散、降解現(xiàn)象,初步認為可滿足PCR擴增對模板質量的要求。為了進一步驗證模板質量,以微生物16S rRNA通用引物27F/1525R擴增,PCR產物經電泳檢測,結果如圖2所示??梢钥吹綌U增產物條帶清晰、符合預期大小,因此所提取DNA可滿足后續(xù)實驗要求。
圖1 土壤宏基因組DNA的電泳檢測
目標基因編碼區(qū)核心序列的擴增,是獲得其全長的必要條件。本研究使用CODEHOP方式設計的簡并引物、通過降落PCR的方式開展上述工作。PCR產物經瓊脂糖凝膠電泳檢測,獲得長度約為250bp(base pairs,堿基對)的電泳條帶(圖3),認為其符合CODEHOP簡并引物設計的預期大小。PCR產物經切膠回收后,連入T載體,隨機挑取15個單克隆經PCR檢測后送武漢金開瑞生物工程有限公司進行序列測定工作。
圖2 16S rRNAPCR 檢測
圖3 木聚糖酶基因核心序列PCR產物的電泳檢測
將核心序列測序結果去除簡并引物及其外側序列,使用blastx程序進行同源序列檢索,發(fā)現(xiàn)有3條序列與非全長的未培養(yǎng)微生物GH10家族(glycosyl hydrolase family 10)木聚糖酶氨基酸序列具有較高的一致率,認為其具有一定的新穎性。編號為Xyn10-3的核心序列,其一致率最高(70.59%)的序列為未培養(yǎng)微生物來源木聚糖酶(ACR24800),將其作為目標序列,開展編碼區(qū)全長序列的克隆工作。
根據Xyn10-3核心序列設計特異性引物,采用hiTAIL-PCR方式克隆其5'端和3'端側翼序列。根據獲悉的側翼序列信息,設計巢式PCR引物進行編碼區(qū)全長序列的克隆。經過兩輪PCR,克隆到Xyn10-3 的完整開放閱讀框(open reading frame,ORF),全長為 1 284bp(表4)。
將Xyn10-3編碼區(qū)核苷酸序列進行blastx檢索,其編碼的氨基酸序列與海洋放線菌(Actinoalloteichuscyanogriseus)β-1,4-內 切 木 聚糖酶的一致率最高,且僅為51.43%,表明所克隆的Xyn10-3編碼區(qū)為未知的新序列。NCBI的結構域預測結果(圖4)顯示:Xyn10-3的295-1272位氨基酸為β-1,4-內切木聚糖酶結構域,E值(E-value)為8.22E-61,認為其預測可靠。
圖4 Xyn10-3的結構域預測
將Xyn10-3編碼區(qū)核苷酸序列翻譯為氨基酸序列,發(fā)現(xiàn)其共有427aa,分子量為47398.91Da,理論等電點為8.99。各氨基酸位點的親疏水系數(shù)如圖5所示,平均親水系數(shù)(GRAVY)為-0.287,可判斷為親水蛋白。蛋白質跨膜區(qū)域分析結果(圖6)表明,該蛋白可能不存在跨膜區(qū)域。
圖5 氨基酸疏水性分析
圖6 蛋白質跨膜區(qū)域分析
表4 Xyn10-3編碼區(qū)核苷酸序列信息
傳統(tǒng)的新酶發(fā)掘技術方案,通常以目標性狀微生物的分離、篩選為起始環(huán)節(jié)。為了充分利用土壤未培養(yǎng)微生物蘊藏的海量基因資源,本研究嘗試使用CODEHOP方法設計的簡并引物先行克隆目標酶基因的編碼區(qū)核心序列,繼而使用hiTAIL-PCR方式獲悉其旁側DNA序列信息,最終通過巢式PCR的方式克隆全長的編碼區(qū)DNA序列。所克隆Xyn10-3經生物信息學分析,認為其是一個未報道的木聚糖酶全長基因。后續(xù)將構建pGAPZαA-Xyn10-3重組質粒,并進行畢赤酵母(Pichia pastoris)工程菌株的構建和目標蛋白的表達、純化等工作,以進一步檢測其酶活。