鄭司浩,尚興樸,鄧庭偉,曾燕,王繼永
中國中藥有限公司,北京 102600
甘草為豆科甘草屬常用大宗中藥材,《中華人民共和國藥典》2020 年版規(guī)定甘草為甘草Glycyrrhiza uralensisFisch.、脹果甘草G.inflataBat.或光果甘草G.glabraL.的干燥根和根莖,味甘,性平,歸心、肺、脾、胃經(jīng),具有補脾益氣、調(diào)和諸藥等功能,多用于治療脾胃虛弱、倦怠乏力等[1]?,F(xiàn)代藥理研究表明,甘草及其提取物具有抗氧化、抗炎、抗?jié)?、解毒抗癌、抗肝纖維化等藥理作用[2]。植物甘草為甘草藥材的主要來源,分布在內(nèi)蒙古自治區(qū)、新疆維吾爾自治區(qū)、甘肅省、寧夏回族自治區(qū)等地,東北地區(qū)也有少量分布。
甘草在中醫(yī)臨床中使用量較大,歷來有“十方九草”之說。同時,其也是藥食同源品種之一,廣泛用于食品、保健食品及化妝品。自20 世紀60—70年代開始,甘草被大規(guī)模栽培,據(jù)不完全統(tǒng)計,全國甘草栽培面積約50 萬畝(1 畝≈666.67 m2),年使用量近6 萬t[3]。研究表明,不同產(chǎn)地甘草不僅外觀性狀特征存在一定差異,甘草酸、甘草苷、總黃酮及總皂苷含量也存在顯著差異[4-5]。因此,不同產(chǎn)地甘草藥效成分與藥理作用存在差異。受市場因素及產(chǎn)業(yè)機械化程度不同影響,不同產(chǎn)地甘草種子、種苗、藥材及飲片價格差異較大,存在相互摻雜、異地調(diào)種等情況。傳統(tǒng)鑒別方法對于種內(nèi)鑒別研究較少,多借助性狀鑒別等主觀經(jīng)驗,很難復制與產(chǎn)業(yè)化推廣。單核苷酸多態(tài)性(single nucleotide polymorphism,SNP)指發(fā)生在染色體基因組水平上單個核苷酸變異引起的DNA 序列多態(tài)性。本研究通過對不同產(chǎn)地甘草進行基因組重測序,參考甘草全基因組序列,分析比較不同產(chǎn)地基因組序列差異,獲得各主產(chǎn)區(qū)特有的SNP 位點信息,作為鑒別不同產(chǎn)地甘草的依據(jù),為規(guī)范甘草產(chǎn)業(yè)、促進市場健康發(fā)展提供參考。
由中國中藥有限公司自建甘草種質(zhì)資源圃采集內(nèi)蒙古自治區(qū)、新疆維吾爾自治區(qū)、甘肅省等甘草主產(chǎn)區(qū)野生種質(zhì)資源葉片樣本共24 份,經(jīng)國藥種業(yè)有限公司李進瞳副研究員鑒定為甘草Glycyrrhiza uralensisFisch.,標本存放于中國中藥有限公司,樣品信息見表1。
MGISEQ-2000RS型高通量測序儀(深圳華大智造科技股份有限公司);1-14 型離心機(德國Sartorius公司);NanoDrop One型超微量分光光度計(美國Thermo公司)。
FCL PE150MGISEQ-2000RS 高通量測序試劑套裝(批號:1000012555,深圳華大智造科技股份有限公司);異丙醇(批號:20190605)、無水乙醇(批號:20190507)均購自國藥集團化學試劑有限公司。
采用改良十六烷基三甲基溴化銨(mCTAB)法對甘草葉片材料DNA 進行提取,具體步驟如下:1)取新鮮植物葉片100 mg 放入2.0 mL 離心管,加入少量石英砂和磁珠1 顆,浸入液氮中凍存約1 min,置研磨機中打磨至細小的粉末狀;2)在研磨好的材料中加入buffer A[0.1 mol·L-1Tris-HCl(pH 8.0)、5 mmol·L-1乙二胺四乙酸(EDTA)、0.25mol·L-1NaCl、1%聚乙烯吡咯烷酮-40(PVP-40)]溶液1.5 mL,反復顛倒離心管使溶液與材料粉末均質(zhì)混勻,冰浴10 min,其間將沉淀下的粉末重新均質(zhì)混合幾次。10 000×g離心2 min 后,棄掉上清液;3)重復步驟2)1 次,在沉淀中加入預熱的2% CTAB[0.1 mol·L-1Tris-HCl(pH 8.0)、1.4 mol·L-1NaCl、25 mmol·L-1EDTA、2%CTAB;0.2%β-巰基乙醇;1% PVP-40]溶液800 μL,將沉淀均質(zhì)懸浮于溶液后置于65 ℃水浴鍋中保存1.5~2.0 h,其間顛倒均質(zhì)溶液若干次;4)10 000×g室溫離心2 min 后,將上清液小心倒入新的2.0 mL 離心管中,加入等體積CI[三氯甲烷-異戊醇(24∶1)]溶液,在顛倒搖床上混合10 min;5)10 000×g離心2 min 后,以移液槍小心吸取上層水相至新2.0 mL 離心管中,加入等體積CI 溶液,顛倒搖床上混合10 min;6)10 000×g離心2 min 后,以移液槍小心吸取上層水相至新的1.5 mL 離心管中,加入0.6 倍體積的冰冷異丙醇,顛倒混合后置于-20 ℃冰箱保存1 h 以上;7)取出冰箱中的離心管,10 000×g離心2 min,棄去上清液,倒置于干燥紙上,加入100 mg·L-1核糖核酸酶(RNase)溶液100 μL,37 ℃保存0.5 h;8)在離心管中依次加入ddH2O 150 μL、5 mol·L-1NaCl 溶液50 μL 和無水乙醇700 μL,充分混合后10 000×g離心2 min,棄去上清液;9)加入70%乙醇600 μL,彈底混合后10 000×g離心2 min,,棄去上清液,重復1 次;10)真空干燥去掉乙醇,加Tris-EDTA 緩沖液100 μL 溶解DNA,根據(jù)NanoDrop One 測定要求將樣品DNA 濃度并稀釋至50 ng·μL-1備用。
檢測合格的DNA 樣品隨機打斷成300~400 bp的片段,采用華大基因試劑盒進行建庫。庫檢合格后,根據(jù)文庫的有效濃度和實際產(chǎn)出需求進行BGI-SEQ高通量測序,獲得DNA測序原始數(shù)據(jù)。
測序得到的原始reads包含接頭序列,低質(zhì)量和包含N的reads。使用SOAPnuke 1.5.6對原始reads進行過濾以保證信息分析質(zhì)量。過濾參數(shù):-n 0.02-l20-q 0.4。
以甘草在http://ngs-data-archive.psc.riken.jp/Gur-genome/download.pl 中的基因組作為參考序列,利用BWA 軟件進行序列比對,比對參數(shù)為mem-t 8-M-R。比對獲得的.bam 文件利用Samtools軟件進行排序,并用picard 移除聚合酶鏈式反應(PCR)引起的重復reads。
得到.bam 文件后,利用GATK 軟件獲得個體的SNP基因型,進一步對SNP進行過濾,保留QUAL>100&&FS<10&&MQ>40的SNP。通過比較不同產(chǎn)地樣本的SNP 基因型,找到各主產(chǎn)區(qū)穩(wěn)定的SNP 鑒別位點信息,結(jié)合SNP 位點在基因組的位置,根據(jù)其前后150~200 bp 的堿基序列設計引物,利用經(jīng)典的SANGER 測序?qū)Σ煌a(chǎn)地樣品的SNP 位點堿基進行驗證與確認。在產(chǎn)地鑒別時,建議待檢樣品與產(chǎn)地鑒別SNP位點滿足95%以上的比對標準。
通過對甘草不同產(chǎn)地樣品的重測序數(shù)據(jù)進行分析比對,找到可穩(wěn)定鑒別內(nèi)蒙古杭錦旗產(chǎn)甘草的20 個SNP 位點信息,同時結(jié)合SNP 位點前后序列設計引物,通過SANGER 測序的方式,驗證與確認SNP 位點準確性,信息見表2。SNP 周邊序列是指該SNP 位點前5 bp 起始共計10 bp 的堿基序列。
通過提取鑒別內(nèi)蒙古杭錦旗產(chǎn)地甘草SNP 位點周邊300~500 bp 堿基序列設計引物,通過SANGER測序方式進行測序驗證,第一次設計引物擴增成功率為90%(擴增不成功的加長序列長度重新設計引物直到擴增成功),SNP 位點堿基均正確。基于表2中SNP 位點信息,將待檢測樣本按照2 項下方法進行實驗,最終得到待檢樣品SNP 基因型。相同染色體位置處的SNP位點信息與表2進行比對,如有19~20 個SNP 位點信息與表2 中所列的位點信息相同,則可判定該待檢樣品為內(nèi)蒙古杭錦旗產(chǎn)甘草。
表2 內(nèi)蒙古杭錦旗產(chǎn)甘草鑒別SNP位點信息
通過對甘草不同產(chǎn)地樣品的重測序數(shù)據(jù)進行分析比對,找到可穩(wěn)定鑒別新疆產(chǎn)甘草的40 個SNP 位點信息,結(jié)合SNP 位點前后序列設計引物,通過SANGER 測序的方式,驗證與確認SNP 位點準確性,信息見表3。
通過提取鑒別新疆產(chǎn)地甘草SNP 位點周邊300~500 bp 堿基序列設計引物,通過SANGER 測序方式進行測序驗證,第一次設計引物擴增成功率為95%(擴增不成功的加長序列長度重新設計引物直到擴增成功),SNP 位點堿基均正確?;诒? 中SNP 位點信息,將待檢測樣本按2 項下方法進行實驗,最終得到待檢樣品SNP 基因型。將相同染色體位置處SNP 位點信息與表3 進行比對,如有19~20個SNP基因與表3中SEQID No.1~No.20相同,同時有19~20個SNP基因與表3中SEQID No.21~No.40 不同,則可判定該待檢樣品為新疆產(chǎn)甘草。
表3 新疆產(chǎn)甘草鑒別SNP位點信息
通過對甘草不同產(chǎn)地樣品的重測序數(shù)據(jù)進行分析比對,找到可穩(wěn)定鑒別甘肅產(chǎn)甘草的40 個SNP位點信息,結(jié)合SNP 位點前后序列設計引物,通過SANGER 測序的方式,驗證與確認SNP 位點準確性,信息見表4。
通過提取鑒別甘肅產(chǎn)地甘草SNP 位點周邊300~500 bp 堿基序列設計引物,通過SANGER 測序方式進行測序驗證,第一次設計引物擴增成功率為90%(擴增不成功的加長序列長度重新設計引物直到擴增成功),SNP 位點堿基均正確?;诒? 的SNP 位點信息,將待檢測樣本按2 項下方法進行實驗,最終得到待檢樣品SNP 基因型。相同染色體位置處的SNP位點信息與表4進行比對,如有19~20個SNP基因與表4 中SEQID No.1~No.20 相同,同時有19~20個SNP 基因與表4 中SEQID No.21~No.40 不同,則可判定該待檢樣品為甘肅產(chǎn)甘草。
表4 甘肅產(chǎn)甘草鑒別SNP位點信息
藥材甘草在中醫(yī)處方中用藥頻次較高,又是藥食同源的中藥大品種,隨著甘草在食品、化妝品及保健食品等產(chǎn)品中使用量逐漸增多,其需求量將會不斷增加。當前,甘草是甘草藥材的主要植物來源,新疆、內(nèi)蒙古、甘肅等地是其主要產(chǎn)區(qū)。不同產(chǎn)區(qū)的甘草種子、種苗及藥材存在較為明顯的價格差異,特別是甘草種子。由于新疆面積廣闊、利于機械化作業(yè),該地區(qū)甘草種子價格普遍比內(nèi)蒙古、甘肅等地低近50%。巨大的經(jīng)濟利益驅(qū)使商販進行異地調(diào)種、產(chǎn)地摻雜,嚴重影響甘草藥材的質(zhì)量穩(wěn)定和產(chǎn)業(yè)健康有序發(fā)展。
中藥材產(chǎn)地鑒別一直是中藥產(chǎn)業(yè)技術難點和痛點。有經(jīng)驗的藥農(nóng)與中藥材種植戶多依靠主觀經(jīng)驗加以判斷。隨著分子生物學的加速發(fā)展,其在居群及生態(tài)型鑒別方面的研究技術和方法可在中藥材產(chǎn)地鑒別中加以探索和應用。SNP 分子標記是第三代分子標記技術的代表,以基因組序列為基礎,具有通量大、多態(tài)性豐富、分析速度快、易建立標準化操作等特點[6]。SNP分子標記技術在中藥物種鑒別中已有廣泛應用[7-11],在同一藥材不同產(chǎn)地或居群的鑒別方面也有部分研究[12-13]。本研究以甘草全基因組序列為參考,通過對不同主產(chǎn)地甘草的測序數(shù)據(jù)進行分析比較,挖掘新疆、甘肅和內(nèi)蒙古杭錦旗產(chǎn)地甘草的SNP 鑒別位點信息,可用于鑒別甘草的產(chǎn)地來源,為甘草藥材質(zhì)量穩(wěn)定和產(chǎn)業(yè)健康有序發(fā)展提供科學依據(jù)。研究結(jié)果表明,鑒別新疆與甘肅產(chǎn)地的SNP 位點組合各含有40 個堿基,鑒別內(nèi)蒙古杭錦旗產(chǎn)地甘草的SNP位點為20個堿基。從SNP堿基分布來看,以堿基A 和T 為主,占比高達74%。運用基因組重測序方法,分析樣本的各SNP位點堿基信息,并與產(chǎn)地鑒別SNP 位點信息進行比較,可初步判斷該樣本的產(chǎn)地來源。同時,也可通過根據(jù)鑒別各產(chǎn)
地的SNP位點所在序列設計的引物進行擴增與測序,通過測序結(jié)果比較SNP 位點對產(chǎn)地來源進行判斷。但是,目前該方法工作量較大、成本較高,后續(xù)研究工作重點應加大樣本驗證數(shù)量及減少SNP 位點數(shù)量,降低技術成本、擴大技術推廣利用范圍。
中藥材產(chǎn)地鑒別技術的研究和產(chǎn)業(yè)化應用是當前中藥產(chǎn)業(yè)亟待解決的難題。中藥資源豐富,野生資源和各種栽培類型分布相對分散,給中藥產(chǎn)地鑒別帶來巨大的挑戰(zhàn)。傳統(tǒng)的性狀鑒別受個人主觀判斷影響,無法產(chǎn)業(yè)化推廣和應用?;诨蛐蛄泻突蚪M的鑒別技術具有通量高、鑒別準確及穩(wěn)定性強等優(yōu)點,對于傳統(tǒng)鑒別方法是較好的補充,可應用于中藥產(chǎn)地鑒別。但是,由于藥用植物基因組學基礎研究起步較晚、研究和檢測費用相對較高,分子標記技術的應用還存在一定限制性。隨著測序成本不斷下降及相關技術、設備的迭代更新,分子標記技術在中藥產(chǎn)地鑒別中的應用將越來越普遍,并逐漸形成可產(chǎn)業(yè)化推廣的鑒別技術,為中藥產(chǎn)業(yè)的監(jiān)督、監(jiān)管及健康發(fā)展提供技術支撐。