劉沐桑 張莉莉 呂桂霞 沈永年 胡素泉 劉維達(dá)
常見(jiàn)醫(yī)學(xué)真菌DNA條形碼BLAST數(shù)據(jù)庫(kù)的建立
劉沐桑 張莉莉 呂桂霞 沈永年 胡素泉 劉維達(dá)?
目的: 構(gòu)建我國(guó)重要醫(yī)學(xué)真菌DNA條形碼BLAST數(shù)據(jù)庫(kù)。方法: 對(duì)28種醫(yī)學(xué)真菌的ITS-rDNA序列(DNA條形碼)進(jìn)行測(cè)定和匯總,并使用NCBI提供的數(shù)據(jù)庫(kù)工具將匯總的序列構(gòu)建成DNA條形碼數(shù)據(jù)庫(kù)。結(jié)果: 構(gòu)建的醫(yī)學(xué)真菌DNA條形碼數(shù)據(jù)庫(kù)包括28種中國(guó)常見(jiàn)醫(yī)學(xué)真菌的DNA條形碼序列,利用數(shù)據(jù)庫(kù)對(duì)待測(cè)真菌標(biāo)本的DNA條形碼序列進(jìn)行檢索,能進(jìn)一步確定真菌類(lèi)型。結(jié)論: 本實(shí)驗(yàn)構(gòu)建的醫(yī)學(xué)真菌DNA條形碼數(shù)據(jù)庫(kù)可以用于醫(yī)學(xué)真菌的分子鑒別。
醫(yī)學(xué)真菌; DNA條形碼; BLAST檢索; 數(shù)據(jù)庫(kù)
DNA條形碼(DNA barcode)是一種統(tǒng)一的DNA標(biāo)志序列,通常來(lái)源于某個(gè)基因或者它的部分序列,能提供對(duì)某一大類(lèi)生物物種適用的分子鑒定標(biāo)志。1能夠在人體致病的真菌已近400種,人的深部以及淺表真菌感染都有增多趨勢(shì),2且還不斷出現(xiàn)新的真菌物種感染人體的報(bào)道。3由于不同醫(yī)學(xué)真菌的侵襲定植性質(zhì)、毒力和藥敏譜以及相關(guān)疾病的預(yù)后常有很大不同,因此準(zhǔn)確地鑒定菌種對(duì)臨床成功診治有重要意義。建立醫(yī)學(xué)真菌的DNA條形碼系統(tǒng)可以實(shí)現(xiàn)對(duì)真菌分子鑒別的統(tǒng)一化,是一項(xiàng)有意義的科學(xué)實(shí)踐。
目前真菌界最通用的DNA條形碼序列是核糖體DNA的內(nèi)轉(zhuǎn)錄間區(qū)(internal transcribed spacer,ITS)序列,不同于動(dòng)植物常用的細(xì)胞色素基因序列。4ITS基因作為分子標(biāo)記的優(yōu)點(diǎn)是拷貝數(shù)多,而且擴(kuò)增過(guò)程簡(jiǎn)便,需要引物組合的數(shù)目也比較少。52012年發(fā)表的一項(xiàng)真菌DNA條形碼綜合研究表明,ITS序列基本適合用于真菌條形碼編制。6在此前的一項(xiàng)研究中,對(duì)我國(guó)臨床上最常見(jiàn)的8種醫(yī)學(xué)真菌做了DNA條形碼的初步研究,發(fā)現(xiàn)基于ITS區(qū)序列的條形碼對(duì)真菌種內(nèi)保守,而在種間具有顯著差異,條形碼可以用于鑒別我國(guó)常見(jiàn)真菌的種類(lèi)。7
基本局域連配檢索工具(basic local alignment search tool,BLAST)是由美國(guó)國(guó)家生物信息中心(National Center for Biotechnology Information,NCBI)開(kāi)發(fā)的序列查找和對(duì)比工具,BLAST及其相關(guān)數(shù)據(jù)庫(kù)是快速進(jìn)行數(shù)據(jù)查找匹配的有力工具。8目前BLAST工具及其數(shù)據(jù)庫(kù)可以通過(guò)自行構(gòu)建的方法脫機(jī)運(yùn)行,即通過(guò)本地?cái)?shù)據(jù)庫(kù)進(jìn)行查找,而無(wú)需連接到美國(guó)NCBI的中央數(shù)據(jù)庫(kù)。本地?cái)?shù)據(jù)庫(kù)可以由研究者自己提供的序列構(gòu)建,使得查找更具針對(duì)性,速度更快,結(jié)果更準(zhǔn)確。
本研究中,我們測(cè)定常見(jiàn)的28種醫(yī)學(xué)真菌的ITS序列,用于醫(yī)學(xué)真菌的物種鑒別,從而覆蓋臨床大多
數(shù)常見(jiàn)真菌感染病例。在此基礎(chǔ)上,我們構(gòu)建了我國(guó)常見(jiàn)真菌感染的醫(yī)學(xué)真菌DNA條形碼數(shù)據(jù)庫(kù)。該數(shù)據(jù)庫(kù)整合了BLAST檢索服務(wù)工具,臨床標(biāo)本測(cè)序結(jié)果可通過(guò)該服務(wù)對(duì)數(shù)據(jù)庫(kù)進(jìn)行檢索和比對(duì),從而起到快速診斷的作用。
1.1 菌株 本研究使用菌株取自中國(guó)微生物菌種保藏委員會(huì)醫(yī)學(xué)真菌保藏中心標(biāo)準(zhǔn)菌株,具體如下:斷發(fā)毛癬菌(Trichophyton tonsurans)、克柔念珠菌(Issatchenkia orientalis)、季也蒙念珠菌(Pichia guilliermondii)、新生隱球菌(Cryptococcus neoformans)、阿薩西毛孢子菌(Trichosporon asahii)、糠秕馬拉色菌(Malassezia furfur)、球形馬拉色菌(Malassezia globosa)、合軸馬拉色菌 (Malassezia sympodialis)、黃曲霉(Aspergillus flavus)、黑曲霉(Aspergillus niger)、煙曲霉(Aspergillus fumigatus)、多變根毛霉 (Rhizomucor variabilis)、茄病鐮刀菌(Fusarium solani)、串珠鐮刀菌(Fusarium verticillioides)、鏈格孢霉(Alternaria alternata)、出芽短梗霉(Aureobasidium pullulans)、卡氏枝孢瓶霉(Cladophialophora carrionii)、新月彎孢霉(Curvularia lunata)、膝狀彎孢霉(Cochliobolus geniculatus)、皮炎外瓶霉(Exophiala dermatitidis)、甄氏外瓶霉(Exophiala jeanselmei)、須癬毛癬菌(Trichophyton mentagrophytes)、近平滑念珠菌(Candida parapsilosis)、石膏樣小孢子菌(Microsporium gypseum)、熱帶念珠菌(Candida tropicalis)、紅色毛癬菌株(Trichophyton rubrum)、光滑念珠菌(Candida glabrata)、白念珠菌(Candida albicans)。
1.2 試劑與儀器 DNA提取使用Fast DNA?SPIN試劑盒(美國(guó)MP Bio公司)。PCR實(shí)驗(yàn)用TaKaRa TaqTM聚合酶、dNTP、PCR緩沖液、100 bp電泳分子量Marker均來(lái)源于寶生物工程(大連)有限公司。PCR和測(cè)序所用引物由上海生工公司合成。核酸提取使用FastDNA SPN試劑盒及其配套的Bio 101 Fastprep-24核酸提取儀都是購(gòu)自MP Bio公司(美國(guó))。培養(yǎng)基為實(shí)驗(yàn)室自行配制的馬鈴薯葡萄糖瓊脂培養(yǎng)基(PDA)。
1.3 DNA提取和純化 樣品真菌接種于PDA培養(yǎng)基,28℃培養(yǎng)7~10 d,收取上層真菌約100mg放置到5 mL玻璃組織研磨器中進(jìn)行研磨,并按照FastDNA SPN試劑盒說(shuō)明書(shū)進(jìn)行真菌DNA的提取。詳細(xì)如下:先加入1 mL CLS-Y緩沖液振蕩混勻,然后孵育20 min(室溫),放到Fastprep核酸提取儀上以5.0/s的速度振蕩30 s,再孵育30 min;然后用14 000 r/min離心5 min,上清移至新管中;加入600μL Binding matrix混勻后進(jìn)行5 min孵育;然后在12 000 r/min離心1 min,取沉淀加入500μL SEWS-M吹打混勻,再次離心取沉淀干燥30 min;加入100μL DES吹打混勻,12 000 r/min過(guò)柱離心洗脫1min。洗脫下來(lái)的核酸放-20℃保存?zhèn)溆谩?/p>
1.4 PCR擴(kuò)增與測(cè)序 根據(jù)文獻(xiàn),采用了真菌通用引物ITS1(正向:5′-TCCGTAGGTGAACCTGCGG-3′)和ITS4(反向:5′-TCCTCCGCTTATTGATATGC-3′)擴(kuò)增ITS基因。PCR反應(yīng)體系如下:2.5 mmol/L dNTPs 4μL,10×緩沖液5μL,10 mmol/L MgCl23μL,10 μmol/L引物各1μL,Taq DNA聚合酶2 U,模板DNA 2μL,雙蒸水將余下體積補(bǔ)至總體積50μL。反應(yīng)條件:預(yù)變性95℃ 5 min;變性95℃ 45 s;退火53℃ 45 s;延伸 72℃ 75s,共30個(gè)循環(huán),最末延伸72℃ 7 min。PCR產(chǎn)物送至上海生工生物公司純化并測(cè)序。測(cè)序結(jié)果使用SeqMan軟件(DNA Star軟件包)進(jìn)行拼裝,并根據(jù)測(cè)序峰圖對(duì)序列進(jìn)行手工核對(duì),形成完整ITS區(qū)核酸序列,存為FASTA格式文本文件,即醫(yī)學(xué)真菌的DNA條形碼序列。
1.5 整合BLAST檢索服務(wù)數(shù)據(jù)庫(kù)的構(gòu)建 在我單位工作站計(jì)算機(jī)上安裝美國(guó)國(guó)家生物信息中心(NCBI)提供的BLAST-2.2.29軟件工具包。首先將28株醫(yī)學(xué)真菌的ITS區(qū)核酸序列存為單一的FASTA格式文件ITS_barcode_db.fas,然后使用BLAST-2.2.29工具包的makeblastdb命令對(duì)上述序列文件進(jìn)行數(shù)據(jù)格式化和索引化(參數(shù):-in ITS_barcode_db.fas-db type nucl),形成可供BLAST檢索的本地?cái)?shù)據(jù)庫(kù)。
1.6 數(shù)據(jù)庫(kù)的檢索使用 取我中心保藏的經(jīng)過(guò)鑒定的煙曲霉臨床株,標(biāo)記為h 47號(hào)真菌標(biāo)本。按1.3~1.4中描述方法提取DNA擴(kuò)增ITS區(qū)DNA條形碼并進(jìn)行單側(cè)測(cè)序,測(cè)序結(jié)果取中段峰圖清晰308 bp保存為test1.txt文件。使用本地?cái)?shù)據(jù)庫(kù)的blastn命令將待檢索測(cè)序結(jié)果對(duì)數(shù)據(jù)庫(kù)進(jìn)行檢索(參數(shù):-query test1.txt-db ITS_barcode_db.fas-out result1.txt),結(jié)果自動(dòng)存于result1.txt文件。
2.1 真菌DNA條形碼序列 所得28株醫(yī)學(xué)真菌的條形碼序列(ITS rDNA序列)最短的是鏈格孢霉(301 bp),最長(zhǎng)的是糠秕馬拉色菌(806 bp)。序列間差異最小的是斷發(fā)毛癬菌和須癬毛癬菌(7 bp),差異最大的是季也蒙念珠菌和糠秕馬拉色菌(349 bp)。
2.2 BLAST檢索服務(wù)的數(shù)據(jù)庫(kù)的建立 序列數(shù)據(jù)經(jīng)過(guò)BLAST-2.2.29工具包格式化后生成數(shù)據(jù)庫(kù)由以下三個(gè)文件構(gòu)成,分別為ITS_barcod_db.fas.nhr、ITS_ barcod_db.fas.nin和ITS_barcod_db.fas.nsq。上述三個(gè)文件分別是數(shù)據(jù)庫(kù)的庫(kù)索引(indices),序列(sequences)和頭(headers)文件,三者共同構(gòu)成完整數(shù)據(jù)庫(kù)。根據(jù)Makeblastdb命令運(yùn)行結(jié)果判斷數(shù)據(jù)庫(kù)構(gòu)建成功。數(shù)據(jù)庫(kù)包含共28條核酸序列,總?cè)萘?4 337
字節(jié)。
2.3 數(shù)據(jù)庫(kù)的檢索應(yīng)用實(shí)例(待測(cè)標(biāo)本h 47號(hào)的ITS-rDNA測(cè)序結(jié)果) 對(duì)數(shù)據(jù)庫(kù)進(jìn)行Blast檢索,結(jié)果見(jiàn)圖1和圖2。Blast檢索的相似顯著性E值(EValue)的閾值默認(rèn)為10-10。數(shù)據(jù)庫(kù)中檢索到的與提交序列具有顯著相似性的醫(yī)學(xué)真菌DNA條形碼序列(E值<10-10)共有20條。與提交序列最為相似的三條數(shù)據(jù)庫(kù)記錄均為曲霉菌,分別是煙曲霉,黑曲霉和黃曲霉。相似性最顯著的煙曲霉序列,其相似度打分為569,相似顯著性E值為10-165。圖2為數(shù)據(jù)庫(kù)的blast工具(核酸序列檢索)對(duì)提交序列與煙曲霉序列進(jìn)行聯(lián)配比對(duì)的結(jié)果。兩條序列完全相同(identtities=100%),而且提交序列與數(shù)據(jù)庫(kù)中存儲(chǔ)的煙曲霉序列反向互補(bǔ)(Strand=Plus/Minus)。根據(jù)標(biāo)本的DNA條形碼對(duì)醫(yī)學(xué)真菌DNA條形碼數(shù)據(jù)庫(kù)進(jìn)行檢索和比對(duì)的結(jié)果,我們判定h 47號(hào)標(biāo)本為煙曲霉。此結(jié)論與我中心根據(jù)h 47號(hào)臨床分離株的菌落形態(tài)學(xué)和顯微形態(tài)學(xué)進(jìn)行的標(biāo)準(zhǔn)鑒定結(jié)果一致。
圖1 h 47號(hào)標(biāo)本的ITS-rDNA序列在本數(shù)據(jù)庫(kù)的檢索結(jié)果
圖2 h 47號(hào)標(biāo)本的ITS-rDNA序列與煙曲霉序列聯(lián)配比對(duì)結(jié)果(部分)
真菌是在人體引起感染的常見(jiàn)病原體之一,常引起淺部真菌病。此外,近年來(lái)由于移植手術(shù)和免疫抑制劑的廣泛應(yīng)用,深部真菌病對(duì)人類(lèi)健康的威脅也日漸增加。因此,對(duì)醫(yī)學(xué)真菌進(jìn)行分類(lèi)鑒別工作的重要性也尤其凸顯出來(lái)。分子鑒別是目前除宏觀形態(tài)學(xué)和顯微形態(tài)學(xué)外的最有效手段,具有操作簡(jiǎn)便、速度快和無(wú)需專(zhuān)門(mén)培訓(xùn)技術(shù)人員等許多優(yōu)越性。而DNA條形碼作為統(tǒng)一鑒別生物物種的分子生物學(xué)技術(shù),在真菌鑒別上也得到了廣泛應(yīng)用。9
真菌的ITS和核糖體RNA編碼DNA(ITS-rDNA)是最早制定的真菌DNA條形碼序列;在論證過(guò)程,也有人嘗試使用線(xiàn)粒體COX1基因序列作為DNA條形碼來(lái)實(shí)現(xiàn)真菌在物種水平的鑒別和分類(lèi)。10但是,最近一項(xiàng)較大規(guī)模的研究指出,作為真菌DNA條形碼的標(biāo)記分子,ITS-rDNA序列相對(duì)其他真菌基因具有較大優(yōu)點(diǎn)。6因此,在本研究中,我們基于ITS-rDNA序列的真菌DNA條形碼的測(cè)定和匯總,并使用美國(guó)生物信息中心提供的數(shù)據(jù)庫(kù)工具,最終使我們的數(shù)據(jù)形成醫(yī)學(xué)真菌DNA條形碼數(shù)據(jù)庫(kù)。與原始的FASTA格式的序列文件不同,構(gòu)建成功的數(shù)據(jù)庫(kù)文件為二進(jìn)制執(zhí)行代碼,不可進(jìn)行文本閱讀和編輯,但是可使用BLAST檢索工具將未知序列提交數(shù)據(jù)庫(kù)進(jìn)行匹配查找,并將提交序列與數(shù)據(jù)庫(kù)中的序列做聯(lián)配比對(duì)。經(jīng)過(guò)試驗(yàn),通過(guò)我們的醫(yī)學(xué)真菌DNA條形碼數(shù)據(jù)庫(kù)的比對(duì)鑒別結(jié)果與傳統(tǒng)形態(tài)學(xué)鑒定的結(jié)果一致,數(shù)據(jù)庫(kù)可有效輔助醫(yī)學(xué)真菌的鑒別。而且檢索和比對(duì)分析過(guò)程完全在本地計(jì)算機(jī)進(jìn)行,無(wú)需連接網(wǎng)絡(luò),更無(wú)需連接到美國(guó)生物信息中心(NCBI)的生物序列數(shù)據(jù)庫(kù)。
為便于推廣數(shù)據(jù)庫(kù)的應(yīng)用,在本數(shù)據(jù)庫(kù)中我們嘗試使用中文字符標(biāo)注真菌名稱(chēng),但是由于目前NCBI提供的BLAST工具包(2.2.29版)尚不支持多語(yǔ)言功能,格式化數(shù)據(jù)庫(kù)時(shí)出錯(cuò)。因此,我們?cè)谛蛄忻Q(chēng)后使用豎括號(hào)(‖)間隔標(biāo)注漢語(yǔ)拼音名稱(chēng),順利通過(guò)數(shù)據(jù)庫(kù)格式化。這樣,我們對(duì)數(shù)據(jù)庫(kù)進(jìn)行檢索和比對(duì)操作時(shí),結(jié)果可以同時(shí)顯示拉丁文學(xué)名和漢語(yǔ)拼音標(biāo)注,更加方便了使用。
本研究在對(duì)28株我國(guó)常見(jiàn)醫(yī)學(xué)真菌的條形碼序列(即ITS-rDNA序列)的測(cè)定和匯總的基礎(chǔ)上,構(gòu)建了我國(guó)醫(yī)學(xué)真菌DNA條形碼數(shù)據(jù)庫(kù)。該數(shù)據(jù)庫(kù)可用于對(duì)未知醫(yī)學(xué)真菌標(biāo)本的條形碼測(cè)序結(jié)果進(jìn)行檢索和比對(duì),從而實(shí)現(xiàn)基于DNA條形碼的醫(yī)學(xué)真菌分子鑒別。在以后的工作中,我們將繼續(xù)增加醫(yī)學(xué)真菌DNA條形碼數(shù)據(jù)庫(kù)的菌種數(shù)量,并計(jì)劃建立相應(yīng)網(wǎng)站加以推廣和應(yīng)用。
1 Hebert PD,Ratnasingham S,deWaard JR.Barcoding animal life:cytochrome c oxidase subunit 1 divergences among closely related species.Proc Biol Sci,2003,270(Suppl 1):S96-99.
2HofH.Developments in the epidemiolgy of invasive fungal infec-
tions-implications for the empiric and targeted antifungal therapy.Mycoses,2008,51(Suppl 1):1-6.
3Wang JL,Chang CH,Young-XY,et al.Systematic review and meta-analysis of the tolerability and hepatotoxicity of antifungals in empirical and definitive therapy for invasive fungal infection. Antimicrob Agents Chemother,2010,54(6):2409-2419.
4 Seifert KA,Crous PW.The all-fungi DNA barcoding campaign (FunBOL).Persoonia,2008,20:106.
5 Taylor JW,Geiser DM,Burt A,et al.The evolut ionary biology and population genetics underlying fungal strain typing.Clin Microbiol Rev,1999,2(1):126-146.
6 Schoch CL,Seifert KA,Huhndorf S,et al.Nuclear ribosomal internal transcribed spacer(ITS)region as a universal DNA barcode marker for Fungi.Proc Natl Acad Sci USA,2012,17 (16):6241-6246.
7劉沐桑,梅繯,呂桂霞,等.8種病原真菌DNA條形碼的構(gòu)建和應(yīng)用評(píng)價(jià).中國(guó)麻風(fēng)皮膚病雜志,2012,(5):311-313.
8 Zhang Z,Schwartz S,Wagner L,et al.A greedy algorithm for aligning DNA sequences.JComput Biol,2000,7(1-2):203-214.
9Begerow D,Nilsson H,Unterseher M,et al.Current state and perspectives of fungal DNA barcoding and rapid identification procedures.App l Microbiol Biotechnol,2010,87(1):99-108.
10 Seifert KA,Samson RA,Dewaard JR,et al.Prospects for fungus identification using CO1 DNA barcodes,with Penicillium as a test case.Proc Natl Acad Sci USA,2007,104(10):3901-3906.
(收稿:2014-10-09 修回:2014-11-16)
Construction of BLAST database ofmedical fungiDNA barcode
LIU Mu-sang,ZHANG Li-li,LVGui-xia,etal.Institute ofDermatology,Chinese Academy ofMedical Sciences and Peking Union Medical College,Nanjing,210042
Objective:To construct BLAST database ofmedical fungi DNA barcode.M ethods:ITS-rDNA regions(DNA barcode)of 28 species of themedical fungiweremeasured and the DNA barcode data base was constructed by using database tools provided by National Center for Biotechnology Information(NCBI).Results:Twenty-eighty DNA barcode sequences of medical fungi DNA barcode database were established.The specie of fungi could be confirmed by BLAST database ofmedical fungi DNA barcode.Conclusion:BLAST database ofmedical fungiDNA barcodewere constructed successfully and can be used formolecular identification ofmedical fungi.
medical fungi;DNA barcode;BLAST search;database
人力資源和社會(huì)保障部留學(xué)人員科技活動(dòng)項(xiàng)目擇優(yōu)資助項(xiàng)目協(xié)和青年基金和中央高?;究蒲袠I(yè)務(wù)費(fèi)專(zhuān)項(xiàng)資金(編號(hào): 33320140189)江蘇省臨床醫(yī)學(xué)科技專(zhuān)項(xiàng)(編號(hào):BL2012003)科技部科技基礎(chǔ)性工作專(zhuān)項(xiàng)(編號(hào):2013FY113700)
中國(guó)醫(yī)學(xué)科學(xué)院北京協(xié)和醫(yī)學(xué)院皮膚病研究所,南京,210042?通信作者