貢 嘎,羅潤波,陳建春,王一飛,索朗斯珠
(西藏農(nóng)牧學(xué)院動物科學(xué)學(xué)院,西藏 林芝860000)
巴氏桿菌是革蘭陰性小桿菌,該病原菌分布廣泛。主要引起牛和水牛出血性敗血癥,主要為頭部和頸部水腫,淋巴結(jié)腫脹、出血。根據(jù)莢膜多糖抗原不同,多殺性巴氏桿菌可分為A、B、D、E 型和F型5 個血清型;根據(jù)脂多糖抗原不同,可以分為1 ~16 個血清型[1]。本研究擬以本實驗室臨床分離的1 株牦牛巴氏桿菌菌株為研究材料,利用SMRT 方法對分離菌株進行全基因組測序,解析了西藏牦牛源巴氏桿菌菌株的全基因組序列。通過基因組學(xué)和比較基因組學(xué)對該菌株的基本特征進行了分析,為牦牛巴氏桿菌病的進一步研究提供數(shù)據(jù)支撐。
1.1 材料
1.1.1 菌株 測序菌株:牦牛巴氏桿菌1 株,由本實驗室2016 年12 月從西藏林芝某地病死牦牛肺臟中分離,通過生化及PCR 鑒定,同時進行KM 小鼠致病性實驗和菌株莢膜血清分型(A),保存。
1.1.2 主要試劑 ExTaqDNA 聚合酶,dNTPs,DNA Marker、10%新生牛血清、TSA 培養(yǎng)基、細菌基因組提取試劑盒等試劑,購自武漢科前動物試劑有限公司。
1.2 方法
1.2.1 細菌全基因組的提取、測序及序列組裝 用細菌基因組提取試劑盒進行基因組的提取。通過SART法對牦牛源巴氏桿菌全基因組測序、應(yīng)用組裝軟件Canu[2-4]對過濾后的Subreads 數(shù)據(jù)進行組裝。組裝工作由北京百邁客生物科技有限公司完成。
1.2.2 牦牛巴氏桿菌完整基因組注釋與分析
(1)編碼基因預(yù)測:通過軟件Prodigal[5]對組裝后的基因組進行編碼基因預(yù)測;(2)重復(fù)序列預(yù)測:使用Repeat Masker[6]軟件對細菌基因組進行重復(fù)序列的預(yù)測;(3)非編碼RNA 預(yù)測:使用軟件tRNAscan-SE[7]預(yù)測基因組中的 tRNA,使用軟件 Infernal 1.1[9]基于Rfam[9]數(shù)據(jù)庫預(yù)測基因組中的rRNA;(4)假基因預(yù)測:通過軟件GenBlastA[8]比對,在基因組上尋找同源的基因序列(可能的基因),然后利用軟件GeneWise[9]尋找基因序列中的不成熟的終止密碼子及移碼突變,預(yù)測測序菌株的假基因。
1.3 牦牛巴氏桿菌比較基因組學(xué)分析
1.3.1 基因組共線性分析 使用軟件MCScanX[10]根據(jù)共線性關(guān)系對測序樣品與參考基因組進行分析。
1.3.2 基因家族與特有基因分析 使用OrthoMCL軟件對測序菌株預(yù)測出的蛋白序列和參考基因組的蛋白序列進行家族分類,之后對于基因家族進行分析,包括統(tǒng)計分析菌株特有的基因家族,菌株共有的基因家族。
1.3.3 物種間進化關(guān)系分析 使用測序物種與參考物種均為單拷貝的基因家族中的基因,利用PhyML[11]軟件構(gòu)建進化樹,研究物種間的進化關(guān)系。
2.1 所測牦牛巴氏桿菌的基本特征 本研究測定的巴氏桿菌菌株于2016 年分離自西藏牦牛,為A 型莢膜牛巴氏桿菌。
2.2 測序及組裝結(jié)果 組裝得到總長2 297 457 bp完整基因組,其GC 含量為40.3%。
2.3 基因組注釋與分析結(jié)果 (1)編碼基因預(yù)測結(jié)果:預(yù)測編碼基因數(shù)量2096,預(yù)測基因序列總長度2 047 410 bp;(2)重復(fù)序列預(yù)測結(jié)果:原核生物基因組中重復(fù)序列含量極少。本次測序菌株中預(yù)測出的重復(fù)序列總長度為4 739 bp,基因組中重復(fù)序列含量0.21%;(3)非編碼RNA 預(yù)測結(jié)果:非編碼RNA 即不編碼蛋白質(zhì)的RNA,本次測序菌株中預(yù)測出19 個rRNA 非編碼數(shù)量,59 個tRNA 非編碼數(shù)量;(4)假基因預(yù)測:假基因是具有與功能基因相似的序列,但由于插入、缺失等突變以致失去了原有的功能。本研究得到的假基因數(shù)量為3,假基因總長度為736 bp。
2.4 牦牛巴氏桿菌比較基因組學(xué)分析
2.4.1 基因組共線性分析 將測序樣品的蛋白序列分別與每一個參考基因組的蛋白序列進行BLAST比對,然后根據(jù)同源基因在基因組序列上的位置信息得到核酸水平上的共線性關(guān)系分析,共線性良好。
2.4.2 基因家族與特有基因分析 共得到2 105個基因族。1 株測序菌株與2 株參考菌株共有的基因族類(核心基因族)有1 483 個,占總基因組的70.45%。分析同時只在兩株菌中共有的基因族發(fā)現(xiàn),參考菌株P(guān)asteurella multocida 與測序菌株Xizang Pasteurella 共有的基因族(394 個)明顯多于其他組合。本次分離菌株與參考菌株共有的功能1 964 個,分離菌株特有的基因數(shù)量有132 個。部分結(jié)果的統(tǒng)計信息和維恩圖見表1 和中插彩版圖1。
表1 基因家族分類統(tǒng)計
根據(jù)上述聚類的基因家族的結(jié)果,分別統(tǒng)計測 序菌株和參考菌株的菌株特有基因(菌株特有基因家族中的基因和未參與到上述聚類的基因之和),統(tǒng)計結(jié)果見表2。
表2 測序菌株和參考菌株的菌株特有基因統(tǒng)計
2.4.3 物種間進化關(guān)系分析 使用測序物種與參考物種均為單拷貝的基因家族中的基因,通過物種間進化分析顯示,與參考的Pasteurella multocida 較近。見圖2。
圖2 物種間進化關(guān)系分析
本研究提取分離菌株的全基因組,通過SMRT測序,其基因組大小為2.3 Mb。使用Canu 軟件進行組裝,達到細菌基因組比較基因組分析要求。
在細菌的基因組中,基因在進化過程中可能會發(fā)生突變,導(dǎo)致原有的基因功能喪失而產(chǎn)生的一類基因,這類基因則被稱為假基因。我們利用已預(yù)測得到的蛋白序列與Swiss-Prot 數(shù)據(jù)庫中收錄的細菌的蛋白序列,通過軟件GenBlastA 比對,在基因組上尋找同源的基因序列(可能的基因),然后利用軟件GeneWise 尋找基因序列中的不成熟的終止密碼子及移碼突變,得到假基因。杜慧慧等[12]對不同毒力的牛源A 型Pm 菌株進行假基因預(yù)測,得出假基因數(shù)目越多其毒力相對較弱,反之假基因數(shù)目越少則毒力相對越強。本次得到假基因數(shù)目為3,數(shù)目相對較少,因此懷疑本次分離菌株毒力相對較弱。
本次測序的菌株和參考菌株(Mannheimia haeemolytica、Pasteurella multocica)基因組進行全基因組共線性分析,參考菌株與測序菌株之間共線性良好。
對測序菌株預(yù)測出的蛋白序列和參考基因組的蛋白序列進行家族分類,共得到2 105 個基因族。各個族在3 株菌種的分布如中插彩版圖1 所示,3株菌共有的基因族類(核心基因族)有1 483 個,占總基因組的70.45%。分析同時只在兩株菌中共有的基因族發(fā)現(xiàn),Pasteurella multocida 與Xizang Pasteurella 共有的基因族(394 個)明顯多于其他組合。本次分離菌株與參考菌株共有的功能1 964 個,分離菌株特有的基因數(shù)量有132 個。
基因組學(xué)是當前生命科學(xué)領(lǐng)域最前沿的學(xué)科之一,是研究病原微生物的分子致病機理,篩選有效的免疫原性因子和藥物紀標等的基礎(chǔ)。本研究測序牦牛源巴氏桿菌全基因組序列,在基因組測序的基礎(chǔ)上,進一步開展編碼基因、重復(fù)序列、非編碼RNA、假基因等進行預(yù)測,最后對基因組共線性、基因家族與特有基因以及物種間進化關(guān)系分析,為牦牛巴氏桿菌病的防治提供新的思路。