曹際娟賈俊濤許龍巖趙麗青
沙門氏菌PFGE分型非計(jì)量多維尺度分析法的研究*
曹際娟1賈俊濤2許龍巖3趙麗青2
目的探討沙門氏菌脈沖場(chǎng)凝膠電泳(PFGE)分型非計(jì)量多維尺度分析法(NMDS)。方法從國(guó)內(nèi)不同地區(qū)分離得到的24株沙門氏菌進(jìn)行PFGE分型,然后以非計(jì)量多維尺度法對(duì)PFGE分型進(jìn)行分析。結(jié)論將24株沙門氏菌顯示在三維空間,從視覺上直接揭示了表型特征相近的不同國(guó)家和地區(qū)沙門氏菌之間的相關(guān)性,為PFGE譜圖的分析提供了一種有用的工具。
沙門氏菌 脈沖場(chǎng)凝膠電泳分型 非計(jì)量多維尺度分析法
在食源性致病菌中,沙門氏菌(SA)的危害性極為嚴(yán)重,因此應(yīng)將其列為首選控制目標(biāo)。脈沖場(chǎng)凝膠電泳技術(shù)(pulsed field gel electrophoresis,PFGE)具有分型能力強(qiáng)、分辨能力高、可重復(fù)性強(qiáng)等優(yōu)點(diǎn),是目前細(xì)菌分子分型方法的金標(biāo)準(zhǔn)[1]。
細(xì)菌PFGE帶型屬于高維數(shù)據(jù),即每個(gè)菌株擁有很多不同的帶型。高維數(shù)據(jù)由于數(shù)據(jù)結(jié)構(gòu)復(fù)雜無(wú)法直接表示在低維空間(二維平面或三維空間),其數(shù)據(jù)特征很難被發(fā)現(xiàn)。多維尺度法(multidimensional scaling,MDS)是一種無(wú)監(jiān)督的用于高維數(shù)據(jù)降維的可視化工具。MDS可以分為計(jì)量多維尺度法(metric multidimensional scaling,MMDS)和非計(jì)量多維尺度法(nonmetric multidimensional scaling,NMDS)。本研究首先采用聚類分析法對(duì)進(jìn)出口食品中分離的沙門氏菌PFGE圖譜進(jìn)行分子分型,同時(shí),探索采用NMDS來(lái)反映食品中不同沙門氏菌PFGE帶型之間的差異程度,為沙門氏菌的分子流行病學(xué)研究及沙門氏菌引起的食源性疾病溯源提供技術(shù)基礎(chǔ)。
1.材料
從國(guó)內(nèi)不同地區(qū)分離得到的24株沙門氏菌。PFGE相對(duì)分子量標(biāo)準(zhǔn)用布倫登盧普沙門氏菌H9812(Salmonella Braenderup),由廣東省疾病預(yù)防控制中心贈(zèng)送。
一次性血瓊脂平板,廣州環(huán)凱公司;限制性內(nèi)切酶Xba I、Trisbase,美國(guó)Promega公司;SLS(Sodium lauroyl Sarcosine)、SDS,美國(guó)Sigma公司;蛋白酶K,德國(guó)Merck;SeaKem Gold瓊脂糖,美國(guó)Biorad公司。Chef Mapper脈沖場(chǎng)電泳儀、Gel Doc XR凝膠成像系統(tǒng),美國(guó)BIO-RAD公司。
2.脈沖場(chǎng)凝膠電泳[4]
參照美國(guó)PulseNet的沙門氏菌PFGE分子分型標(biāo)準(zhǔn)方法。將酶切后的膠塊置于10孔梳齒上,緩慢倒入1%SKG瓊脂糖。待凝固后,放入盛有2.2L 0.5× TBE緩液的電泳槽中。在14℃、脈沖時(shí)間2.16~63.8s條件下,電泳18h;電泳完畢后,用EB染色30m in,脫色90m in,最后用GelI 3ac EQ拍攝圖像。
3.脈沖場(chǎng)凝膠電泳圖譜的非計(jì)量多維尺度分析
設(shè)X為高維數(shù)據(jù)矩陣,即原始空間中的點(diǎn)的集合,
式(1)中,x為觀察對(duì)象向量,n為X中觀察對(duì)象的個(gè)數(shù)。
D={dij}為X中第i個(gè)和第j個(gè)觀察對(duì)象的距離構(gòu)成的矩陣,1≤j<i≤n。
計(jì)量MDS的目標(biāo)是尋找二維或三維構(gòu)造空間中的n個(gè)點(diǎn)組成的點(diǎn)集Y={y1,y2,…,yn},Y為n×k(k=2或3)維構(gòu)造矩陣,使其距離矩陣H={hij}與D中對(duì)應(yīng)元素相對(duì)大小保持一致,即將D的對(duì)角線下方元素按升序排列di1j1≤di2j2≤…≤dimjm,m=n(n-1)/2,H的對(duì)角線下方元素也滿足hi1j1≤hi2j2≤…≤himjm,m=n(n-1)/2。
采用Kruskal算法求解Y[5]:
式(2)中Stress為脅強(qiáng)系數(shù),表示構(gòu)造矩陣與原始矩陣的距離偏差占原距離矩陣的比重。
在k固定的情況下,按照最小二乘單調(diào)回歸求得脅強(qiáng)系數(shù)的最小值,此時(shí)對(duì)應(yīng)的Y就為k維最佳擬合構(gòu)造矩陣,從而實(shí)現(xiàn)了X的降維。
將24株沙門氏菌進(jìn)行PFGE分析,獲得菌株兩兩之間的Dice相似性矩陣S(S={sij})。按如下方法將相似性矩陣轉(zhuǎn)換為距離矩陣D(D={dij}):
式(3)中,i和j為菌株在矩陣X中的序號(hào)。
在MATLAB R2009b(Version 7.9.0.529)中完成NMDS分析的所有步驟。
首先計(jì)算k=2時(shí)的脅強(qiáng)系數(shù),如果其小于0.20,則根據(jù)Y繪制二維平面圖;否則k=3,再次計(jì)算脅強(qiáng)系數(shù),如果其小于0.20,則根據(jù)Y繪制三維圖,如果脅強(qiáng)系數(shù)仍大于0.20,則表示X的數(shù)據(jù)結(jié)構(gòu)無(wú)法用計(jì)量MDS實(shí)現(xiàn)降維。
用Shepard圖來(lái)顯示NMDS的擬合效果。
1.脈沖場(chǎng)凝膠電泳結(jié)果
制備染色體全基因組DNA,用限制性內(nèi)切酶Xba I酶切,經(jīng)PFGE分離,產(chǎn)生10~16條DNA片段,所有菌株的基因組DNA顯示出良好的分型能力(圖1,圖2),分子質(zhì)量大小在(20~1100)kb之間。
圖1 沙門氏菌PFGE電泳圖(M:沙門氏菌H9812;1-12:SA1-SA12)
圖2 沙門氏菌PFGE電泳圖(M:沙門氏菌H9812;1-12:SA13-SA24)
3.非計(jì)量多維尺度分析
(1)沙門氏菌PFGE分型NMDS圖
k=2時(shí),脅強(qiáng)系數(shù)為0.22,大于0.20,因此在二維構(gòu)造空間中無(wú)法找到合適的點(diǎn);
k=3時(shí),脅強(qiáng)系數(shù)為0.14,小于0.20,因此在三維構(gòu)造空間中可以找到合適的點(diǎn),可以表示原始空間中的點(diǎn)。用MATLAB繪制NMDS三維圖(圖3)。
圖5顯現(xiàn)了24株沙門氏菌相似程度的遠(yuǎn)近,距離近的兩個(gè)點(diǎn)的相似性高,距離遠(yuǎn)的兩個(gè)點(diǎn)的相似性低。
圖3 沙門氏菌PFGE圖譜NMDS三維圖
圖3結(jié)合圖4可以準(zhǔn)確發(fā)現(xiàn)各點(diǎn)之間的相似程度:
從整體上看,24株沙門氏菌可以分成3群:SA2、SA5、SA11、SA19、SA21、SA22、SA23和SA29;SA1、SA8、SA12、SA18和SA20;SA4、SA6、SA10、SA13、SA14、SA15、SA16、SA17和SA24。SA3和SA7位于前兩群的交界處,分類不明顯。
進(jìn)一步觀察NMDS圖的局部。SA2、SA9和SA11非常接近,表明這3株菌相似性非常高。SA2和SA11都是德爾卑沙門氏菌,分別從歐洲進(jìn)口凍豬肚和從廣州出口凍雞中分離到的。SA9是從廣州同一家禽廠出口凍雞中分離出的烏普薩拉沙門氏菌。SA13-17是此次分離的5株傷寒沙門氏菌,這5株菌都位于第三群中,從圖3和圖4可以看出這5株菌之間相似的關(guān)系。它們大體上空間位置排列依次為:SA14、SA13、SA16、SA15和SA17。SA13和SA14相似性高,SA15、SA16和SA17相似性高,而排序兩端的菌之間相似性低。SA14、SA15和SA17是從廣東的出口食品中分離的,NMDS圖顯示這3株菌并不完全相關(guān)。SA13和SA16是從歐洲進(jìn)口的肉制品中分離到的,NMDS圖顯示這兩株菌也不相關(guān)。SA2、SA4和SA11是此次分離的3株德爾卑沙門氏菌,從圖3可以看出SA4與另外兩株菌的距離很遠(yuǎn),SA4與另兩株菌相似性差別較大。
按24株沙門氏菌不同來(lái)源分析,SA20分離自美國(guó)食品,它位于最外圍;SA8和SA21分離自澳大利亞食品,它們?cè)贜MDS圖中較為接近;SA12、SA19和SA23分離自烏拉圭食品,它們?cè)贜MDS圖中也較為接近;其余的18株沙門氏分離自廣東出口食品和歐洲進(jìn)口食品,這兩個(gè)來(lái)源的菌相互交錯(cuò)分布無(wú)法分開。
(2)擬合分析結(jié)果
NMDS的擬合效果Shepard圖見圖5。
Shepard圖是構(gòu)造空間中各點(diǎn)之間距離對(duì)原始空間中各點(diǎn)之間距離的散點(diǎn)圖,可以幫助確定NMDS分析的擬合效果。在NMDS分析中,Shepard圖也顯示了原始空間中各點(diǎn)之間的距離對(duì)其單調(diào)轉(zhuǎn)換的散點(diǎn)圖。圖5中圓圈的分布延1:1線向下彎曲,說明構(gòu)造空間中各點(diǎn)之間距離對(duì)原始空間中各點(diǎn)之間距離偏離較大,這也是NMDS比MMDS更靈活的體現(xiàn),MMDS試圖尋找構(gòu)造空間中的點(diǎn),使各點(diǎn)之間的距離盡可能地接近原始空間中各點(diǎn)之間的距離;而NMDS試圖探尋原始空間中各點(diǎn)之間距離的單調(diào)轉(zhuǎn)換,使構(gòu)造空間體現(xiàn)這種單調(diào)轉(zhuǎn)換的順序關(guān)系(相對(duì)距離)。
圖4 沙門氏菌PFGE圖譜NMDS三維圖的3個(gè)方向視圖
圖5 沙門氏菌PFGE圖譜NMDS擬合效果Shepard圖
非計(jì)量多維尺度分析法和傳統(tǒng)UPGMA聚類分析法是兩種常用的PFGE圖譜分析方法,在實(shí)際應(yīng)用過程中兩者在不同方面各有優(yōu)劣[2-3]。聚類分析法的實(shí)驗(yàn)結(jié)果是以聚類樹狀圖來(lái)呈現(xiàn)的。在樹狀圖中,相似性高的菌株在高相似性(“樹枝”方向)處聚為一類,相似性低的菌株在低相似性(“樹根”方向)處被歸為一類。因此,可通過樹狀圖直接判斷哪些菌株歸屬于同一類群。NMDS三維圖雖然可以清晰的表示各點(diǎn)之間的遠(yuǎn)近關(guān)系,但無(wú)法直接產(chǎn)生類似于聚類分析法中的類群信息。為了解決這一問題,可以通過K-均值聚類將NMDS三維圖中的點(diǎn)進(jìn)行聚類。本研究對(duì)此次分析的數(shù)據(jù)按3-5類別分別進(jìn)行K-均值聚類后發(fā)現(xiàn),其聚類結(jié)果與傳統(tǒng)PFGE分析采用的UPGMA聚類結(jié)果十分接近(數(shù)據(jù)未列出)[4]。
聚類分析法僅能將相近的菌株放在一簇,卻并不能體現(xiàn)菌株兩兩之間的異同。相比于聚類分析法,NMDS方法能更進(jìn)一步地顯示菌株之間的相似性關(guān)系,即能夠發(fā)現(xiàn)任意兩株菌之間的相似性關(guān)系。例如:從圖3可以看出5株傷寒沙門氏菌的空間位置排列依次為:SA14、SA13、SA16、SA15和SA17,這5株菌兩兩菌株之間的相似性關(guān)系一目了然。
NMDS是一種高維數(shù)據(jù)降維技術(shù),對(duì)原始數(shù)據(jù)會(huì)有信息損失,這是任何降維方法不可避免的問題。例如:SA2、SA9和SA11這3個(gè)點(diǎn)相似性100%,在高維空間中是重合的,但在NMDS圖上3點(diǎn)卻是分開的。這是因?yàn)镹MDS雖然在低維空間顯示了高維空間的數(shù)據(jù),卻在局部改變了原始的數(shù)據(jù)信息。因此,NMDS更適合做“全局”分析,在“局部”點(diǎn)的分析上應(yīng)該結(jié)合聚類分析法等不改變?cè)紨?shù)據(jù)信息的方法綜合進(jìn)行。
本研究分離的24株沙門氏菌分布在3個(gè)群、15種血清型中,雖然PFGE分型結(jié)果顯示型別較分散,無(wú)明顯規(guī)律,但通過本研究初步了解了進(jìn)出口食品中沙門氏菌的分子型別,為今后建立沙門氏菌分子分型數(shù)據(jù)庫(kù)、分析進(jìn)出口食品中沙門氏菌的分子流行趨勢(shì)提供基礎(chǔ)數(shù)據(jù)[5]。同時(shí),本研究建立了進(jìn)出口食品中沙門氏菌PFGE譜圖的NMDS分析方法,對(duì)進(jìn)出口食品中分離的24株沙門氏菌的高維帶型信息進(jìn)行降維,成功將24株沙門氏菌顯示在三維空間,從視覺上直接揭示了表型特征相近的不同國(guó)家和地區(qū)沙門氏菌之間的相關(guān)性,為PFGE譜圖的分析提供了一種有用的工具,進(jìn)一步促進(jìn)PFGE方法在食品中病原菌污染源的追蹤和溯源、進(jìn)出口食品把關(guān)以及食源性疾病的控制等方面的應(yīng)用。
1.李燕俊,趙熙,楊寶蘭,等.腸炎沙門氏菌脈沖場(chǎng)凝膠電泳分型研究.衛(wèi)生研究,2005,34(3):338-340.
2.王麗麗,徐建國(guó).脈沖場(chǎng)凝膠電泳技術(shù)(PFGE)在分子分型中的應(yīng)用現(xiàn)狀.疾病監(jiān)測(cè),2006(21)5:276-279.
3.陳太基.封幼玲.脈沖場(chǎng)凝膠電泳用于李斯特菌分型及分子流行病學(xué)研究.中國(guó)人獸共患病雜志,2000,16(1):90-93.
4.許龍巖,袁慕云,劉靜宇,等.進(jìn)出口食品中沙門氏菌PFGE分型及耐藥研究.檢驗(yàn)檢疫學(xué)刊,2010,20(2):14-17.
5.Kruskal JB.Multidimensional scaling:a numerical method.Psychometrika,1964,29(2):115-129.
(責(zé)任編輯:郭海強(qiáng))
遼寧省自然科學(xué)基金項(xiàng)目(項(xiàng)目編號(hào)20102080)
1.遼寧出入境檢驗(yàn)檢疫局(116033)
2.山東出入境檢驗(yàn)檢疫局
3.廣東出入境檢驗(yàn)檢疫局