曹際娟賈俊濤許龍巖趙麗青
沙門氏菌PFGE分型非計量多維尺度分析法的研究*
曹際娟1賈俊濤2許龍巖3趙麗青2
目的探討沙門氏菌脈沖場凝膠電泳(PFGE)分型非計量多維尺度分析法(NMDS)。方法從國內不同地區(qū)分離得到的24株沙門氏菌進行PFGE分型,然后以非計量多維尺度法對PFGE分型進行分析。結論將24株沙門氏菌顯示在三維空間,從視覺上直接揭示了表型特征相近的不同國家和地區(qū)沙門氏菌之間的相關性,為PFGE譜圖的分析提供了一種有用的工具。
沙門氏菌 脈沖場凝膠電泳分型 非計量多維尺度分析法
在食源性致病菌中,沙門氏菌(SA)的危害性極為嚴重,因此應將其列為首選控制目標。脈沖場凝膠電泳技術(pulsed field gel electrophoresis,PFGE)具有分型能力強、分辨能力高、可重復性強等優(yōu)點,是目前細菌分子分型方法的金標準[1]。
細菌PFGE帶型屬于高維數(shù)據,即每個菌株擁有很多不同的帶型。高維數(shù)據由于數(shù)據結構復雜無法直接表示在低維空間(二維平面或三維空間),其數(shù)據特征很難被發(fā)現(xiàn)。多維尺度法(multidimensional scaling,MDS)是一種無監(jiān)督的用于高維數(shù)據降維的可視化工具。MDS可以分為計量多維尺度法(metric multidimensional scaling,MMDS)和非計量多維尺度法(nonmetric multidimensional scaling,NMDS)。本研究首先采用聚類分析法對進出口食品中分離的沙門氏菌PFGE圖譜進行分子分型,同時,探索采用NMDS來反映食品中不同沙門氏菌PFGE帶型之間的差異程度,為沙門氏菌的分子流行病學研究及沙門氏菌引起的食源性疾病溯源提供技術基礎。
1.材料
從國內不同地區(qū)分離得到的24株沙門氏菌。PFGE相對分子量標準用布倫登盧普沙門氏菌H9812(Salmonella Braenderup),由廣東省疾病預防控制中心贈送。
一次性血瓊脂平板,廣州環(huán)凱公司;限制性內切酶Xba I、Trisbase,美國Promega公司;SLS(Sodium lauroyl Sarcosine)、SDS,美國Sigma公司;蛋白酶K,德國Merck;SeaKem Gold瓊脂糖,美國Biorad公司。Chef Mapper脈沖場電泳儀、Gel Doc XR凝膠成像系統(tǒng),美國BIO-RAD公司。
2.脈沖場凝膠電泳[4]
參照美國PulseNet的沙門氏菌PFGE分子分型標準方法。將酶切后的膠塊置于10孔梳齒上,緩慢倒入1%SKG瓊脂糖。待凝固后,放入盛有2.2L 0.5× TBE緩液的電泳槽中。在14℃、脈沖時間2.16~63.8s條件下,電泳18h;電泳完畢后,用EB染色30m in,脫色90m in,最后用GelI 3ac EQ拍攝圖像。
3.脈沖場凝膠電泳圖譜的非計量多維尺度分析
設X為高維數(shù)據矩陣,即原始空間中的點的集合,
式(1)中,x為觀察對象向量,n為X中觀察對象的個數(shù)。
D={dij}為X中第i個和第j個觀察對象的距離構成的矩陣,1≤j<i≤n。
計量MDS的目標是尋找二維或三維構造空間中的n個點組成的點集Y={y1,y2,…,yn},Y為n×k(k=2或3)維構造矩陣,使其距離矩陣H={hij}與D中對應元素相對大小保持一致,即將D的對角線下方元素按升序排列di1j1≤di2j2≤…≤dimjm,m=n(n-1)/2,H的對角線下方元素也滿足hi1j1≤hi2j2≤…≤himjm,m=n(n-1)/2。
采用Kruskal算法求解Y[5]:
式(2)中Stress為脅強系數(shù),表示構造矩陣與原始矩陣的距離偏差占原距離矩陣的比重。
在k固定的情況下,按照最小二乘單調回歸求得脅強系數(shù)的最小值,此時對應的Y就為k維最佳擬合構造矩陣,從而實現(xiàn)了X的降維。
將24株沙門氏菌進行PFGE分析,獲得菌株兩兩之間的Dice相似性矩陣S(S={sij})。按如下方法將相似性矩陣轉換為距離矩陣D(D={dij}):
式(3)中,i和j為菌株在矩陣X中的序號。
在MATLAB R2009b(Version 7.9.0.529)中完成NMDS分析的所有步驟。
首先計算k=2時的脅強系數(shù),如果其小于0.20,則根據Y繪制二維平面圖;否則k=3,再次計算脅強系數(shù),如果其小于0.20,則根據Y繪制三維圖,如果脅強系數(shù)仍大于0.20,則表示X的數(shù)據結構無法用計量MDS實現(xiàn)降維。
用Shepard圖來顯示NMDS的擬合效果。
1.脈沖場凝膠電泳結果
制備染色體全基因組DNA,用限制性內切酶Xba I酶切,經PFGE分離,產生10~16條DNA片段,所有菌株的基因組DNA顯示出良好的分型能力(圖1,圖2),分子質量大小在(20~1100)kb之間。
圖1 沙門氏菌PFGE電泳圖(M:沙門氏菌H9812;1-12:SA1-SA12)
圖2 沙門氏菌PFGE電泳圖(M:沙門氏菌H9812;1-12:SA13-SA24)
3.非計量多維尺度分析
(1)沙門氏菌PFGE分型NMDS圖
k=2時,脅強系數(shù)為0.22,大于0.20,因此在二維構造空間中無法找到合適的點;
k=3時,脅強系數(shù)為0.14,小于0.20,因此在三維構造空間中可以找到合適的點,可以表示原始空間中的點。用MATLAB繪制NMDS三維圖(圖3)。
圖5顯現(xiàn)了24株沙門氏菌相似程度的遠近,距離近的兩個點的相似性高,距離遠的兩個點的相似性低。
圖3 沙門氏菌PFGE圖譜NMDS三維圖
圖3結合圖4可以準確發(fā)現(xiàn)各點之間的相似程度:
從整體上看,24株沙門氏菌可以分成3群:SA2、SA5、SA11、SA19、SA21、SA22、SA23和SA29;SA1、SA8、SA12、SA18和SA20;SA4、SA6、SA10、SA13、SA14、SA15、SA16、SA17和SA24。SA3和SA7位于前兩群的交界處,分類不明顯。
進一步觀察NMDS圖的局部。SA2、SA9和SA11非常接近,表明這3株菌相似性非常高。SA2和SA11都是德爾卑沙門氏菌,分別從歐洲進口凍豬肚和從廣州出口凍雞中分離到的。SA9是從廣州同一家禽廠出口凍雞中分離出的烏普薩拉沙門氏菌。SA13-17是此次分離的5株傷寒沙門氏菌,這5株菌都位于第三群中,從圖3和圖4可以看出這5株菌之間相似的關系。它們大體上空間位置排列依次為:SA14、SA13、SA16、SA15和SA17。SA13和SA14相似性高,SA15、SA16和SA17相似性高,而排序兩端的菌之間相似性低。SA14、SA15和SA17是從廣東的出口食品中分離的,NMDS圖顯示這3株菌并不完全相關。SA13和SA16是從歐洲進口的肉制品中分離到的,NMDS圖顯示這兩株菌也不相關。SA2、SA4和SA11是此次分離的3株德爾卑沙門氏菌,從圖3可以看出SA4與另外兩株菌的距離很遠,SA4與另兩株菌相似性差別較大。
按24株沙門氏菌不同來源分析,SA20分離自美國食品,它位于最外圍;SA8和SA21分離自澳大利亞食品,它們在NMDS圖中較為接近;SA12、SA19和SA23分離自烏拉圭食品,它們在NMDS圖中也較為接近;其余的18株沙門氏分離自廣東出口食品和歐洲進口食品,這兩個來源的菌相互交錯分布無法分開。
(2)擬合分析結果
NMDS的擬合效果Shepard圖見圖5。
Shepard圖是構造空間中各點之間距離對原始空間中各點之間距離的散點圖,可以幫助確定NMDS分析的擬合效果。在NMDS分析中,Shepard圖也顯示了原始空間中各點之間的距離對其單調轉換的散點圖。圖5中圓圈的分布延1:1線向下彎曲,說明構造空間中各點之間距離對原始空間中各點之間距離偏離較大,這也是NMDS比MMDS更靈活的體現(xiàn),MMDS試圖尋找構造空間中的點,使各點之間的距離盡可能地接近原始空間中各點之間的距離;而NMDS試圖探尋原始空間中各點之間距離的單調轉換,使構造空間體現(xiàn)這種單調轉換的順序關系(相對距離)。
圖4 沙門氏菌PFGE圖譜NMDS三維圖的3個方向視圖
圖5 沙門氏菌PFGE圖譜NMDS擬合效果Shepard圖
非計量多維尺度分析法和傳統(tǒng)UPGMA聚類分析法是兩種常用的PFGE圖譜分析方法,在實際應用過程中兩者在不同方面各有優(yōu)劣[2-3]。聚類分析法的實驗結果是以聚類樹狀圖來呈現(xiàn)的。在樹狀圖中,相似性高的菌株在高相似性(“樹枝”方向)處聚為一類,相似性低的菌株在低相似性(“樹根”方向)處被歸為一類。因此,可通過樹狀圖直接判斷哪些菌株歸屬于同一類群。NMDS三維圖雖然可以清晰的表示各點之間的遠近關系,但無法直接產生類似于聚類分析法中的類群信息。為了解決這一問題,可以通過K-均值聚類將NMDS三維圖中的點進行聚類。本研究對此次分析的數(shù)據按3-5類別分別進行K-均值聚類后發(fā)現(xiàn),其聚類結果與傳統(tǒng)PFGE分析采用的UPGMA聚類結果十分接近(數(shù)據未列出)[4]。
聚類分析法僅能將相近的菌株放在一簇,卻并不能體現(xiàn)菌株兩兩之間的異同。相比于聚類分析法,NMDS方法能更進一步地顯示菌株之間的相似性關系,即能夠發(fā)現(xiàn)任意兩株菌之間的相似性關系。例如:從圖3可以看出5株傷寒沙門氏菌的空間位置排列依次為:SA14、SA13、SA16、SA15和SA17,這5株菌兩兩菌株之間的相似性關系一目了然。
NMDS是一種高維數(shù)據降維技術,對原始數(shù)據會有信息損失,這是任何降維方法不可避免的問題。例如:SA2、SA9和SA11這3個點相似性100%,在高維空間中是重合的,但在NMDS圖上3點卻是分開的。這是因為NMDS雖然在低維空間顯示了高維空間的數(shù)據,卻在局部改變了原始的數(shù)據信息。因此,NMDS更適合做“全局”分析,在“局部”點的分析上應該結合聚類分析法等不改變原始數(shù)據信息的方法綜合進行。
本研究分離的24株沙門氏菌分布在3個群、15種血清型中,雖然PFGE分型結果顯示型別較分散,無明顯規(guī)律,但通過本研究初步了解了進出口食品中沙門氏菌的分子型別,為今后建立沙門氏菌分子分型數(shù)據庫、分析進出口食品中沙門氏菌的分子流行趨勢提供基礎數(shù)據[5]。同時,本研究建立了進出口食品中沙門氏菌PFGE譜圖的NMDS分析方法,對進出口食品中分離的24株沙門氏菌的高維帶型信息進行降維,成功將24株沙門氏菌顯示在三維空間,從視覺上直接揭示了表型特征相近的不同國家和地區(qū)沙門氏菌之間的相關性,為PFGE譜圖的分析提供了一種有用的工具,進一步促進PFGE方法在食品中病原菌污染源的追蹤和溯源、進出口食品把關以及食源性疾病的控制等方面的應用。
1.李燕俊,趙熙,楊寶蘭,等.腸炎沙門氏菌脈沖場凝膠電泳分型研究.衛(wèi)生研究,2005,34(3):338-340.
2.王麗麗,徐建國.脈沖場凝膠電泳技術(PFGE)在分子分型中的應用現(xiàn)狀.疾病監(jiān)測,2006(21)5:276-279.
3.陳太基.封幼玲.脈沖場凝膠電泳用于李斯特菌分型及分子流行病學研究.中國人獸共患病雜志,2000,16(1):90-93.
4.許龍巖,袁慕云,劉靜宇,等.進出口食品中沙門氏菌PFGE分型及耐藥研究.檢驗檢疫學刊,2010,20(2):14-17.
5.Kruskal JB.Multidimensional scaling:a numerical method.Psychometrika,1964,29(2):115-129.
(責任編輯:郭海強)
遼寧省自然科學基金項目(項目編號20102080)
1.遼寧出入境檢驗檢疫局(116033)
2.山東出入境檢驗檢疫局
3.廣東出入境檢驗檢疫局