,,,,
(1. 中國動物衛(wèi)生與流行病學(xué)中心,山東青島 266032;2. 青島農(nóng)業(yè)大學(xué),山東青島 266109)
豬鏈球菌2型毒力預(yù)測模型的建立
劉麗蓉1,單 虎2,康京麗1,李 印1,王幼明1
(1. 中國動物衛(wèi)生與流行病學(xué)中心,山東青島266032;2. 青島農(nóng)業(yè)大學(xué),山東青島266109)
[目的]建立豬鏈球菌2型毒力強弱的預(yù)測模型,為降低養(yǎng)豬業(yè)的經(jīng)濟損失提供參考。[方法]本研究以已報道的國內(nèi)豬鏈球菌2型分離株的6種主要毒力因子(mrp、epf、sly、orf2、fbps、gapdh)的存在情況為自變量,以毒力強弱為因變量,采用逐步回歸的方法進行二分類Logistic回歸分析,得出鑒別豬鏈球菌2型毒力強弱的數(shù)學(xué)模型,并通過ROC曲線評價其預(yù)測效能。[結(jié)果]進入回歸方程的指標有:mrp(X1)和sly(X3),求得的回歸方程為:P=1/〔1+e-(-5.671+4.642 X1+4.253X3)〕。ROC曲線最佳診斷點為0.5581?;貧w方程對毒力強弱預(yù)測的敏感度為93.8%,特異度為94.6%,準確度為94%。[結(jié)論]聯(lián)合運用Logistic回歸和ROC曲線預(yù)測豬鏈球菌2型毒力的強弱是可行的,mrp和sly 兩個指標獨立應(yīng)用對鑒別都有診斷價值,但二者聯(lián)合起來診斷價值更高且預(yù)測效果更理想。
豬鏈球菌2型;毒力因子;SPSS;Logistic;ROC;Wald檢驗;模型
豬鏈球菌是一種危害現(xiàn)代養(yǎng)豬業(yè)的重要病原,這在養(yǎng)豬業(yè)發(fā)達的國家都有報道[1]。根據(jù)莢膜抗原成分的差異,豬鏈球菌可分為35個血清型,其中豬鏈球菌2型流行最為廣泛、致病性最強,不僅能引起豬關(guān)節(jié)炎、腦膜炎、肺炎、敗血癥及豬只的突然死亡,導(dǎo)致養(yǎng)豬業(yè)巨大的經(jīng)濟損失;而且還能致人發(fā)病死亡,對公共衛(wèi)生尤其是從業(yè)人員的生命安全構(gòu)成了嚴重威脅,是一種危害嚴重的人畜共患病病原。豬鏈球菌2型與豬的臨床疾病有一定的相關(guān)性,但并不是所有的2型菌株都具有致病性,部分毒株對豬毒力較弱。研究表明,豬鏈球菌致病性強弱與毒力因子密切相關(guān)[2],主要包括溶菌酶釋放蛋白(mrp)、胞外因子(epf)、溶血素(sly)、甘油醛-3-磷酸脫氫酶(gapdh)、纖連蛋白/血纖蛋白原結(jié)合蛋白(fbps)、毒力相關(guān)序列(orf2)、其他毒力因子等,其中mrp、epf 和 sly 是豬鏈球菌2 型菌株的主要毒力因子。
本研究旨在構(gòu)建鑒別豬鏈球菌2型毒力強弱的Logistic回歸模型,綜合利用多項測量得出鑒別豬鏈球菌2型毒力強弱的數(shù)學(xué)模型。為及時、準確地預(yù)測我國豬鏈球菌2型的流行趨勢,制定合理有效的防控措施提供科學(xué)依據(jù),進一步保障相關(guān)從業(yè)人員的健康奠定科學(xué)基礎(chǔ)。
收集匯總以往已發(fā)表及本單位現(xiàn)有的關(guān)于中國地區(qū)豬鏈球菌2型6種主要毒力因子:溶菌酶釋放蛋白(mrp)、胞外因子(epf)、溶血素(sly)、甘油醛-3-磷酸脫氫酶(gapdh)、纖連蛋白和血纖蛋白原的結(jié)合蛋白(fbps)和毒力相關(guān)序列(orf2)的PCR鑒定結(jié)果情況[3-6]。
2.1 Logistic回歸模型的建立
以6種毒力因子mrp(X1)、epf(X2)、sly(X3)、gapdh(X4)、fbps(X5)和orf2(X6)為自變量,自變量分為陰性組和陽性組,分別賦值0和1,毒力強弱為因變量,應(yīng)用SPSS17.0軟件進行統(tǒng)計分析。P<0.05認為具有統(tǒng)計學(xué)顯著性。得到Logistic回歸方程,并在SPSS工作數(shù)據(jù)表中產(chǎn)生含各個體的預(yù)測值,然后以每個個體的預(yù)測值組成新變量Pre(predicted probability-1)進行ROC分析。
2.2 應(yīng)用ROC曲線評價各指標對豬鏈球菌2型毒力強弱的預(yù)測能力
分別以新變量為檢驗變量,以毒力強弱為金標準,作ROC曲線分析,得出各檢驗變量的曲線下面積(area under the curve,AUC)。
2.3 確定最佳診斷點
根據(jù)臨床實際,確定所要求的真陽性率(或假陽性率),使用線性內(nèi)插法求出診斷點。R=x 為設(shè)定的假陽性率(或真陽性率),P(R=x)為(R=x)對應(yīng)的診斷點,R1為恰好小于(R=x)的假陽性率(或真陽性率),R2為恰好大于(R=x)的假陽性率(或真陽性率),P1和 P2分別為R1和R2對應(yīng)的診斷點,根據(jù)線性內(nèi)插法有:
(R1-R2):〔R1-(R=x)〕=(P1- P2):〔P1-P(R=x)〕(1)
3.1 數(shù)據(jù)收集情況
共收集到豬鏈球菌2型117株,其中強毒80株,弱毒37株。毒力因子的分布情況統(tǒng)計見表1。
表 1 毒力因子分布情況
3.2 Logistic回歸分析結(jié)果和數(shù)學(xué)模型的建立
多因素Logistic回歸分析結(jié)果詳見表2:進入回歸方程的指標有mrp(X1)、epf(X2)、sly(X3)、gapdh(X4)、fbps(X5)和orf2(X6)。對引入方程中的每個自變量偏相關(guān)系數(shù)進行統(tǒng)計檢驗,即回歸系數(shù)的Wald檢驗。
回歸系數(shù)的Wald檢驗(顯著性水平為P<0.05):
表 2 多因素logistic回歸分析步驟
從表2可以看出,步驟1中g(shù)apdh的Wald檢驗概率p值最大,且大于顯著性水平,不應(yīng)拒絕原假設(shè),認為該回歸系數(shù)與0無顯著差異,它與logitP的線性關(guān)系是不顯著的,不應(yīng)保留在方程中。由于方程中包含了不顯著的解釋變量,考慮重新建模。
同理,步驟2中epf的Wald檢驗概率p值最大,且大于顯著性水平,考慮重新建模;步驟3中orf2的Wald檢驗概率p值最大,且大于顯著性水平,考慮重新建模;步驟4中fbps的Wald檢驗概率p值最大,且大于顯著性水平,考慮重新建模。直至步驟4中各自回歸系數(shù)顯著性檢驗的Wald觀測值對應(yīng)的概率p值均小于顯著性水平0.05,意味著他們都應(yīng)保留在方程中。
OR值較大的指標為mrp,說明其對預(yù)測豬鏈球菌2型強毒株的價值最大,求得出的Logistic回歸方程為:P=1/〔1+e-(-5.671+4.642 X1+4.253 X3)〕。其中P代表預(yù)測概率,e為自然對數(shù)。
3.3 應(yīng)用ROC曲線評價各種指標對豬鏈球菌2型毒力強弱的預(yù)測能力。
由SPSS17.0輸出的預(yù)測概率Pre 、mrp(X1)和sly(X3)的ROC曲線下面積(AUC)如表3所示。結(jié)果顯示當兩種因素單獨檢測時sly的AUC大于mrp的AUC;而兩種因素聯(lián)合Pre的AUC 均大于各單項檢測的AUC(ROC曲線如圖1所示),且其檢測敏感度和特異度比單項檢測的高。
表 3 Pre、mrp和sly的曲線下面積、敏感度、特異度和95%置信區(qū)間
圖 1 ROC曲線
3.4 確定診斷點
從SPSS輸出的表中查得Pre的ROC曲線坐標點如表4所示。
表 4 Pre的ROC曲線坐標點
取假陽性率R=10%(即取R=0.100)后設(shè)定診斷點。表4數(shù)據(jù)得出:R1=0.054,R2=0.378,P1=0.6125,P2=0.229,帶入公式(1)有:(0.054-0.378):(0.054-0.1)=(0.6125-0.229):〔0.6125-P(R=0.100)〕,可得P(R=0.100)=0.5581。
取假陽性率R=10%后求得診斷點為0.5581。預(yù)測概率值大于或等于0.5581判為陽性(即診斷為強毒株),反之為陰性。
根據(jù)該臨界值,強毒株80例中有75例判斷正確,5例判斷錯誤;弱毒株37例中35例判斷正確,2例判斷錯誤。求得數(shù)學(xué)模型對豬鏈球菌2型毒力強弱的敏感度為93.8%,特異度為94.6%,準確度為94%。
4.1 SS2致病性強弱相關(guān)因素分析
研究表明,SS2中存在著一些與毒力相關(guān)的基因,特別是mrp、Sly和epf,這三種毒力因子的表達對鏈球菌 2 型菌株的毒力強弱起著決定作用,但決定毒力的主導(dǎo)基因存在地區(qū)差異[7],即在某些地區(qū)以 mrp或epf基因為主,而在另一些地區(qū)則以sly 基因為主[8]。本研究得出的預(yù)測模型僅以報道較多的6種毒力因子為致病性相關(guān)的風險因素,旨在從分子水平通過二手數(shù)據(jù)分析,得出中國地區(qū)SS2毒力預(yù)測模型。其他與SS2致病性相關(guān)的因素,如帶菌狀態(tài)或其他毒力因子,因報道較少,很難納入模型中,是本研究的一個缺憾。
4.2 Logistic回歸分析與ROC曲線分析的意義及在本研究中運用的發(fā)現(xiàn)
臨床上僅用一項檢查指標進行鑒別診斷是片面的、不合理的。許多研究證明,綜合利用多項檢測指標進行診斷,能大大提高診斷的準確性和診斷效率,避免經(jīng)驗判斷的主觀性,使得診斷更為科學(xué)化、客觀化[9-11]。Logistic回歸分析屬于概率型非線性回歸,它是研究二分類觀察結(jié)果與一些影響因素之間關(guān)系的一種多變量分析方法[12]。本研究中,因變量毒力強弱是一個二分類的變量,即強毒與弱毒。采用Logistic回歸模型綜合分析多指標變量對豬鏈球菌2型毒力強弱的診斷價值,證實了mrp和sly是診斷毒力強弱的兩個影響因素。
有很多研究利用多項指標聯(lián)合檢測各種疾病時,大多篩選3~5項指標,只要其中有一項以上指標陽性就歸為診斷符合,這種聯(lián)合診斷能提高靈敏度,但特異性下降。本研究通過繪制ROC曲線,并比較不同檢測指標的曲線下面積(AUC),同時按照AUC 原則提供“診斷點”,以保證最大限度地區(qū)別豬鏈球菌2型毒力的強弱,用逐步后向Logistic 回歸擬合最佳曲線時,結(jié)果保留mrp和sly 兩個指標,epf、gapdh、fbps和orf2(P>0.05)預(yù)測價值相對較小而被剔除。這樣得到的ROC曲線可以從幾何意義上直觀地反映模型擬合情況,通過曲線下面積定量反映Logistic 模型的擬合效果,以此更好地對模型優(yōu)度與實際資料的符合情況進評價?;貧w方程的預(yù)測效果比較理想,其預(yù)測新變量Pre的ROC曲線下的面積(AUC=0.950)均比任何單一指標的面積(AUCmrp=0.798,AUCsly=0.826)要大。求得的數(shù)學(xué)模型對豬鏈球菌2型毒力強弱預(yù)測的敏感度和特異度明顯高出各單項指標預(yù)測的結(jié)果,Pre 敏感度為93.8%(mrp為97.5%,sly為95.0%),特異度為94.6%(mrp為62.2%,sly為70.3%),彌補了單一的靈敏度高、特異度低的缺陷。說明該模型的預(yù)測效能較好,能預(yù)測豬鏈球菌2型毒力的強弱。
應(yīng)用Logistic回歸綜合多指標信息,根據(jù)ROC曲線確定診斷界值,以達到同時提高診斷的敏感度和特異度,是本研究嘗試的一種新的診斷試驗評價方法。該方法亦可應(yīng)用于其他疾病診斷試驗的資料分析中,有著廣泛的應(yīng)用前景。
[1] 耿艷紅,徐軍,王兆山,等.豬鏈球菌病[J].豬業(yè)科學(xué),2005,22(6):30-104.
[2] 鄭升博,華修國,陸偉芳,等.多重PCR方法檢測豬鏈球菌主要致病血清型及其毒力因子[J].上海交通大學(xué)學(xué)報(農(nóng)業(yè)科學(xué)版),2010,28(1):53-58.
[3] 何孔旺,倪艷秀,王繼春,等.豬鏈球菌2型的分子流行病學(xué)研究[J].中國人壽共患病雜志,2002,18(5):45-47.
[4] 馬青霞,何孔旺,陸承平.豬鏈球菌2型及其毒力因手檢測多重PCR的建立與應(yīng)用[J].中國獸醫(yī)學(xué)報,2006,26(1):28-31.
[5] 白昀.廣西豬鏈球菌2型毒力因子的研究[D].廣西:廣西大學(xué),2008.
[6] 李春玲,余煒烈,王貴平,等.豬鏈球菌扁桃體分離株的毒力因子分布特征與致病性[J].中國預(yù)防獸醫(yī)學(xué)報,2009,31(2):104-109.
[7] Gottschalk M,Lebrun A,Wisselink H J,et al. Production of muram inidase-released proteins by Canadian strains of Streptococcus suis capsular type 2 [J]. Can J Vet Res,1998,62:75-79.
[8] Wisselink H J,Smith H E,Stockhofe Z N,et al. Distribution of capsular types and production of muramidase released protein (MRP)and extracellular factor (EF) of Streptococcus suis strains isolated from diseased pigs in seven European countries [J]. Vet Microbiol,2000,74(3):237-248.
[9] 陳櫟江,張文輝,唐恩燕,等. Logistic回歸和ROC曲線分析多種腫瘤標志物在鑒別良惡性胸水中的應(yīng)用價值[J].實用醫(yī)學(xué)雜志,2009,25(2):238-240.
[10] 劉寶利,楊寶友,鄭桂敏,等. Logistic回歸和ROC曲線綜合評價檢測四種尿蛋白排泄對早期腎小球疾病的診斷價值[J].中國中西醫(yī)結(jié)合腎病雜志,2011,12(8):695-697.
[11] 劉潤幸.使用SPSS作多變量觀察值的ROC曲線分析[J].中國公共衛(wèi)生,2003,19(9):1151-1154.
[12] 孫振球.醫(yī)學(xué)統(tǒng)計學(xué)[M].2版.北京:人民衛(wèi)生出版社,2005:333.
The Development of Virulence Prediction Model for Streptococcus Suis 2
Liu Lirong1,Shan Hu2,Kang Jingli1,Li Yin1,Wang Youming1
(1. China Animal Health and Epidemiology Center,Qingdao,Shandong 266032;
2. Qingdao Agriculture University,Qingdao,Shandong 266109)
To establish the prediction model of Streptococcus Suis 2 (SS2),and provide the theoryetical reference for reducing losses of pig farming,6 virulence factors of SS2 were selected as independent variables,including mrp,epf,sly,orf2,fbps and gapdh. And the pathogenicity was selected as dependent variables. 2-stage least squares was performed. Then ROC curve was used to evaluate the diagnostic eff ciency after regression model was constructed. The results showed that mrp and sly were remained in the regression model P=1/〔1+e-(-5.671+4.642X1+4.253X3)〕. The best diagnostic point was 0.5581. The sensitivity,specificity and accuracy of the regression equation to detect the pathogenicity of SS2 were 93.8%,94.6% and 94% respectively. These results indicated that it was feasible to use regression model and ROC curve in SS2 predicting. And joint using mrp and sly combined were more effective in diagnostic value for clinical screening than using them alone.
StreptococcusSuis 2;virulence factor;SPSS;Logistic;ROC;Wald test;model
S858.28
:C
:1005-944X(2014)11-0008-04
王幼明,單 虎