1.首都醫(yī)科大學(xué)附屬北京友誼醫(yī)院放射科 (北京 100050)
2.首都醫(yī)科大學(xué)附屬北京中醫(yī)醫(yī)院放射科 (北京 100010)
李曉強(qiáng)1常 泰2
論 著
支持向量機(jī)在CT鑒別診斷腎臟上皮樣血管平滑肌脂肪瘤與腎透明細(xì)胞癌中的應(yīng)用
1.首都醫(yī)科大學(xué)附屬北京友誼醫(yī)院放射科 (北京 100050)
2.首都醫(yī)科大學(xué)附屬北京中醫(yī)醫(yī)院放射科 (北京 100010)
李曉強(qiáng)1常 泰2
目的探討支持向量機(jī)在CT鑒別診斷腎臟上皮樣血管平滑肌脂肪瘤(epithelioid angiomyolipoma, EAML)的CT與腎透明細(xì)胞癌(clear cell renal cell carcinoma, ccRCC)中的應(yīng)用價(jià)值。
方法搜集70例經(jīng)病理證實(shí)的腎臟腫瘤(EAML、ccRCC病變各35例),采用支持向量機(jī)法綜合分析其CT特征表現(xiàn),判定其所屬類型。結(jié)果支持向量機(jī)法(support vector machine,SVM)對(duì)EAML病變的診斷正確率為100%;對(duì)ccRCC病變的診斷正確率為94.59%;總體平均判別正確率為97.14%;訓(xùn)練集診斷正確率為97.30%;測(cè)試集診斷正確率為96.97%;與bagging和adaboost分類算法診斷符合率相接近。結(jié)論支持向量機(jī)法有助于CT鑒別診斷EAML和ccRCC,可用于輔助日常閱片工作,尤其是年輕醫(yī)師或基層醫(yī)院醫(yī)師的工作。
上皮樣血管平滑肌脂肪瘤;腎透明細(xì)胞癌;CT;支持向量機(jī)SVM;診斷
腎細(xì)胞癌(renal cell carcinoma,RCC)是泌尿系統(tǒng)常見的惡性腫瘤,占腎臟腫瘤的90%,約占成人惡性腫瘤的2%,并且其發(fā)病率有逐年上升的趨勢(shì)[1]。腎臟上皮樣型血管平滑肌脂肪瘤(EAML)是血管平滑肌脂肪瘤的一種特殊亞型,是發(fā)生在腎臟中一種較為罕見的、具有惡性潛能的間葉源性腫瘤,且預(yù)后尚不明確,必須引起重視,在過(guò)去由于其無(wú)特異性臨床表現(xiàn)加上對(duì)其認(rèn)識(shí)不足常被誤診為腎細(xì)胞癌[2-3]。臨床一般以手術(shù)切除為首選,但是其病灶良、惡性的術(shù)前診斷對(duì)手術(shù)方式的選擇有一定的影響,由于CT檢查的無(wú)損傷、安全、可重復(fù)性和價(jià)廉等特點(diǎn),所以在臨床上常采用CT檢查[4-5]。其診斷結(jié)果往往依據(jù)各種CT征象通過(guò)經(jīng)驗(yàn)判斷來(lái)對(duì)其腫塊做出臨床診斷,其明顯會(huì)受診斷者的臨床經(jīng)驗(yàn)、思維方法等主觀因素的影響,且EAML在腫瘤較小時(shí)常常與其他類似疾病如EML、RCC等難以鑒別,這就給臨床確診帶來(lái)了一定的困難[6]。因此尋找一種相對(duì)科學(xué)、客觀、實(shí)用的診斷思維和方法來(lái)進(jìn)行綜合評(píng)價(jià)是顯得非常必要。本文收集了2011年6月至2016年5月期間經(jīng)病理學(xué)證實(shí)的EAML、ccRCC各35例進(jìn)行回顧性分析;探討其影像學(xué)表現(xiàn)特征,以提高對(duì)該病的認(rèn)識(shí),并嘗試采用SVM對(duì)RCC類似疾病的影響特征進(jìn)行鑒別診斷分析,探討本方法在RCC的鑒別中的作用及價(jià)值。
1.1 研究對(duì)象選取2011年6月至2016年05月期間在本院進(jìn)行治療的70例RCC疾病患者,且所有病例術(shù)前都進(jìn)行了常規(guī)的CT檢查,術(shù)后經(jīng)病理證實(shí),其中EAML組、RCC組各35例。
1.2 變量設(shè)置查閱相關(guān)文獻(xiàn)和根據(jù)影像專家的建議,選取了如下RCC常見的臨床資料和CT特征象:患者年齡、性別、病灶位置、數(shù)量、邊界、病灶有無(wú)囊變、有無(wú)脂肪、病灶最大直徑、動(dòng)脈期CT值、靜脈期CT值、有無(wú)粗大供血血管影、是否有臨床表現(xiàn)。
1.3 SVM判別方法支持向量機(jī)算法首先由Vapnik提出,由Vapnik與其合作者發(fā)明的?;舅枷刖褪菍⒔彿诸惙ê途€性回歸建模法結(jié)合起來(lái)創(chuàng)建一個(gè)超平面,使得改平面的任何一邊的數(shù)據(jù)劃分都相當(dāng)均勻。從而不但能達(dá)到將兩類樣本正確分開,而且還能使的兩類的分類間隔最大。
判別分類基本步驟如下:(1)將60例腎臟腫瘤病例數(shù)據(jù)按隨機(jī)原則分成訓(xùn)練集樣本與測(cè)試集兩個(gè)樣本;2.選擇向量機(jī)的模型及核函數(shù);3.利用SVM分類器對(duì)腎臟腫瘤訓(xùn)練集樣本進(jìn)行訓(xùn)練建模;4.利用測(cè)試集對(duì)訓(xùn)練好的腎臟腫瘤鑒別診斷模型進(jìn)行預(yù)測(cè),以驗(yàn)證SVM的正確性。
1.4 統(tǒng)計(jì)學(xué)處理所有數(shù)據(jù)采用運(yùn)用R3.2.0軟件進(jìn)行統(tǒng)計(jì)分析,計(jì)量資料采用進(jìn)行統(tǒng)計(jì)描述,計(jì)數(shù)資料采用例數(shù)(百分比)表示。采用t檢驗(yàn)對(duì)兩組間定量資料的差異就行統(tǒng)計(jì)分析,兩組間定性資料差異采用χ2檢驗(yàn);并采用R軟件“e1071”包對(duì)其進(jìn)行SVM模型建模分析和“kernlab”包對(duì)模型效果進(jìn)行評(píng)價(jià);檢驗(yàn)水準(zhǔn)α=0.05。
2.1 人口學(xué)資料和CT主要征象分布結(jié)果表1可以看出,EAML組平均發(fā)病年齡(42.54±11.14)小于RCC組(57.78±11.61)。EAML組女性(71.43%)所占比例多于男性(28.57%),而RCC男性比例高于女性,性別分布差異在兩組間差異有統(tǒng)計(jì)學(xué)意義(P<0.05)。腫瘤單發(fā)多見,多發(fā)少見。35例EAML中15例發(fā)生在腎臟左側(cè),14例右側(cè),6例雙側(cè)均有病灶,而RCC左側(cè)居多(51.43%),但差異無(wú)統(tǒng)計(jì)學(xué)意義。病灶與腎實(shí)質(zhì)分界都較清晰,兩組間差異無(wú)統(tǒng)計(jì)學(xué)意義(P>0.05)。囊變?cè)贓AML中罕見而在RCC中較常見(P<0.05)。RCC中罕見脂肪但EAML組中含脂肪和不含脂肪所占比例分別為57.14%、42.86%(圖1-8)。兩組間腫瘤最大直徑差異無(wú)統(tǒng)計(jì)學(xué)意義(P>0.05)。EAML組的動(dòng)脈期CT值和靜脈期CT值均低于RCC組(P均<0.05)。EAML粗大供血血管影較少見。而在臨床表現(xiàn)方面兩組間差異無(wú)統(tǒng)計(jì)學(xué)意義(P>0.05)。
2.2 SVM分類效果SVM對(duì)EAML病變的診斷正確率為100%,對(duì)ccRCC病變的診斷正確率為94.59%,總體平均判別正確率為97.14%,訓(xùn)練集診斷正確率為97.30%。從測(cè)試結(jié)果可以看出,在測(cè)試集的33個(gè)樣本中,共有1個(gè)樣本被預(yù)測(cè)錯(cuò)誤(1個(gè)EAML樣本被錯(cuò)分為ccRCC),平均診率正確為96.97%。由圖9可清晰的看出SVM的判別效果。為了比較SVM分類器的性能,分別用bagging和adaboost分類算法上述數(shù)據(jù)集進(jìn)行測(cè)試,結(jié)果發(fā)現(xiàn)其預(yù)測(cè)準(zhǔn)確率亦為96.67%,這表明采用SVM模型對(duì)腎臟腫瘤進(jìn)行分類識(shí)別具有較好的性能,見表2。
表l 兩組間人口學(xué)資料及CT特征分布差異性分析結(jié)果
表2 SVM法鑒別診斷分析結(jié)果
3.1 病理及臨床特點(diǎn)近來(lái)研究表明,EAML是血管平滑肌脂肪瘤的罕見亞型,屬于血管周上皮樣細(xì)胞瘤家族,具有潛在惡變的可能。該家族腫瘤具有獨(dú)特的免疫組化學(xué)特征:EAML的上皮樣細(xì)胞表達(dá)黑色素細(xì)胞標(biāo)記物(HMB-45、Melan-A)和平滑肌標(biāo)志物(SMA、MSA)表達(dá)陽(yáng)性而上皮細(xì)胞標(biāo)記(CK、EMA)表達(dá)陰性[7]。
腎EAML常見于腎,在肝臟、盆腔等部位也偶有發(fā)生,臨床表現(xiàn)無(wú)特異性發(fā)病率女性高于男性,有報(bào)道表明肝臟EAML幾乎全為女性。本次研究發(fā)現(xiàn)女性EAML所占比例為71.43%[發(fā)病平均年齡(42.54±11.14)歲],且其臨床表現(xiàn)無(wú)特異性,這與文獻(xiàn)報(bào)道相一致[8]。
3.2 EAML的CT表現(xiàn)國(guó)內(nèi)外有關(guān)EAML的影像學(xué)表現(xiàn)文獻(xiàn)相對(duì)較少,其病灶大部分單發(fā),多發(fā)少見,體積偏大,多數(shù)邊界清楚,可富含脂肪也可以不含脂肪或含少量脂肪[9]。本次研究病例中腫瘤大小(57.60±41.32)mm,57.14%含脂肪。增強(qiáng)后EAML動(dòng)脈期強(qiáng)化明顯,呈迅速上升-緩慢下降型,動(dòng)靜脈期CT值變化幅度較小(<20HU),分析原因可能與病灶內(nèi)含有大量血管,細(xì)胞成分多、細(xì)胞間質(zhì)少及缺少引流血管有關(guān)。
3.3 鑒別診斷EAML發(fā)病機(jī)理不明確,且發(fā)病率較少,相關(guān)研究文獻(xiàn)樣本較小,再加上臨床和影像學(xué)上無(wú)明顯的特征導(dǎo),應(yīng)用CT進(jìn)行定性診斷時(shí)具有高度的技術(shù)依賴性,在臨床診斷中容易出現(xiàn)誤診,如果能建立一個(gè)能適用于小樣本分析、比較規(guī)范的、客觀的診斷方法來(lái)輔助臨床醫(yī)生對(duì)腎臟相關(guān)疾病進(jìn)行鑒別診斷的話,那將非常有利于醫(yī)生的診斷效率的。而支持向量機(jī)算法是一種適用于小樣本的機(jī)器學(xué)習(xí)方法,現(xiàn)已成為機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘領(lǐng)域的標(biāo)準(zhǔn)工具。它集成了最大間隔平面、Mercer核、凸二次規(guī)劃、稀疏解和松弛變量等多項(xiàng)技術(shù),使得其在類別判斷時(shí)性能突出[10]。因此,將SVM方法作為一種鑒別診斷的方法應(yīng)用到腎臟腫瘤良惡性的自動(dòng)判別中,是一個(gè)值得研究的課題,也是本文的主要研究對(duì)象。而目前國(guó)內(nèi)有關(guān)SVM法在腎臟疾病鑒別診斷這方面的文章還沒(méi)有報(bào)道。
以病理為基礎(chǔ),對(duì)臨床及影像學(xué)特征采用SVM建模進(jìn)行鑒別分析發(fā)現(xiàn):SVM對(duì)EAML鑒別能力為100%,對(duì)ccRCC病變的判別能力也高達(dá)94.59%。采用測(cè)試集進(jìn)行驗(yàn)證,其鑒別能力也較高,為96.97%。結(jié)果與比較成熟的bagging和adaboost分類算法結(jié)果接近,這表明采用SVM模型對(duì)腎臟腫瘤進(jìn)行分類識(shí)別具有較好的效能。
圖1-2 不含脂肪的EAML女性,46歲,左腎病灶直徑約34mm。圖1為動(dòng)脈期增強(qiáng)圖像,病灶CT值為105HU。圖2為靜脈期圖像,病灶CT值為88HU。圖3-4含脂肪的EAML 女性,25歲,左腎病灶直徑約36mm。圖3為動(dòng)脈期增強(qiáng)圖像,病灶CT值為81HU。圖4靜脈期CT值85HU。圖5-6 無(wú)囊變腎癌 男性,41歲,右腎病灶直徑約48mm。圖5為動(dòng)脈期增強(qiáng)圖像,病灶CT值為108HU,病灶靜脈期CT值為79HU。圖7-8 以囊性為主腎癌 男性,67歲,右腎病灶直徑約93mm。圖7為動(dòng)脈期圖像,病灶CT值121HU,圖8為靜脈期圖像,病灶CT值90HU。
圖9 SVM判別分析結(jié)果。
SVM法利用超平面線性分割原理對(duì)CT不同的征象進(jìn)行綜合判別,從而避免了診斷過(guò)程中出現(xiàn)的主觀性,克服了單一征象對(duì)診斷的影響,從而達(dá)到指標(biāo)的量化管理,使其診斷上有章可循,彌補(bǔ)了經(jīng)驗(yàn)的不足,也為深入研究計(jì)算機(jī)輔助診斷的應(yīng)用提供了一定的理論基礎(chǔ),具有一定的應(yīng)用價(jià)值??梢钥紤]用來(lái)指導(dǎo)日常診斷,尤其是對(duì)于初級(jí)醫(yī)師的培訓(xùn)及輔助診斷更是具有重要意義。
[1]Ljungberg B,Cowan N C,Hanbury D C,et al.EAU guidelines on renal cell carcinoma:the 2010 update[J].Eur Urol,2010,58(3):398-406.
[2]Nese N,Martignoni G,Fletcher C D,et al.Pure epithelioid PEComas (so-called epithelioid angiomyolipoma) of the kidney:A clinicopathologic study of 41 cases:detailed assessment of morphology and risk stratification[J].Am J Surg Pathol,2011,35(2):161-176.
[3]梅海英,王索宇.肝臟上皮樣血管平滑肌脂肪瘤的影像診斷[J].實(shí)用醫(yī)學(xué)影像雜志,2015,16(2):154-156.
[4]Chiachun T,Wu W J,Li C C,et al.Epithelioid angiomyolipoma of the kidney mimicking renal cell carcinoma:a clinicopathologic analysis of cases and literature review[J].Kaohsiung J Med Sci,2009,25(3):133-140.
[5]吳清清,陳自謙.肝臟上皮樣血管平滑肌脂肪瘤的影像學(xué)表現(xiàn)與病理對(duì)照分析[J].醫(yī)學(xué)影像學(xué)雜志,2015(4):662-665.
[6]Tan G,Liu L,Qiu M,et al.Clinicopathologic features of renal epithelioid angiomyolipoma:report of one case and review of literatures[J].Int J Exp Pathol,2015,8(1):1077-1080.
[7]CHEN,WANG,Ping,et al.Highly aggressive epithelioid renal angiomyolipoma with a very poor prognosis[J].Chin Med J,2010,123(6):765-766.
[8]Mai K T,Belanger E C.Perivascular epithelioid cell tumour(PEComa) of the soft tissue[J].Pathology,2006,38(5):415-420.
[9]梁海毛,王建儉,周林鋒,等.腎臟上皮樣血管平滑肌脂肪瘤的CT表現(xiàn)與病理基礎(chǔ)[J].中國(guó)CT和MRI雜志,2012,10(4):66-69.
[10]茍茹君.支持向量機(jī)方法在乳腺腫塊分類中的應(yīng)用研究[D].西安理工大學(xué),2008.
(本文編輯: 張嘉瑜)
The Application Value of Support Vector Machine in CT Differential Diagnosis of Renal Epithelioid Angiomyolipoma and Clear Cell Renal Cell Carcinoma
LI Xiao-qiang, CHANG Tai.
Department of Radiology, Beijing Friendship Hospital,Capital Medical University, Beijing 100050, China
ObjectiveTo evaluate the application value of support vector machines in the differential diagnosis of renal epithelioid angiomyolipoma (EAML) and clear cell renal cell carcinoma (ccRCC).MethodsIn this study, 70 cases of renal tumors confirmed by pathology (35 cases of EAML and ccRCC) were collected, and the characteristics of CT features were analyzed by support vector machine method.ResultsThe diagnostic accuracy of support vector machine (SVM) for EAML lesions was 100%.The diagnostic accuracy of ccRCC lesions was 94.59%. The overall average judgment accuracy was 97.14%. The diagnostic accuracy of the training set was 97.30%. The diagnostic accuracy of the test set was 96.97%. The coincidence rate is similar to bagging and adaboost classification algorithm.ConclusionSupport vector machine method is helpful for CT differential diagnosis of EAML and ccRCC, which can be used to assist in daily work,especially for young doctors or primary hospital physicians.
Epithelioid Angiomyolipoma; Clear Cell Renal Cell Carcinoma; CT;SVML; Differential Diagnosis
10.3969/j.issn.1672-5131.2017.10.029
2017-09-06
常 泰
R445.3;R737.11
A