摘? 要:相關(guān)研究表示,在社會經(jīng)濟(jì)不斷發(fā)展的過程中,人們的飲食習(xí)慣及生活節(jié)奏也在不斷的變化,因此提高了乳腺癌的發(fā)病幾率。乳腺癌是否能夠治愈的重點(diǎn)為早發(fā)現(xiàn)、早診斷和早治療,現(xiàn)代醫(yī)學(xué)無法治愈晚期乳腺癌,所以在對乳腺癌治療過程中對預(yù)防重視。目前,一般都是使用超聲波顯像檢查、X分析診斷、臨床觸診、CT掃描及核磁共振成像對乳腺癌進(jìn)行診斷,不同診斷方法都具有不同的優(yōu)點(diǎn)和缺點(diǎn)。以此,該文就分析乳腺癌診斷中的支持向量機(jī)使用。
關(guān)鍵詞:支持向量機(jī)? 乳腺癌? 精準(zhǔn)診斷
中圖分類號:TP391.4? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻(xiàn)標(biāo)識碼:A? ? ? ? ? ? ? ? ? ? ? ? ?文章編號:1672-3791(2019)03(b)-0169-02
該文對支持向量機(jī)在乳腺癌診斷中的使用進(jìn)行分析。支持向量機(jī)的算法設(shè)計(jì)
假設(shè)具有訓(xùn)練樣本數(shù)據(jù)集為:
其中的n指的是樣本數(shù),m指的是χn維數(shù)??梢允褂贸矫妫?/p>
w指的是法向量,b指的是偏置。如果得到最優(yōu)wo及bo,那么就能夠得出支持向量機(jī)分類模型,使其作為線性判別函數(shù)通過以下公式表示:
以此預(yù)測未知樣本分類值,sgn指的是符號函數(shù)。
算法詳細(xì)步驟為:
其一,對樣本數(shù)據(jù)進(jìn)行歸一化的處理,從而避免大數(shù)據(jù)覆蓋小數(shù)值。
其二,實(shí)現(xiàn)標(biāo)簽數(shù)據(jù)值的規(guī)范化,兩個分類一般為1和-1。
其三,創(chuàng)建新函數(shù)K及懲罰參數(shù)C。在實(shí)驗(yàn)過程中,先利用常用基本核函數(shù)訓(xùn)練模型對測試精準(zhǔn)率及訓(xùn)練精度最優(yōu)核函數(shù)的尋找。然后,通過核函數(shù)對最優(yōu)新核函數(shù)進(jìn)行尋找。以此,對基本核函數(shù)最好的性能充分考慮,最新創(chuàng)建的函數(shù)利用經(jīng)驗(yàn)風(fēng)險和泛化能力綜合性能方面比較優(yōu),從而實(shí)現(xiàn)最佳分類效果,創(chuàng)建凸二次規(guī)劃問題。
其四,通過五折參數(shù)尋優(yōu),實(shí)現(xiàn)支持向量機(jī)分類模型的創(chuàng)建,通過模型在訓(xùn)練集及測試集中對分類效果進(jìn)行驗(yàn)證,求總體樣本精準(zhǔn)率。
其五,為了能夠提高模型分類效果的直觀性,將訓(xùn)練集和測試集作為基礎(chǔ)繪制模型分類的效果圖[1]。
2? 使用分析
2.1 實(shí)驗(yàn)方案設(shè)計(jì)
該文實(shí)驗(yàn)過程中的數(shù)據(jù)均為某院病理部數(shù)據(jù),此數(shù)據(jù)共有692個樣本,惡性腫瘤有235個,作為正樣本,良性腫瘤共有457個,作為負(fù)樣本,利用活組織切片對全部樣本進(jìn)行檢查并且確診,所有樣本中都有年齡和10個細(xì)胞病理特征。
在進(jìn)行實(shí)驗(yàn)的過程中,利用5次交叉驗(yàn)證方法分組數(shù)據(jù)集并且對其測試,簡單來說就是隨機(jī)劃分?jǐn)?shù)據(jù)為5組,每組循環(huán)作為測試集,其他都是訓(xùn)練集。對每次分組利用的測試集及訓(xùn)練集分類器進(jìn)行測試和實(shí)驗(yàn)。
2.2 分類結(jié)果和討論
使用總精準(zhǔn)率Q、靈敏度sen及特異度SPE對分類器性能進(jìn)行評價,其計(jì)算公式為:
TP指的是測試集中判斷準(zhǔn)確正樣本數(shù)量,F(xiàn)N指的是測試集中判斷錯誤負(fù)樣本數(shù)量,TN指的是測試集中精準(zhǔn)判斷負(fù)樣本的數(shù)量,F(xiàn)P指的是測試集中判斷錯誤的正樣本數(shù)量。Sen指的是測試集中正樣本靈敏度,Spe指的是負(fù)樣本特異度。Sen越大,說明正樣本識別具有較強(qiáng)的能力,能夠良好判別負(fù)樣本[2]。
對于SVM,在實(shí)驗(yàn)過程中使用多項(xiàng)式核函數(shù)等,并且通過5次交叉驗(yàn)證法進(jìn)行測試和訓(xùn)練。表1為SVM使用不同核函數(shù)測試結(jié)果,通過表1可以看出來,使用以上核函數(shù)分類對于數(shù)據(jù)集具有良好的精準(zhǔn)度,Sigmoid核函數(shù)精準(zhǔn)度是最高的。所以,對一定分類樣本來說,要想得到最優(yōu)分類效果,優(yōu)選核函數(shù)具有重要的作用,并且也表示SVM最佳核函數(shù)依賴樣本數(shù)據(jù)分布的情況。另外,通過表1還可以看出來,使用Sigmoid核函數(shù)的過程中,具有較高的分類靈敏度,多項(xiàng)式核函數(shù)時候的特異度是最高的,表示Sigmoidhe函數(shù)對于正樣本具有較高的識別率。
另外,對SVM和PNN、K-NN識別能力進(jìn)行了對比,表示只有使用Sigmoid核函數(shù)的支持向量機(jī)精準(zhǔn)度比較高,為96.24%。以此表示,使用Sigmoid核函數(shù)的支持向量機(jī)不急能夠提高正樣本識別率,還能夠良好地對乳腺癌患者和非乳腺癌病例進(jìn)行識別,使人為導(dǎo)致漏診及誤診的幾率得到降低。
3? 結(jié)語
該文根據(jù)臨床乳腺癌數(shù)據(jù)集,利用實(shí)驗(yàn)表示該文的診斷特異度、精準(zhǔn)率及靈敏值都比較高,說明使用該文方法能夠良好地診斷乳腺癌,從而提高乳腺癌的診斷效率,并且還能夠?yàn)獒t(yī)生提供數(shù)據(jù)支持。
參考文獻(xiàn)
[1] 呂萍麗.基于支持向量機(jī)的乳腺癌診斷模型的設(shè)計(jì)[J].福建電腦,2015(8):17-18.
[2] 章永來,史海波,尚文利,等.面向乳腺癌輔助診斷的改進(jìn)支持向量機(jī)方法[J].計(jì)算機(jī)應(yīng)用研究,2013,30(8):2373-2376.
①基金項(xiàng)目:2018年度湖北省教育廳科學(xué)技術(shù)研究項(xiàng)目“支持向量機(jī)分類在乳腺癌電阻抗特性診斷中的應(yīng)用研究”(項(xiàng)目編號:B2018488;項(xiàng)目負(fù)責(zé)人:汪慧玲)。