李 萍
(山西大同大學渾源師范分校,山西 渾源 037400)
乳腺腫瘤作為世界上女性中發(fā)病率較高的疾病之一,一直以來都是醫(yī)學方面研究熱點。特別是在中國,由于許多人飲食、生活環(huán)境等方面存在一些問題,近年來,患該類型疾病的人越來越多。對于這類型疾病,如果能提早發(fā)現(xiàn)、提早做出正確的診斷,將對病情的緩解非常有幫助。然而,及時、準確的對乳腺腫瘤進行診斷一直都是醫(yī)學界的難題,主要是由于現(xiàn)有醫(yī)學設備和醫(yī)生自身的能力并不能滿足實際乳腺腫瘤診斷工作的需求,出現(xiàn)誤診的幾率較大。由此可見,研究基于LVQ神經(jīng)網(wǎng)絡的乳腺腫瘤診斷具有非常重要的意義。
神經(jīng)網(wǎng)絡是對于人腦神經(jīng)網(wǎng)絡的抽象和建模,是人工智能的重要部分。學習矢量量化神經(jīng)網(wǎng)絡是一種較為簡單的神經(jīng)網(wǎng)絡,在進行分類處理工作時不需要對所輸入的向量進行歸一化、正交化。近些年來,在人工智能逐漸發(fā)展壯大的同時,LVQ神經(jīng)網(wǎng)絡的應用范圍也愈加廣泛[1-8]。因此,在乳腺腫瘤診斷方面運用學習矢量量化神經(jīng)網(wǎng)絡是行之有效的。
本文主要是研究基于LVQ神經(jīng)網(wǎng)絡的乳腺腫瘤診斷問題,LVQ神經(jīng)網(wǎng)絡的建模工作,然后再對其進行仿真測試,得出實驗結論。
學習矢量量化神經(jīng)網(wǎng)絡(Learning Vector Quantization Neural Network,簡稱LVQ神經(jīng)網(wǎng)絡),是近年來運用較為廣泛的一種神經(jīng)網(wǎng)絡。相比其他神經(jīng)網(wǎng)絡而言,LVQ神經(jīng)網(wǎng)絡具有效率高、使用簡單等特點。LVQ神經(jīng)網(wǎng)絡的拓撲結構主要由三層神經(jīng)元組成,包括輸入層、競爭層和線性輸出層。其神經(jīng)元之間的連接方式有部分連接和全連接兩種方式。在實驗的過程中,需要根據(jù)實際情況修改各層之間的連接權值。例如:在進行網(wǎng)絡訓練時,輸入層與隱含層之間的權值是需要修改的。
目前醫(yī)學中對乳腺腫瘤診斷的主要方法雖然比較多,但是,這些方法或多或少都存在較大的局限性。例如:X線光影中的輻射會對人體產(chǎn)生非常大的損害、CT檢查的檢查費用過高等等。此外,近紅外光透檢查對人體的損害較少,設備本身的成本也比較低,且移動起來較為方便,因此,其在臨床上的應用還是比較廣泛的。但是,由于近紅外光透檢查不能顯示鈣透率,其診斷符合率較低。當然,未來在進行乳腺腫瘤診斷時,還可以在超聲檢查方面做出改進,通過分析血管搏動指數(shù)和阻力指數(shù)來進行良性腫瘤還是惡性腫瘤的分類和判斷工作。
總之,目前我國在乳腺腫瘤診斷方面還存在較大的問題,有待進一步研究。未來在進行乳腺腫瘤診斷的相關工作時,應該充分考慮實際情況,例如:醫(yī)院的實際硬件條件、病人的經(jīng)濟狀況以及最重要的腫瘤診斷的準確率等等。
在對乳腺腫瘤進行診斷時,主要的依據(jù)是細胞核的顯微圖像,提取其中與腫瘤性質密切相關的特征來進行分析。本次實驗主要是選取了乳腺腫瘤細胞核的部分特征。主要包括:細胞核的半徑、質地、周長、面積、光滑性、緊密度、凹陷度、凹陷點數(shù)、對稱度以及斷裂度等共10個量化特征。將這些量化特征作為網(wǎng)絡的輸入,從而來診斷乳腺腫瘤的性質。
本次實驗中對乳腺腫瘤進行診斷分析的主要步驟如圖1所示。
圖1 乳腺腫瘤診斷的一般步驟
在采集數(shù)據(jù)時,對每一例病例組織中的各細胞核提取之前提到過的10個特征向量的平均值、標準差以及最壞值,一例病例共采取30個數(shù)據(jù)。在數(shù)據(jù)文件中,每組數(shù)據(jù)共32個字段。其中,病例編號、確診結果(用1表示良性,2表示惡性)為前兩個字段,以后字段分別為該病例病灶組織各細胞核顯微圖像10個量化特征的平均值、標準差以及最壞值。這樣能保證所提取數(shù)據(jù)的準確性、代表性,從而保證實驗結果的準確性。
最終提取到了596×32個數(shù)據(jù),數(shù)值類型均為double型,盡可能使所提取到的特征值精度足夠高,能夠滿足實際實驗的需求。并將這些數(shù)據(jù)保存為data.mat文件,在實驗中,當完成了對于LVQ神經(jīng)網(wǎng)絡的訓練工作時,輸入數(shù)據(jù)進行網(wǎng)絡測試以及運行得出最終的實驗結果。
完成上述數(shù)據(jù)采集工作之后,構建一個新的LVQ神經(jīng)網(wǎng)絡。利用newlvq()函數(shù)來創(chuàng)建LVQ網(wǎng)絡,并根據(jù)實際需要對相應的參數(shù)進行設置。
完成網(wǎng)絡創(chuàng)建以及參數(shù)設置工作之后,需要對網(wǎng)絡進行訓練學習。主要是通過Matlab自帶的函數(shù)train()來進行訓練。訓練過程中可以根據(jù)實驗的具體需要對LVQ神經(jīng)網(wǎng)絡的相關參數(shù)進行修改。
網(wǎng)絡訓練完成之后,利用之前搜集好的69組數(shù)據(jù)輸入訓練好的網(wǎng)絡,從而進行網(wǎng)絡仿真,得到結果。
Matlab神經(jīng)網(wǎng)絡工具箱調用非常簡單,其提供的函數(shù)十分豐富,本實驗在Matlab環(huán)境下的具體實現(xiàn)過程如下。
4.1.1 數(shù)據(jù)分析
實驗中共采取了569個病例樣本,其中包括良性腫瘤和惡性腫瘤。針對每一例病例提取其10個特征值的平均值、標準差和最壞值,共組成596×32個double類型數(shù)據(jù)。
4.1.2 清空環(huán)境變量
在運行所編寫好的程序運行之前,還需要對相關的環(huán)境變量進行清空,具體程序如下。
%%清空環(huán)境變量
clear all
clc
warning off
4.1.3 導入數(shù)據(jù)
本次實驗共搜集、整理了569個病例,其中有良性357例,其余為惡性病例。實驗過程中所采用的訓練集為500組,測試集為69組。實驗數(shù)據(jù)中用數(shù)字“1”與良性乳腺腫瘤對應,數(shù)字“2”與惡性乳腺腫瘤對應,數(shù)據(jù)保存在data.mat文件中。
4.1.4 創(chuàng)建LVQ網(wǎng)絡
利用newlvq()函數(shù)可以創(chuàng)建LVQ神經(jīng)網(wǎng)絡,還需要根據(jù)實驗的具體要求設置相關參數(shù)值,具體的程序如下。
net=newlvq(minmax(P_train),10,[0.6 0.4]);
% 設置網(wǎng)絡參數(shù)
net.trainParam.epochs=1000;net.trainParam.show=10;
net.trainParam.lr=0.1;net.trainParam.goal=0.1;
4.1.5 訓練LVQ網(wǎng)絡
完成網(wǎng)絡創(chuàng)建以及參數(shù)設置工作之后,需要對網(wǎng)絡進行訓練學習,訓練結果如圖2所示,訓練誤差走勢圖如圖3所示。訓練主要用到的函數(shù)為MATLAB自帶的函數(shù)train(),具體的程序如下。
%%網(wǎng)絡訓練
net=train(net,P_train,T_train);
4.1.6 仿真測試
通過輸入測試集來輸出仿真數(shù)據(jù),主要用到的函數(shù)是sim()函數(shù),具體的程序如下。
%%仿真測試
T_sim=sim(net,P_test);Tc_sim=vec2ind(T_sim);result=[Tc_sim;Tc_test];
說明:1) vec2ind()函數(shù)的作用與ind2vec()函數(shù)的作用相反,將目標向量轉換為對應的代表類別的下標矩陣。
2) result第1行為測試集的仿真結果,第2行為測試集的真實結果。
某次運行神經(jīng)網(wǎng)絡訓練測試的運行結果如圖2所示。
圖2 某次運行結果截圖
圖3 對應正確率的走勢分析圖
通過多次運行對比,發(fā)現(xiàn)最終得到的良性腫瘤和惡性腫瘤的誤診率均低于10%,這與預期的結果是相符合的。診斷結果對應的正確率走勢分析如圖3所示。而在臨床的診斷中,利用乳腺光影和醫(yī)生判斷的方法來進行乳腺腫瘤診斷,由于各方面的局限性,誤診率是比較高的。本次實驗的誤診率較低,證明了利用LVQ神經(jīng)網(wǎng)絡建模來進行乳腺腫瘤診斷的可行性。
乳腺腫瘤診斷問題在實際生活中是一個較為復雜的問題,醫(yī)學中最常采用的診斷方法由于費用較高、診斷效率較差等原因存在著一定的局限性。通過學習矢量量化神經(jīng)網(wǎng)絡來進行乳腺腫瘤的診斷工作能夠節(jié)約成本、診斷準確率較高,并且與醫(yī)生進行診斷相比診斷結果少了一些主觀性,多了一些客觀性。這便是乳腺腫瘤這類型疾病所需要的,充分體現(xiàn)了這種方法的優(yōu)越性。通過上面的結果顯示,通過將學習矢量量化神經(jīng)網(wǎng)絡應用于乳腺腫瘤診斷中的確診率較高,是非??尚械?。今后還需要對LVQ神經(jīng)網(wǎng)絡進行更進一步的研究,改進算法,盡可能提高確診率。