陳艷霞 劉揮
基于BP神經(jīng)網(wǎng)絡(luò)的醫(yī)學(xué)數(shù)據(jù)分析
陳艷霞 劉揮
BP網(wǎng)絡(luò)是一種基于誤差反向傳播(Back Propagation)算法的多層前向神經(jīng)網(wǎng)絡(luò)。采用動量梯度下降算法(TRAINGDM)訓(xùn)練BP網(wǎng)絡(luò),建立輸入到輸出的函數(shù)映射關(guān)系,使其對48例兩類五種醫(yī)學(xué)免疫學(xué)數(shù)據(jù)進(jìn)行訓(xùn)練與分類。訓(xùn)練集數(shù)據(jù)正確檢出率為100%,測試集數(shù)據(jù)正確檢出率為87.5%,效果優(yōu)良。結(jié)論BP網(wǎng)絡(luò)應(yīng)用于免疫學(xué)數(shù)據(jù)分類取得很好效果,在臨床免疫學(xué)人工智能診斷方面將有更為廣泛的應(yīng)用空間。
BP神經(jīng)網(wǎng)絡(luò);動量梯度下降算法;免疫學(xué)數(shù)據(jù)
人工神經(jīng)網(wǎng)絡(luò)理論以非線性大規(guī)模并行分布處理為特點(diǎn),突破了傳統(tǒng)的線性處理模式,以其高度的并行性,良好的容錯性和自適應(yīng)能力成為人們研究其賴以生存的非線性世界、探索和研究某些復(fù)雜大系統(tǒng)的有力工具,已應(yīng)用于很多領(lǐng)域的信息處理工作。
BP算法的多層前饋網(wǎng)絡(luò)的人工神經(jīng)網(wǎng)絡(luò)模型采用典型的有教師學(xué)習(xí)方式來進(jìn)行預(yù)測和分類問題的處理。采用的傳遞函數(shù)通常是sigmoid型可微函數(shù),可以實(shí)現(xiàn)輸入和輸出間的任意非線性映射。這使其在函數(shù)逼近、模式識別、數(shù)據(jù)壓縮領(lǐng)域有著更加廣泛的應(yīng)用。該模型的特點(diǎn)是信號由輸入層單向傳遞到輸出層,同一層神經(jīng)元之間互不傳遞信息,每個神經(jīng)元與鄰近層所有神經(jīng)元相連,各神經(jīng)元的作用函數(shù)為Sigmoid函數(shù),用樣本集合反復(fù)訓(xùn)練網(wǎng)絡(luò),并不斷修改權(quán)值,直到使實(shí)際輸出向量達(dá)到要求,訓(xùn)練過程結(jié)束。應(yīng)用BP網(wǎng)絡(luò)處理正常狀態(tài)與處于焦慮狀態(tài)的學(xué)生的血液中免疫學(xué)指標(biāo)數(shù)據(jù),取得了很好的效果[1]。
數(shù)據(jù)選自在某大學(xué)就讀的大學(xué)生,共計48例。在自愿、正常學(xué)習(xí)生活的情況下抽取他們的血液標(biāo)本,然后再在考試前抽取他們的血液標(biāo)本,分別進(jìn)行五項免疫學(xué)指標(biāo)檢驗(yàn),共獲得兩類、五項、480組數(shù)據(jù)。隨機(jī)把其中的20例學(xué)生的兩類、五項數(shù)據(jù)做為訓(xùn)練集輸入矢量輸入,目標(biāo)矢量為處于考前狀態(tài)的五項數(shù)據(jù)輸出為1,平時正常生活狀態(tài)的五項數(shù)據(jù)輸出為0。網(wǎng)絡(luò)訓(xùn)練時調(diào)整神經(jīng)元之間的連接權(quán)值,使網(wǎng)絡(luò)的輸出和實(shí)際的兩類情況盡可能相符。如果對所有的訓(xùn)練樣本集網(wǎng)絡(luò)的輸出95%或更高能保證與實(shí)際結(jié)果一致,則訓(xùn)練過程結(jié)束。網(wǎng)絡(luò)訓(xùn)練好后,剩余的28例學(xué)生的5項數(shù)據(jù)作為神經(jīng)網(wǎng)絡(luò)的輸入項,神經(jīng)網(wǎng)絡(luò)的輸出值就是該學(xué)生是處于考前狀態(tài)1還是平時正常生活狀態(tài)0。主要設(shè)計程序如下: %NEWFF-生成一個新的前向神經(jīng)網(wǎng)絡(luò);%TRAIN-對BP神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練;%SIM-對BP神經(jīng)網(wǎng)絡(luò)進(jìn)行仿真;pause%敲任意鍵開始
表1 BP神經(jīng)網(wǎng)絡(luò)處理免疫學(xué)數(shù)據(jù)結(jié)果
其中對于訓(xùn)練集,正常狀態(tài)與考前狀態(tài)的正確檢出率為100%。對于測試集,正常狀態(tài)的正確檢出率為85.7%;考前狀態(tài)的正確檢出率為89.3%。平均為87.5%。
3.1 本研究所采用的人工神經(jīng)網(wǎng)絡(luò)檢驗(yàn)免疫數(shù)據(jù)的結(jié)果較好地符合了已知數(shù)據(jù),具有較高的準(zhǔn)確性。
3.2 要想進(jìn)一步提高該方法的準(zhǔn)確性,應(yīng)該注意收集更多更全面的檢驗(yàn)數(shù)據(jù)。如果我們所使用的數(shù)據(jù)越多越全面,則其中所蘊(yùn)含的事物本身的規(guī)律性就越強(qiáng),利用人工神經(jīng)網(wǎng)絡(luò)從中所抽取的函數(shù)關(guān)系就越具有普遍性,因而就更準(zhǔn)確。
3.3 可能對亞健康的診斷具有指導(dǎo)意義。亞健康問題各國醫(yī)學(xué)界已作了一些研究,并取得了某些實(shí)際的成果。但是,由于亞健康的多種類型以及多種相關(guān)因素,使得現(xiàn)有的診斷在準(zhǔn)確性和實(shí)用性方面都存在著相當(dāng)?shù)木窒扌?,如建模?fù)雜困難。由于對影響罹病與否的各種因子的作用機(jī)制了解得不是很清楚,如何建立診斷模型,以及如何確定新建立的模型在何種程度上與實(shí)際情況相吻合還是一個問題;容錯能力不強(qiáng),適用范圍不廣;依賴于某些病例庫新建立起來的醫(yī)學(xué)模型往往具有很強(qiáng)的局限性,用于新的病例庫時誤差有時較大。另外,由于醫(yī)學(xué)方面的原因,我們收集到的數(shù)據(jù)有時不完整,而現(xiàn)有的研究方法所建立起的醫(yī)學(xué)模型由于容錯性差,對這些不完整的數(shù)據(jù)通常都難以處理。人工神經(jīng)網(wǎng)絡(luò)理論突破了傳統(tǒng)的線性處理模式,以其高度的并行性,良好的容錯性和自適應(yīng)能力成為人們研究其賴以生存的非線性世界,探索和研究某些復(fù)雜大系統(tǒng)的有力工具。對亞健康的診斷關(guān)鍵在于準(zhǔn)確找到亞健康的判定函數(shù),可能利用BP網(wǎng)絡(luò)的函數(shù)逼近功能來實(shí)現(xiàn)。這需要有更多的醫(yī)學(xué)數(shù)據(jù)來實(shí)踐檢驗(yàn)。
[1]許東,吳征.基于MATLAB6.X的系統(tǒng)分析與設(shè)計-神經(jīng)網(wǎng)絡(luò).西安電子科技大學(xué)出版社,2002:9.
[2]王俊杰,陳景武.BP神經(jīng)網(wǎng)絡(luò)在疾病預(yù)測中的應(yīng)用.?dāng)?shù)理醫(yī)藥學(xué)雜志,2008,21(3):260-262.
116044 大連醫(yī)科大學(xué)醫(yī)學(xué)影像學(xué)系(陳艷霞);大連醫(yī)科大學(xué)檢驗(yàn)醫(yī)學(xué)院(劉揮)