鄒倩穎, 吳寶永, 王小芳,2
(1.電子科技大學(xué)成都學(xué)院,云計(jì)算科學(xué)與技術(shù)系,成都611731;2.西華師范大學(xué)計(jì)算機(jī)學(xué)院,四川南充637002)
自20世紀(jì)起,人工智能在許多行業(yè)實(shí)現(xiàn)了創(chuàng)新,不僅提高工作效率,還有準(zhǔn)確率。就醫(yī)療領(lǐng)域而言,人工智能在臨床診斷問題上實(shí)現(xiàn)了應(yīng)用,但人工智能應(yīng)用到醫(yī)學(xué)影像學(xué)領(lǐng)域的起步較遲,其原因在于用于醫(yī)學(xué)影像診斷的人工智能須依靠人主觀建立數(shù)學(xué)模型[1]。文獻(xiàn)[2]中提出了一種基于支持向量機(jī)與貝葉斯的算法,利用22個(gè)定量特征對(duì)肺炎進(jìn)行判斷,但是其在不同機(jī)器產(chǎn)生的圖像效果不同,準(zhǔn)確率不太穩(wěn)定。文獻(xiàn)[3]中提出了一種基于小波的3D-CT圖像特征提取,但其對(duì)數(shù)據(jù)集要求過高。斯坦福大學(xué)在2017年設(shè)計(jì)了一個(gè)名為CheXNet,用于判斷胸腔部分的14種疾病,包括肺炎,雖然其識(shí)別率高95%,但其并未對(duì)肺炎的種類進(jìn)行細(xì)分[4]。
本文采用卷積神經(jīng)網(wǎng)絡(luò)(CNN)和仿生模式識(shí)別相結(jié)合的方法,首先使用卷積神經(jīng)網(wǎng)絡(luò)作為圖像特征的提取器,使得機(jī)器無需人工進(jìn)行特征提取,同時(shí)利用基于仿生模式識(shí)別的分類網(wǎng)絡(luò)作為分類器,增加了分類的準(zhǔn)確率。實(shí)驗(yàn)證明,本文所設(shè)計(jì)的方法平均準(zhǔn)確率達(dá)90%,所設(shè)計(jì)方法不僅僅只是局限于肺炎判別,亦可遷移到其他圖像識(shí)別領(lǐng)域。
CNN[5]是一種深度神經(jīng)網(wǎng)絡(luò),常用于對(duì)視覺圖像進(jìn)行分析。CNN是由生物過程所引導(dǎo)[6],其神經(jīng)元之間的連接模式類似于動(dòng)物的視覺皮層中的組織。單個(gè)皮層神經(jīng)元在被稱為感受野的視野的受限區(qū)域中,對(duì)刺激作出反應(yīng)。不同神經(jīng)元的感受野部分互相疊加,使得它們覆蓋整個(gè)視野。
CNN是由卷積層、池化層和全連接層交叉堆疊而成的前饋神經(jīng)網(wǎng)絡(luò),其使用反向傳播算法進(jìn)行訓(xùn)練。在結(jié)構(gòu)上,CNN有3個(gè)特性:局部連接、權(quán)重共享和子采樣。得益于此,CNN有一定程度上的平移、縮放和旋轉(zhuǎn)不變性。
CNN的典型架構(gòu)通常使用多項(xiàng)邏輯回歸進(jìn)行分類[7-8],然而,這種方式性能不理想。研究表明[9],如果在CNN后面添加了一個(gè)表現(xiàn)良好的分類器(如支持向量機(jī)(SVM)),分類精度將在一定程度上得到提高。與單獨(dú)使用CNN或SVM相比,由CNN和SVM結(jié)合的模型展現(xiàn)出了更高的準(zhǔn)確率。
仿生模式識(shí)別(BPR)[10]更接近人類的認(rèn)知功能,而BPR與傳統(tǒng)的模式識(shí)別相比,顯著的不同在于以“最優(yōu)劃分”為主要原則。BPR中,“認(rèn)知”一類事物對(duì)于分析和“認(rèn)知”由同一類的所有樣本組成的無限點(diǎn)集的形狀是必不可少的。文獻(xiàn)[11]中也指出“拓?fù)淇臻g的概念非常普遍,關(guān)于拓?fù)淇臻g拓?fù)涞目茖W(xué)是關(guān)于連續(xù)性的最一般的數(shù)學(xué)分支”BPR,只是分析點(diǎn)集拓?fù)渲辛餍蔚姆椒ǎ虼?,BPR也稱為拓?fù)淠J阶R(shí)別(TPR)。自其被提出之后,已經(jīng)用于人臉識(shí)別[12]等領(lǐng)域。
圖1所示為二維平面中,BPR與傳統(tǒng)模式識(shí)別方法所形成的樣本子空間的對(duì)照示意圖。圖中圓形代表要識(shí)別的樣本;正方形與三角形代表其他兩類樣本;折線為傳統(tǒng)的BP網(wǎng)絡(luò)模式識(shí)別劃分的方式;大圓代表RBF網(wǎng)絡(luò)模式識(shí)別劃分的方式;橢圓所連成圖形代表了仿生模式識(shí)別的劃分。
圖1 仿生模式識(shí)別與傳統(tǒng)模式識(shí)別方法對(duì)照示意圖
本文設(shè)計(jì)的改進(jìn)BPR的肺炎判別算法主要有兩部分:① 利用改進(jìn)的CNN模型對(duì)肺炎圖像進(jìn)行特征提??;② 添加基于BPR的分類網(wǎng)絡(luò)進(jìn)行訓(xùn)練,進(jìn)而得到分類網(wǎng)絡(luò),具體過程如圖2所示。
圖2 改進(jìn)的仿生模式識(shí)別過程圖
具體步驟如下:
(1)數(shù)據(jù)預(yù)處理。將肺炎圖像歸一化為同樣大小的實(shí)驗(yàn)圖像,在本文實(shí)驗(yàn)中設(shè)置為(256×256)px。
(2)特征向量提取。肺炎圖像按類別分好,分別存儲(chǔ);隨后按照類別分別輸入本文所設(shè)計(jì)的改進(jìn)的CNN。
(3)分類網(wǎng)絡(luò)訓(xùn)練。從CNN中特征向量作為高維空間中的點(diǎn),按類別分別輸入本文設(shè)計(jì)的基于BPR的分類網(wǎng)絡(luò)進(jìn)行訓(xùn)練。
2.2.1 卷積層
卷積層中的X光片可與一個(gè)卷積核進(jìn)行卷積,其結(jié)果經(jīng)過激活函數(shù)后輸出形成卷積層的特征圖。卷積層形式為
式中:l代表層數(shù);kij核函數(shù)表示權(quán)重參數(shù);Mj代表輸入特征圖的集合;i表示第i層;j表示第j個(gè)輸入的X光片;每個(gè)輸出圖有一個(gè)偏置值b;f(·)為激活函數(shù)。
2.2.2 池化層
池化層的輸入源于上一個(gè)卷積層中X光片的卷積,主要起增強(qiáng)魯棒性的作用,同時(shí)減少了參數(shù)的數(shù)量,也一定程度防止過擬合現(xiàn)象的發(fā)生。特征圖經(jīng)過池化層之后個(gè)數(shù)不會(huì)發(fā)生改變,但是特征圖會(huì)變小。一般地,池化層公式表示為
式中:down(·)表示下采樣函數(shù)(本文所構(gòu)建的CNN中使用max()函數(shù),即最大池化)是下采樣對(duì)應(yīng)的“權(quán)重”。
2.2.3 全連接層
全連接層是用于連接前后層神經(jīng)元的網(wǎng)絡(luò)層,通常而言,全連接層位于2個(gè)一維的網(wǎng)絡(luò)層之間。假設(shè)x∈Rm表示輸入層向量,y∈R表示輸出層向量,則在全連接層就有映射矩陣W∈Rm×n與偏置向量b∈Rn。其表達(dá)式為
2.2.4 網(wǎng)絡(luò)結(jié)構(gòu)
本文對(duì)LeNet-5模型進(jìn)行改進(jìn),得出了一個(gè)特征提取的網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行訓(xùn)練。訓(xùn)練數(shù)據(jù)時(shí),所使用的訓(xùn)練數(shù)據(jù)按批隨機(jī)選擇,分批輸入網(wǎng)絡(luò)中進(jìn)行訓(xùn)練。本文所設(shè)計(jì)的網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示。
圖3 網(wǎng)絡(luò)示意圖
本文將各類樣本中的每1張圖像輸入到網(wǎng)絡(luò)中進(jìn)行訓(xùn)練與特征提取,最終形成網(wǎng)絡(luò)模型,網(wǎng)絡(luò)的具體參數(shù)如表1所示。其中:R代表ReLU[13](線性整流函數(shù))函數(shù);M代表最大池化操作;D代表Dropout。
表1 神經(jīng)網(wǎng)絡(luò)參數(shù)
2.3.1 同源連續(xù)性
BPR旨在對(duì)特征空間中一類樣本分布進(jìn)行最佳覆蓋。對(duì)于各類X光圖像,BPR都將對(duì)其進(jìn)行最佳覆蓋?!案呔S空間復(fù)雜幾何形體覆蓋識(shí)別方法”為樣本點(diǎn)的分布提供了先驗(yàn)知識(shí),因此可以將分析特征空間訓(xùn)練樣本點(diǎn)間的關(guān)系作為基點(diǎn),研究特征空間中某類樣本的分布狀況,進(jìn)而對(duì)其進(jìn)行合理的覆蓋,從而“認(rèn)識(shí)”某類樣本。多維空間仿生信息學(xué)認(rèn)為:可用的信息都包含在訓(xùn)練集,在多維空間Rn中,設(shè)A類所有樣本點(diǎn)形成的集合為A,任取兩個(gè)樣本X,Y∈A且X≠Y,對(duì)于任意的ε>0,則一定存在集合B滿足,
式中:ρ(XM,XM+1)表示樣本XM;XM+1間的歐式距離。
但通常樣本分布是不規(guī)則的,要形成的覆蓋形狀也是非常復(fù)雜的。因此用來形成覆蓋的方法必須能夠在特征空間中形成一個(gè)高維空間的連續(xù)復(fù)雜的幾何形體來覆蓋樣本[12]。在本文構(gòu)造的神經(jīng)網(wǎng)絡(luò)中,樣本已經(jīng)由X光片經(jīng)由前文構(gòu)建的卷積神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換為了特征向量。
2.3.2 多權(quán)值向量神經(jīng)元
對(duì)于訓(xùn)練集中的X光片所生成特征向量可以利用多權(quán)值向量神經(jīng)元進(jìn)行構(gòu)造。多權(quán)值向量神經(jīng)元在特定的計(jì)算函數(shù)φ下可以形成一個(gè)封閉的曲面,因此可以使用多權(quán)值向量神經(jīng)元進(jìn)行BPR的神經(jīng)網(wǎng)絡(luò)構(gòu)造。
多權(quán)值向量神經(jīng)元的通用表達(dá)式為
式中:w1,w2,…,wm為m 個(gè)權(quán)向量;X 為輸入向量;φ為計(jì)算函數(shù);f為非線性轉(zhuǎn)移函數(shù);θ為多權(quán)值神經(jīng)元激活閾值。
設(shè)特征空間是n維實(shí)數(shù)空間Rn,即X∈Rn,向量函數(shù)方程:
此時(shí),可視為由w1,w2,…,wm在特征空間Rn中構(gòu)成的某種軌跡,該軌跡位于Rn中n-1維空間,若該軌跡為一個(gè)封閉的曲面,則就在Rn中形成了一個(gè)有限的覆蓋區(qū)域。若改變神經(jīng)元權(quán)值,則會(huì)得到具有不同形狀的超曲面。故對(duì)于某類A,存在一個(gè)覆蓋區(qū)域,該區(qū)域?yàn)樵擃愃袠颖竟餐采w。
在影像學(xué)肺炎判別中,可以采用超香腸神經(jīng)元[12],其表達(dá)式:
式中:θ(w1,w2)表示由n 維空間中兩點(diǎn)w1、w2確定的有限一維線段;φ(w1,w2,X)表示在n維空間中X 到θ(w1,w2)的歐式距離。
判別函數(shù)
2.3.3 網(wǎng)絡(luò)的構(gòu)建
網(wǎng)絡(luò)的構(gòu)建具體步驟如下:
(1)設(shè)某類肺X光圖片的所有構(gòu)網(wǎng)樣本點(diǎn)集合為A = {a1,a2,…,aN},N 為該類樣本點(diǎn)總數(shù)。
(2)建立本文第2節(jié)設(shè)計(jì)的基于卷積神經(jīng)網(wǎng)絡(luò)的圖像特征提取網(wǎng)絡(luò)。
(3)將集合A中所有樣本輸入步驟(2)所建立的卷積神經(jīng)網(wǎng)絡(luò)中,得到N個(gè)該類X光圖片的1 024維特征向量,也就是得到了該類所有樣本在1 024維空間中的分布情況。計(jì)算所有點(diǎn)兩兩之間的歐式距離,找出歐式距離最小的兩個(gè)點(diǎn),記為BA1、BA2。這兩個(gè)點(diǎn)構(gòu)成的第1個(gè)一維線段記作θA1。用一個(gè)超香腸神經(jīng)元對(duì)這個(gè)線段進(jìn)行覆蓋,其覆蓋范圍,
式中:ρXθA1表示點(diǎn)X 到空間θA1的距離;PA1為所構(gòu)造的幾何形體。
(4)隨后針對(duì)已經(jīng)構(gòu)造好的幾何形體PA1,判斷剩余各點(diǎn)是否被其覆蓋。若在PA1覆蓋范圍內(nèi),則排除;而對(duì)于在PA1范圍外的點(diǎn),按步驟(3),找出離BA2最近的點(diǎn),記作BA3,BA2與BA3此時(shí)便構(gòu)成了第2個(gè)一維線段,記作θA2,同樣地,也用一個(gè)超香腸神經(jīng)元來覆蓋此線段,其覆蓋范圍:
式中:ρXθA2表示點(diǎn)X 到空間θA2的距離;PA2為所構(gòu)造的幾何形體。
不斷重復(fù)上述步驟,直至處理完所有樣本點(diǎn),此時(shí)共產(chǎn)生了m個(gè)超香腸神經(jīng)元,則該類A的覆蓋范圍便是全部個(gè)神經(jīng)元的覆蓋范圍
(5)對(duì)訓(xùn)練集中各類樣本做以上操作,即可得到各類所對(duì)應(yīng)的覆蓋范圍。
(1)因地制宜,逐漸形成“家和計(jì)劃”本土服務(wù)特色模式。如沙坪壩區(qū)打造“家和故事”;黔江區(qū)探索“離婚分類分流服務(wù)”模式;長(zhǎng)壽區(qū)針對(duì)服刑人員開展的困境家庭案例;綦江區(qū)以家庭理財(cái)教育助力脫貧致富;秀山縣挖掘傳統(tǒng)民族葷素作用等。
2.3.4 樣本識(shí)別
對(duì)于某張X光片的樣本識(shí)別過程如下:
對(duì)待識(shí)別樣本點(diǎn)X到i類高維空間覆蓋區(qū)中第j個(gè)神經(jīng)元覆蓋區(qū)域的距離進(jìn)行計(jì)算,
則樣本到第i類的覆蓋區(qū)域的距離,
式中:m表示第i類的超香腸神經(jīng)元總數(shù);ρij表示待識(shí)別樣本點(diǎn)X到第i類第j個(gè)超香腸神經(jīng)元的歐式距離。當(dāng)此樣本到第i類的覆蓋區(qū)域的距離≤0時(shí),則表明此樣本在此覆蓋區(qū)域中;反之,則不在。若不落在任何一類的覆蓋區(qū)域內(nèi),則表明此樣本不在任何一類中。
本文實(shí)驗(yàn)所用數(shù)據(jù)集共有3種類型(正常、病毒型肺炎、細(xì)菌型肺炎),由原數(shù)據(jù)集重新劃分,本文分別將其記為A組、B組和C組,各組訓(xùn)練集、驗(yàn)證集與測(cè)試集的比例均為8∶1∶1。
軟件環(huán)境:Debian 9.4。硬件環(huán)境:Intel(R)Xeon(R)CPU E5-2650 v3 @ 2.30 GHz,Tesla K80 NVIDIA Tesla K80,16 GB 內(nèi)存,1TB 硬盤。
3.2.1 A 組對(duì)比實(shí)驗(yàn)
使用A組進(jìn)行實(shí)驗(yàn),結(jié)果如表2所示。
表2 A組改進(jìn)仿生模式識(shí)別與SVM實(shí)驗(yàn)結(jié)果對(duì)比表
本次實(shí)驗(yàn)中,改進(jìn)的BPR對(duì)于正常類與病毒型的識(shí)別準(zhǔn)確率(下文簡(jiǎn)稱識(shí)別率)相較于SVM算法低了1%,細(xì)菌型高了22%,整體均值高了10%??梢奡VM
雖然在正常與病毒型的X光圖像上識(shí)別率高于本文所設(shè)計(jì)的方法,但是明顯在對(duì)于細(xì)菌性識(shí)別是其短板,但本文所提方案各類X光圖像的識(shí)別率較為高,故就實(shí)用性而言,本文所提方案略勝一籌。
3.2.2 B 組對(duì)比實(shí)驗(yàn)
使用B組對(duì)比實(shí)驗(yàn)的結(jié)果如表3所示。
表3 B組改進(jìn)仿生模式識(shí)別與SVM實(shí)驗(yàn)結(jié)果對(duì)比
在本組實(shí)驗(yàn)中,即數(shù)據(jù)量稍有增大時(shí),改進(jìn)的仿生模式識(shí)別對(duì)于正常類X光圖像相較于支持向量機(jī)高了1%,病毒型基本無差,細(xì)菌型高了16%,整體均值高了6%。相較于A組實(shí)驗(yàn),兩種算法的對(duì)于各類X光片的識(shí)別效率均有浮動(dòng),其中支持向量機(jī)對(duì)于細(xì)菌型的精度上升尤為明顯。兩種算法其他類別精度下降的原因在于原始圖像存在未去除噪聲。
3.2.3 C 組對(duì)比實(shí)驗(yàn)
使用C組對(duì)比實(shí)驗(yàn)的結(jié)果如表4所示。
表4 C組改進(jìn)仿生模式識(shí)別與SVM實(shí)驗(yàn)結(jié)果對(duì)比
本組實(shí)驗(yàn),即訓(xùn)練數(shù)據(jù)較多時(shí),改進(jìn)的仿生模式識(shí)別對(duì)于正常類的識(shí)別率較支持向量機(jī)高了19%,病毒型高了5%,細(xì)菌型高了4%,平均高了10%??梢娂词乖跀?shù)據(jù)量較大時(shí),改進(jìn)的仿生模式識(shí)別的平均表現(xiàn)水平依舊高于支持向量機(jī),噪聲對(duì)其影像也小于支持向量機(jī)。
總的說來,上述3組實(shí)驗(yàn)(A、B、C),使用了3組數(shù)量呈梯度上升的數(shù)據(jù)集,實(shí)驗(yàn)結(jié)果揭示了改進(jìn)的仿生模式識(shí)別和支持向量機(jī)在數(shù)據(jù)從少到多的情況下,其對(duì)各類X光圖像的識(shí)別情況。A組~B組對(duì)比實(shí)驗(yàn)改進(jìn)的仿生模式識(shí)別的平均識(shí)別率,基本不變保持在92%,與此同時(shí)支持向量機(jī)的平均識(shí)別率由82%上升到了86%,上升了4%;B組~C組對(duì)比實(shí)驗(yàn),改進(jìn)的仿生模式識(shí)別的平均識(shí)別率隨著樣本訓(xùn)練樣本數(shù)量的增加下降了4%,達(dá)到88%,支持向量機(jī)的平均識(shí)別率下降了8%達(dá)到78%??梢娫肼晫?duì)本文所提出構(gòu)建的改進(jìn)的仿生模式識(shí)別的影響小于其對(duì)傳統(tǒng)模式識(shí)別的影像。在本文所采用的數(shù)據(jù)集上,對(duì)3種類別的影像判別優(yōu)于傳統(tǒng)的模式識(shí)別,在一定情況下改善了肺炎判別的性能。
本文為了解決肺炎判別而提出了結(jié)合卷積神經(jīng)網(wǎng)絡(luò)和仿生模式識(shí)別的網(wǎng)絡(luò)模型,通過卷積神經(jīng)網(wǎng)絡(luò)自動(dòng)提取特征向量,并將其轉(zhuǎn)化為高位空間中的點(diǎn),利用仿生模式識(shí)別的分類網(wǎng)絡(luò)進(jìn)行分類,實(shí)驗(yàn)所得結(jié)果平均準(zhǔn)確率達(dá)90%,在一定程度上解決了肺炎判別問題。本文所設(shè)計(jì)的技術(shù)并不局限于肺炎的判別,亦可用于疾病的檢測(cè)和分類,例如肺結(jié)核、肺腫瘤以及骨骼腫瘤等。但是本文所提出的方法,在樣本數(shù)量較大時(shí)算法復(fù)雜度增加,訓(xùn)練時(shí)間增長(zhǎng)較為嚴(yán)重.針對(duì)這些問題,作者將進(jìn)行更深入的研究。