李曉峰,李 東
1(黑龍江外國語學(xué)院 信息工程系,哈爾濱 150025)
2(哈爾濱工業(yè)大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,哈爾濱 150001)
隨著大數(shù)據(jù)信息處理技術(shù)的發(fā)展,相關(guān)領(lǐng)域逐漸采用大數(shù)據(jù)信息處理和數(shù)據(jù)挖掘方法,進(jìn)行醫(yī)療信息管理系統(tǒng)設(shè)計(jì),以此來提高醫(yī)療信息管理的智能性和自動化水平[1,2].在進(jìn)行醫(yī)療數(shù)據(jù)的信息化管理中,需要對醫(yī)療數(shù)據(jù)進(jìn)行優(yōu)化檢索和識別,提取大數(shù)據(jù)信息庫中的醫(yī)療數(shù)據(jù)特征量,采用統(tǒng)計(jì)特征分析和數(shù)據(jù)聚類挖掘技術(shù),進(jìn)行醫(yī)療數(shù)據(jù)的大數(shù)據(jù)挖掘和聚類處理,提高醫(yī)療數(shù)據(jù)的模糊聚類和特征分析能力[3].
目前,已經(jīng)有相關(guān)研究人員對醫(yī)療數(shù)據(jù)的重建方法進(jìn)行了研究.文獻(xiàn)[4]提出了一種針對多類醫(yī)療數(shù)據(jù)的挖掘算法,在統(tǒng)計(jì)方法的基礎(chǔ)上對醫(yī)療數(shù)據(jù)的安全模式和誘因模式進(jìn)行準(zhǔn)確定義,同時(shí),采用分類器對醫(yī)療數(shù)據(jù)進(jìn)行重建,根據(jù)實(shí)驗(yàn)結(jié)果可知,該算法可有效對數(shù)據(jù)進(jìn)行挖掘,但是沒有考慮到數(shù)據(jù)冗余度問題,不能實(shí)現(xiàn)快速識別.文獻(xiàn)[5]提出了一種基于LLE和MP的空間數(shù)據(jù)重建方法,首先對空間數(shù)據(jù)重建中的不確定性進(jìn)行定量分析,根據(jù)分析結(jié)果采用多點(diǎn)信息統(tǒng)計(jì)方法將非線性數(shù)據(jù)進(jìn)行降維,最后采用LLE和MP方法對空間數(shù)據(jù)進(jìn)行重建,根據(jù)實(shí)驗(yàn)結(jié)果可知,該方法可以實(shí)現(xiàn)對空間數(shù)據(jù)的重建,但是由于該方法沒有考慮到對不同類型數(shù)據(jù)進(jìn)行分類,因此存在重建速率較低的問題.
根據(jù)上述分析可以得出,研究醫(yī)療數(shù)據(jù)的優(yōu)化檢索應(yīng)該建立在對醫(yī)療數(shù)據(jù)的表面重建基礎(chǔ)上,通過對醫(yī)療數(shù)據(jù)進(jìn)行自適應(yīng)的特征重構(gòu),提取醫(yī)療數(shù)據(jù)的統(tǒng)計(jì)特征值,結(jié)合模糊網(wǎng)格聚類技術(shù),實(shí)現(xiàn)醫(yī)療數(shù)據(jù)采樣和特征提取,挖掘醫(yī)療數(shù)據(jù)的譜特征量,根據(jù)特征挖掘結(jié)果進(jìn)行數(shù)據(jù)聚類和表面重建.為解決傳統(tǒng)方法存在的缺陷,本文提出一種基于改進(jìn)全卷積神經(jīng)網(wǎng)絡(luò)的醫(yī)療數(shù)據(jù)表面重建算法,首先進(jìn)行醫(yī)療數(shù)據(jù)特征分析和融合處理,然后進(jìn)行數(shù)據(jù)統(tǒng)計(jì)特征量提取,采用改進(jìn)全卷積神經(jīng)網(wǎng)絡(luò)分類器對重構(gòu)數(shù)據(jù)進(jìn)行分類識別和重建,最后進(jìn)行仿真實(shí)驗(yàn)分析,展示了本文方法在提高醫(yī)療數(shù)據(jù)表面重建能力方面的優(yōu)越性能.
為了實(shí)現(xiàn)對醫(yī)療數(shù)據(jù)表面重建,需要首先構(gòu)建醫(yī)療數(shù)據(jù)的大數(shù)據(jù)采樣模型,結(jié)合RFID技術(shù),挖掘醫(yī)療數(shù)據(jù)譜的關(guān)聯(lián)規(guī)則項(xiàng),數(shù)據(jù)采樣系統(tǒng)結(jié)構(gòu)模型如圖1所示.
圖1 數(shù)據(jù)采樣系統(tǒng)結(jié)構(gòu)模型
根據(jù)圖1所示的醫(yī)療數(shù)據(jù)采樣系統(tǒng)結(jié)構(gòu),采用無線RFID和ZigBee組網(wǎng)技術(shù)[6,7],進(jìn)行醫(yī)療數(shù)據(jù)采樣的網(wǎng)絡(luò)節(jié)點(diǎn)分布式設(shè)計(jì),采用多維傳感跟蹤拾貝方法進(jìn)行醫(yī)療數(shù)據(jù)采樣后的信息融合和大數(shù)據(jù)特征分析,提取醫(yī)療數(shù)據(jù)的譜特征量,采用向量量化編碼方法進(jìn)行醫(yī)療數(shù)據(jù)結(jié)構(gòu)重組,得到醫(yī)療數(shù)據(jù)的信息特征量為:
采用RFID信息融合技術(shù),構(gòu)建醫(yī)療數(shù)據(jù)分布的標(biāo)量時(shí)間序列為x(t),t=0,1,···,n?1,給定醫(yī)療數(shù)據(jù)信息流的二維統(tǒng)計(jì)特征分布模型為x1,x2,···,xn∈Cm(m維復(fù)數(shù)空間),在醫(yī)療數(shù)據(jù)的大數(shù)據(jù)分布模型中,采用模糊聚類方法,得到醫(yī)療數(shù)據(jù)關(guān)聯(lián)規(guī)則分布集的簇模型描述為:
其中,ρ1,···,ρn為一組醫(yī)療數(shù)據(jù)的主成分特征,結(jié)合多元回(歸分)析方法,構(gòu)建醫(yī)療數(shù)據(jù)的關(guān)聯(lián)規(guī)則集為O(d)和ON1/d,根據(jù)模糊的回歸分析結(jié)果,在m→1時(shí),snξ→tanhξ,提取醫(yī)療數(shù)據(jù)統(tǒng)計(jì)特征值,在鄰域空間(t,f)內(nèi),得到醫(yī)療數(shù)據(jù)采集輸出的統(tǒng)計(jì)指數(shù)集為:
根據(jù)上述對醫(yī)療數(shù)據(jù)的采集結(jié)果,對醫(yī)療數(shù)據(jù)進(jìn)行信息融合處理.
根據(jù)醫(yī)療數(shù)據(jù)的主成分特征,獲取醫(yī)療數(shù)據(jù)的特征值,進(jìn)行信息融合,在融合慣性空間分布矩陣G=[Ek×k|A]中,參數(shù)初始值設(shè)置為(x1,x2,···,xn),采集的醫(yī)療數(shù)據(jù)包括n個(gè)變量,可以用 {y1,y2,···,yn}表示,調(diào)整醫(yī)療數(shù)據(jù)的關(guān)聯(lián)規(guī)則項(xiàng),構(gòu)建醫(yī)療數(shù)據(jù)的模糊信息融合模型:
在強(qiáng)干擾下醫(yī)療數(shù)據(jù)頻域檢測的邊值收斂條件滿足如下邊界函數(shù)為:
在醫(yī)療數(shù)據(jù)分布的最小共享資源分配區(qū)域內(nèi),采用優(yōu)先級調(diào)度方法進(jìn)行醫(yī)療數(shù)據(jù)的特征融合,融合方程描述為:
其中,x(t)= φ(t),t∈ [?h,0],醫(yī)療數(shù)據(jù)挖掘采用整體的規(guī)劃方法,得到輸出的訓(xùn)練特征集為:
對于x(t),采用密集型模糊迭代方法,進(jìn)行醫(yī)療數(shù)據(jù)的融合處理,采用卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法進(jìn)行醫(yī)療數(shù)據(jù)動態(tài)遷移均衡調(diào)度[8,9],卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)函數(shù)為:
根據(jù)式(10),結(jié)合隨機(jī)負(fù)載均衡分配方法,進(jìn)行醫(yī)療數(shù)據(jù)動態(tài)遷移負(fù)載均衡控制[10,11],得到負(fù)載量為:
醫(yī)療大數(shù)據(jù)存儲介質(zhì)OD對w間路徑k上傳遞衰減為 ω,初始化輪詢?nèi)蝿?wù),在模糊約束控制下,醫(yī)療數(shù)據(jù)的融合負(fù)載均衡調(diào)度模型可以描述為:
其中,多隊(duì)列調(diào)度任務(wù)誤差ξkw(ω)可以表示為:
提取醫(yī)療數(shù)據(jù)的統(tǒng)計(jì)特征量,采用相關(guān)性融合檢測方法,得到信息融合輸出為各個(gè)醫(yī)療數(shù)據(jù)融合作業(yè)隊(duì)列中的開銷可以表示為:
根據(jù)上述分析,結(jié)合自適應(yīng)的反饋調(diào)節(jié)方法進(jìn)行醫(yī)療數(shù)據(jù)表面特征的重建,采用多元回歸分析方法提取醫(yī)療數(shù)據(jù)的相關(guān)性統(tǒng)計(jì)特征量,對提取的特征量進(jìn)行貫序采樣和信息融合,以此來提高數(shù)據(jù)挖掘和重建的準(zhǔn)確性.
在上述采用無線射頻識別技術(shù)進(jìn)行醫(yī)療數(shù)據(jù)的大數(shù)據(jù)采樣和信息融合處理的基礎(chǔ)上,進(jìn)行醫(yī)療數(shù)據(jù)表面重建算法的優(yōu)化設(shè)計(jì),本文提出一種基于改進(jìn)全卷積神經(jīng)網(wǎng)絡(luò)的醫(yī)療數(shù)據(jù)表面重建算法.構(gòu)建貫序自適應(yīng)預(yù)測方法進(jìn)行醫(yī)療數(shù)據(jù)的統(tǒng)計(jì)特征預(yù)測,得到統(tǒng)計(jì)特征量的預(yù)測的迭代式為:
設(shè)置醫(yī)療數(shù)據(jù)特征構(gòu)成的數(shù)據(jù)集合X,采用多元回歸分析方法提取醫(yī)療數(shù)據(jù)的相關(guān)性統(tǒng)計(jì)特征量,回歸分析模型用下式表述:
在醫(yī)療數(shù)據(jù)的表面分布結(jié)構(gòu)模型中,采用稀疏點(diǎn)表達(dá)方法進(jìn)行醫(yī)療數(shù)據(jù)的相似度特征分析,得到醫(yī)療數(shù)據(jù)表面重建的調(diào)度集子序列為:
分別對r1(n)和r2(n)進(jìn)行 (N?1)/2點(diǎn)傅里葉變換,結(jié)合醫(yī)療數(shù)據(jù)的特征編碼方法進(jìn)行信息采樣,采用分組檢測方法,進(jìn)行醫(yī)療數(shù)據(jù)的分集調(diào)度[12],得到醫(yī)療數(shù)據(jù)重建的遷移狀態(tài)量:
其中,ω0為醫(yī)療數(shù)據(jù)的貫序自適應(yīng)預(yù)測誤差,Tp為時(shí)間窗口函數(shù),Ak為醫(yī)療數(shù)據(jù)的特征分布幅值,φk為擴(kuò)展相位.針對醫(yī)療數(shù)據(jù)中的冗余特征采用匹配濾波檢測器進(jìn)行冗余濾波處理,設(shè)置醫(yī)療數(shù)據(jù)的均值為ta,方差為,醫(yī)療數(shù)據(jù)動態(tài)遷移最優(yōu)的接收碼元序列表示為:
構(gòu)建貫序自適應(yīng)預(yù)測器實(shí)現(xiàn)醫(yī)療數(shù)據(jù)的冗余特征預(yù)測,在醫(yī)療數(shù)據(jù)的空間分布模型中,對醫(yī)療數(shù)據(jù)進(jìn)行自適應(yīng)均衡控制[13],得到醫(yī)療數(shù)據(jù)分布的相位特性負(fù)載量為:
計(jì)算醫(yī)療數(shù)據(jù)檢測的測度特征量為:
根據(jù)特征提取結(jié)果,進(jìn)行醫(yī)療數(shù)據(jù)的表面信息重構(gòu),得到特征分布式提取的迭代方程為:
其中,μMCMA代表初始數(shù)據(jù)采樣頻率,根據(jù)上述算法和模型設(shè)計(jì),實(shí)現(xiàn)醫(yī)療數(shù)據(jù)的動態(tài)遷移控制和特征提取,對提取的特征量進(jìn)行提純處理后進(jìn)行卷積神經(jīng)網(wǎng)絡(luò)識別,實(shí)現(xiàn)數(shù)據(jù)的表面重建.
根據(jù)醫(yī)療數(shù)據(jù)特征構(gòu)成的數(shù)據(jù)分布集,求解醫(yī)療數(shù)據(jù)的稀疏表矩陣W的最優(yōu)解[14,15],即:
對提純后的醫(yī)療數(shù)據(jù)采用相空間重構(gòu)技術(shù)實(shí)現(xiàn)醫(yī)療數(shù)據(jù)重構(gòu),相空間重構(gòu)軌跡為:
在重構(gòu)的醫(yī)療數(shù)據(jù)分布相空間中,采用主成分尺度分解方法,得到醫(yī)療數(shù)據(jù)的關(guān)聯(lián)規(guī)則集為:
考慮不同數(shù)據(jù)的類間分類性[16],采用改進(jìn)的全卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行數(shù)據(jù)分類,得到改進(jìn)全卷積神經(jīng)網(wǎng)絡(luò)模型如圖2所示.
圖2 改進(jìn)全卷積神經(jīng)網(wǎng)絡(luò)模型
在圖2所示的神經(jīng)網(wǎng)絡(luò)模型中,醫(yī)療數(shù)據(jù)的譜特征分類輸出為:
在神經(jīng)網(wǎng)絡(luò)的隱含層,引入自適應(yīng)加權(quán)學(xué)習(xí)因子,得到醫(yī)療數(shù)據(jù)表面重建的隸屬度迭代更新公式為:
其中,卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的迭代步長為 λi.通過對比醫(yī)療數(shù)據(jù)簇分布模型,計(jì)算醫(yī)療數(shù)據(jù)特征的主成分尺度,得到統(tǒng)計(jì)分布函數(shù)為:
根據(jù)邊緣樣本點(diǎn)的檢測結(jié)果,進(jìn)行醫(yī)療數(shù)據(jù)的全卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí),得到深度學(xué)習(xí)的表達(dá)式為:
其中,N=(Δx)2,表示醫(yī)療數(shù)據(jù)的統(tǒng)計(jì)特征量,采用多關(guān)聯(lián)數(shù)據(jù)回歸分析方法,構(gòu)建醫(yī)療數(shù)據(jù)表面重建的遞歸圖,輸出為:
式中,d=E(x)=η,在醫(yī)療數(shù)據(jù)三維分布表面重建的稀疏散亂點(diǎn)分布范圍內(nèi),采用網(wǎng)格頂點(diǎn)的形變位移重構(gòu)方法,得到統(tǒng)計(jì)特征量:
在醫(yī)療數(shù)據(jù)表面網(wǎng)格模型的匹配點(diǎn)上[17],結(jié)合負(fù)載均衡控制方法,得到整個(gè)數(shù)據(jù)表面重建網(wǎng)格模型統(tǒng)計(jì)特征量為:
式中,G(U|μk,∑k)表示為第i個(gè)頂點(diǎn)的采樣頻譜特征量,U表示初始采樣點(diǎn)云數(shù)據(jù),uk表示網(wǎng)格模型頂點(diǎn)分布序列.
綜上分析,在改進(jìn)的全卷積神經(jīng)網(wǎng)絡(luò)分類器中進(jìn)行分類識別,實(shí)現(xiàn)醫(yī)療數(shù)據(jù)的表面重建和自動識別.
為了測試基于改進(jìn)全卷積神經(jīng)網(wǎng)絡(luò)的醫(yī)療數(shù)據(jù)表面重建算法在進(jìn)行醫(yī)療數(shù)據(jù)表面重建中的應(yīng)用性能,以醫(yī)療數(shù)據(jù)冗余特征處理效果、分類精度以及重建誤差、重建耗時(shí)做為實(shí)驗(yàn)指標(biāo),進(jìn)行仿真實(shí)驗(yàn).
實(shí)驗(yàn)以某三級甲等醫(yī)院公開性醫(yī)療數(shù)據(jù)為數(shù)據(jù)基礎(chǔ),采用Visual Studio 2016軟件平臺實(shí)現(xiàn)醫(yī)療數(shù)據(jù)提取,并運(yùn)用Matlab仿真軟件進(jìn)行數(shù)據(jù)模擬分析.具體實(shí)驗(yàn)參數(shù)為:數(shù)據(jù)采樣的離散點(diǎn)為2000,訓(xùn)練點(diǎn)數(shù)為200,全卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練次數(shù)為15,數(shù)據(jù)采樣的時(shí)間間隔為2.5 s,相空間重構(gòu)的延遲為12,嵌入維數(shù)為4,根據(jù)上述實(shí)驗(yàn)參數(shù),對傳統(tǒng)方法和本文方法進(jìn)行對比實(shí)驗(yàn)分析.
由2.1小節(jié)可知,在對醫(yī)療數(shù)據(jù)進(jìn)行重建之前,需要對醫(yī)療數(shù)據(jù)中的冗余特征進(jìn)行濾波處理,以此來提升數(shù)據(jù)重建的效果與效率.以2.1節(jié)中的冗余數(shù)據(jù)處理結(jié)果作為依據(jù),對傳統(tǒng)方法與本文方法的醫(yī)療數(shù)據(jù)冗余特征處理效果進(jìn)行對比分析.根據(jù)冗余度對處理效果進(jìn)行評判,冗余度數(shù)值越低,代表處理效果越好,圖3為不同方法的處理結(jié)果.
圖3 不同方法的醫(yī)療數(shù)據(jù)冗余特征處理效果
分析圖3可知,運(yùn)用文獻(xiàn)[4]方法對醫(yī)療數(shù)據(jù)中的冗余特征進(jìn)行處理時(shí),隨著實(shí)驗(yàn)時(shí)間的變化,冗余度起伏較大,缺乏穩(wěn)定性,整體處理效果處于較低水平;運(yùn)用文獻(xiàn)[5]方法對醫(yī)療數(shù)據(jù)中的冗余特征進(jìn)行處理時(shí),在開始階段時(shí),冗余度較高,隨著時(shí)間的增長,冗余度雖然有所降低,但冗余度總體過高,說明該方法也不能實(shí)現(xiàn)對冗余數(shù)據(jù)的有效處理;而運(yùn)用本文方法進(jìn)行處理時(shí),采用匹配濾波檢測器進(jìn)行冗余濾波處理,并根據(jù)匹配濾波檢測器模型,實(shí)現(xiàn)對醫(yī)療數(shù)據(jù)特征量的提純處理,根據(jù)圖3可知,本文方法處理效果數(shù)值始終處于0-1之間,說明本文方法具有有效性.
在醫(yī)療數(shù)據(jù)特征提取與處理的基礎(chǔ)上,利用全卷積神經(jīng)網(wǎng)絡(luò)分類器對數(shù)據(jù)進(jìn)行分類處理,以便于更好的完成醫(yī)療數(shù)據(jù)重建.以稀疏散亂的醫(yī)療數(shù)據(jù)分類精度為實(shí)驗(yàn)指標(biāo),以式(33)和式(34)的分類計(jì)算為依據(jù),對本文方法與文獻(xiàn)[4,5]方法進(jìn)行對比,結(jié)果如圖4所示.
分析圖4得知,采用本文方法進(jìn)行醫(yī)療數(shù)據(jù)分類時(shí),構(gòu)建了改進(jìn)全卷積神經(jīng)網(wǎng)絡(luò)模型,利用該模型對醫(yī)療數(shù)據(jù)進(jìn)行分類處理,分類精度可高達(dá)90%以上,而文獻(xiàn)[4]和文獻(xiàn)[5]方法的最高分類精度不超過80%,由此可見,本文所提方法的性能較好,對稀疏散亂數(shù)據(jù)的分類效果好.
圖4 醫(yī)療數(shù)據(jù)分類精度
醫(yī)療數(shù)據(jù)的準(zhǔn)確性關(guān)乎患者的健康問題,因此重建結(jié)果十分重要,重建誤差過大會對醫(yī)療診斷以及治療產(chǎn)生負(fù)面影響.為進(jìn)一步驗(yàn)證本文方法的實(shí)用性能,對不同方法的重建誤差進(jìn)行測試,得到對比結(jié)果如圖5所示.
圖5 不同方法醫(yī)療數(shù)據(jù)表面重建誤差對比
分析圖5得知,文獻(xiàn)[4]方法和文獻(xiàn)[5]方法的表面重建誤差較高,而不論樣本數(shù)據(jù)為何值,本文方法的表面重建誤差始終低于兩種傳統(tǒng)方法,這是由于運(yùn)用本文方法對醫(yī)療數(shù)據(jù)的特征進(jìn)行提取時(shí),考慮到冗余數(shù)據(jù)的影響,并采用匹配濾波檢測器對冗余數(shù)據(jù)進(jìn)行濾波處理,使得本文方法的表面重建誤差較低,對醫(yī)療數(shù)據(jù)的重構(gòu)和特征辨識能力較強(qiáng).
選取重建耗時(shí)為實(shí)驗(yàn)指標(biāo),對本文方法與文獻(xiàn)[4]、文獻(xiàn)[5]方法進(jìn)行對比,結(jié)果如表1所示.
表1 醫(yī)療數(shù)據(jù)重建耗時(shí)對比
分析表1得知,在數(shù)據(jù)重建耗時(shí)方面,文獻(xiàn)[4]方法的平均耗時(shí)約為本文方法的3倍,文獻(xiàn)[5]方法的平均耗時(shí)約為本文方法的3.5倍,由此可以顯著看出,本文方法能夠快速的完成醫(yī)療數(shù)據(jù)重建,說明該方法能夠提高對醫(yī)療數(shù)據(jù)的檢測和統(tǒng)計(jì)分析能力.這是因?yàn)楸疚牟捎枚嚓P(guān)聯(lián)數(shù)據(jù)回歸分析方法,構(gòu)建了醫(yī)療數(shù)據(jù)表面重建的遞歸圖,以此為基礎(chǔ)完成了數(shù)據(jù)重建,大大降低了耗時(shí).
由于采用傳統(tǒng)方法對醫(yī)療數(shù)據(jù)進(jìn)行重建和識別時(shí),重建誤差較大,因此提出一種基于改進(jìn)全卷積神經(jīng)網(wǎng)絡(luò)的醫(yī)療數(shù)據(jù)表面重建算法.采用無線RFID和ZigBee組網(wǎng)技術(shù),進(jìn)行醫(yī)療數(shù)據(jù)采樣的網(wǎng)絡(luò)節(jié)點(diǎn)分布式設(shè)計(jì),采用密集型模糊迭代方法,進(jìn)行醫(yī)療數(shù)據(jù)的融合處理,采用卷積神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法進(jìn)行醫(yī)療數(shù)據(jù)動態(tài)遷移均衡調(diào)度,對提純后的醫(yī)療數(shù)據(jù)采用相空間重構(gòu)技術(shù)實(shí)現(xiàn)醫(yī)療數(shù)據(jù)重構(gòu),對重構(gòu)數(shù)據(jù)采用改進(jìn)全卷積神經(jīng)網(wǎng)絡(luò)分類器進(jìn)行分類識別,實(shí)現(xiàn)醫(yī)療數(shù)據(jù)的表面重建和自動識別.研究得知,本文方法能有效實(shí)現(xiàn)對醫(yī)療數(shù)據(jù)的表面重建,具有較強(qiáng)的實(shí)用性,能夠?yàn)橄嚓P(guān)研究提供一定的參考價(jià)值.