亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于層次化深度學(xué)習(xí)的醫(yī)療數(shù)據(jù)庫離群數(shù)據(jù)檢測算法①

        2020-03-18 07:55:16李曉峰王妍瑋
        關(guān)鍵詞:深度數(shù)據(jù)庫檢測

        李曉峰,王妍瑋,李 東

        1(黑龍江外國語學(xué)院 信息工程系,哈爾濱 150025)

        2(普渡大學(xué) 機(jī)械工程系,西拉法葉市 IN47906)

        3(哈爾濱工業(yè)大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,哈爾濱 150001)

        1 引言

        數(shù)據(jù)庫管理系統(tǒng)和信息技術(shù)在近年來得以快速發(fā)展,人們收集和產(chǎn)生數(shù)據(jù)的能力不斷提高,醫(yī)療數(shù)據(jù)庫中存在的數(shù)據(jù)量呈直線增長.過去對數(shù)據(jù)的檢測分析主要通過分析員完成,在專家意見的基礎(chǔ)上通過數(shù)據(jù)分析在醫(yī)療數(shù)據(jù)庫中獲取和查詢數(shù)據(jù),由分析員決定數(shù)據(jù)分析的結(jié)果.但由于數(shù)據(jù)庫中的數(shù)據(jù)急劇膨脹,數(shù)據(jù)的復(fù)雜性和時(shí)效性也不斷增強(qiáng),傳統(tǒng)方法已經(jīng)不能滿足人們的要求.為了從醫(yī)療數(shù)據(jù)庫中獲取有用的信息,需要改進(jìn)現(xiàn)有的數(shù)據(jù)檢測技術(shù).

        在醫(yī)療數(shù)據(jù)庫中存在一些與其他數(shù)據(jù)行為不同,或是與其他數(shù)據(jù)差異較大的數(shù)據(jù),被稱為離群數(shù)據(jù).離群數(shù)據(jù)中通常存在有用的信息,因此需要對醫(yī)療數(shù)據(jù)庫中存在的離群數(shù)據(jù)進(jìn)行檢測,眾多學(xué)者進(jìn)行了相關(guān)研究,并取得了一定的成果.

        Hauskrecht M 等[1]通過對數(shù)據(jù)離群點(diǎn)檢測實(shí)現(xiàn)異?;颊吖芾?該方法通過使用EMR 存儲(chǔ)庫來學(xué)習(xí)將患者狀態(tài)與病人管理操作相關(guān)聯(lián)的統(tǒng)計(jì)模型,使用電子病歷保存患者信息,通過與以往病歷的異常分析,獲取異?;颊咝袨?但該方法的計(jì)算代價(jià)較大;Yu YW 等[2]提出了一種新的基于鄰域軌跡離群點(diǎn)的分類方法,對研究對象真實(shí)數(shù)據(jù)集進(jìn)行理論分析和實(shí)證研究,驗(yàn)證了本文方法在捕獲不同類型數(shù)據(jù)的有效性,但該方法的離群點(diǎn)檢測率不高,且誤差率較高;Jobe JM 等[3]提出一種基于計(jì)算機(jī)的數(shù)據(jù)集群方法,將Rousseuw 的最小協(xié)方差行列式方法的重加權(quán)版本與最初基于多步聚類的算法結(jié)合起來,找出離群點(diǎn),實(shí)驗(yàn)結(jié)果表明,該方法穩(wěn)健性較好,但是離群點(diǎn)檢測率較低,計(jì)算代價(jià)大;鄒云峰等[4]提出基于局部密度的數(shù)據(jù)庫離散數(shù)據(jù)檢測算法,該算法將弱k近鄰點(diǎn)和強(qiáng)k近鄰點(diǎn)概念引入離散數(shù)據(jù)檢測中,對鄰近數(shù)據(jù)點(diǎn)在數(shù)據(jù)庫中的離群相關(guān)性進(jìn)行分析,根據(jù)分析結(jié)果區(qū)別對待數(shù)據(jù)點(diǎn),通過數(shù)據(jù)點(diǎn)離群性預(yù)判方法完成醫(yī)療數(shù)據(jù)庫離群數(shù)據(jù)的檢測,該算法檢測離散數(shù)據(jù)的執(zhí)行時(shí)間較長,存在檢測效率低的問題.李少波等[5]提出基于密度的數(shù)據(jù)庫離群數(shù)據(jù)檢測算法,該算法在離群數(shù)據(jù)檢測過程中引入滑動(dòng)時(shí)間窗口,通過滑動(dòng)時(shí)間窗口劃分?jǐn)?shù)據(jù),計(jì)算數(shù)據(jù)的信息熵,根據(jù)計(jì)算結(jié)果對數(shù)據(jù)進(jìn)行篩選和剪枝,通過離群因子對篩選后的數(shù)據(jù)進(jìn)行判斷,完成數(shù)據(jù)庫離散數(shù)據(jù)的檢測,該算法計(jì)算得到的離群因子存在誤差,不能準(zhǔn)確的對醫(yī)療數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行判斷,存在離散點(diǎn)誤差率高的問題.魏暢等[6]提出基于約簡策略的數(shù)據(jù)庫離散數(shù)據(jù)檢測算法,該算法在馬氏距離標(biāo)準(zhǔn)的基礎(chǔ)上對數(shù)據(jù)集進(jìn)行簡約處理,通過數(shù)據(jù)流時(shí)間相關(guān)性和數(shù)據(jù)分布密度準(zhǔn)則構(gòu)建決策模型,通過決策模型對數(shù)據(jù)庫中存在的離散數(shù)據(jù)進(jìn)行檢測,該算法構(gòu)建的決策模型精準(zhǔn)度較低,導(dǎo)致離散點(diǎn)檢測率低.尹娜等[7]提出了一種基于混合式聚類算法的離群點(diǎn)挖掘在異常檢測中的應(yīng)用方法,該方法通過k-中心點(diǎn)算法找出簇中心,在此基礎(chǔ)上去除其中較隱秘的數(shù)據(jù)樣本,再結(jié)合基于密度的聚類算法計(jì)算出離群數(shù)據(jù)的異常度,從而判斷出離群點(diǎn).但是該算法在挖掘隱秘樣本時(shí)出錯(cuò)率較高,致使最終的檢測結(jié)果存在較大誤差.

        針對目前現(xiàn)有方法中存在的離群數(shù)據(jù)檢測過程執(zhí)行時(shí)間較長、檢測效率低、離群點(diǎn)檢測率低的問題,提出基于層次化深度學(xué)習(xí)的醫(yī)療數(shù)據(jù)庫離群數(shù)據(jù)檢測算法.在對空間中的稀疏區(qū)域和稠密區(qū)域進(jìn)行劃分再合并,實(shí)現(xiàn)數(shù)據(jù)過濾,通過層次化深度學(xué)習(xí)過程融合專家知識(shí)增強(qiáng)對離群數(shù)據(jù)的多層感知,實(shí)現(xiàn)對離群數(shù)據(jù)的檢測,達(dá)到降低算法計(jì)算代價(jià)、降低耗時(shí)、提高檢測率和準(zhǔn)確率的目的.

        2 動(dòng)態(tài)網(wǎng)格劃分與合并

        醫(yī)療數(shù)據(jù)庫中存在海量的數(shù)據(jù),在對其中的離群點(diǎn)檢測之前,本文基于層次化深度學(xué)習(xí)的醫(yī)療數(shù)據(jù)庫離群數(shù)據(jù)檢測算法首先使用動(dòng)態(tài)網(wǎng)格劃分方法對醫(yī)療數(shù)據(jù)庫中的數(shù)據(jù)進(jìn)行篩選,構(gòu)建候選離群數(shù)據(jù)集,以此來達(dá)到縮小檢測規(guī)模、減少檢測執(zhí)行時(shí)間的目的.

        動(dòng)態(tài)網(wǎng)格劃分方法是根據(jù)醫(yī)療數(shù)據(jù)庫中數(shù)據(jù)流的密度特點(diǎn)對數(shù)據(jù)做網(wǎng)格分裂及合并處理,按照密度大小對數(shù)據(jù)庫空間中的數(shù)據(jù)進(jìn)行分類,劃分為稀疏區(qū)域和稠密區(qū)域,對稠密區(qū)域中存在的大量主體數(shù)據(jù)進(jìn)行分析,存儲(chǔ)有較大概率成為離群點(diǎn)的數(shù)據(jù)并構(gòu)建候選離群點(diǎn)集合[8,9].

        將較小的權(quán)重賦予給歷史數(shù)據(jù),降低歷史數(shù)據(jù)對網(wǎng)格劃分的影響,使當(dāng)前數(shù)據(jù)在數(shù)據(jù)庫中的分布情況能夠更好的通過網(wǎng)格進(jìn)行反應(yīng)[10].

        式中,ri代 表的是數(shù)據(jù)點(diǎn).網(wǎng)格統(tǒng)計(jì)信息元素的計(jì)算公式如下:

        設(shè)tc代表的是當(dāng)前時(shí)間.根據(jù)上述性質(zhì),增量更新數(shù)據(jù)在網(wǎng)格C中對應(yīng)的統(tǒng)計(jì)信息如下:

        在初始化處理時(shí),對數(shù)據(jù)的網(wǎng)格進(jìn)行分割,獲得初始網(wǎng)格,根據(jù)網(wǎng)格統(tǒng)計(jì)信息可以計(jì)算得到數(shù)據(jù)在網(wǎng)格中對應(yīng)的平均值 μi和標(biāo)準(zhǔn)偏差σi:

        如果網(wǎng)格的密度達(dá)到設(shè)定的閾值時(shí),分割網(wǎng)格.將數(shù)據(jù)聚集并劃分到對應(yīng)的網(wǎng)格中是網(wǎng)格分裂合并的原則[11].所以保存每個(gè)維度上網(wǎng)格對應(yīng)的方差和均值,選擇最大方差相應(yīng)的維度,在均值處做劃分處理,可以在兩個(gè)新生成的網(wǎng)格中劃入數(shù)據(jù).

        式中,m inj代 表的是第j維度上在網(wǎng)格中存在的最小值;maxj代表的是第j維度上在網(wǎng)格中存在的最大值.

        通過對網(wǎng)格進(jìn)行劃分再合并,能夠去除數(shù)據(jù)集中的非離群數(shù)據(jù),保證剩余的數(shù)據(jù)均為離群數(shù)據(jù),從而實(shí)現(xiàn)數(shù)據(jù)過濾,有效降低算法計(jì)算代價(jià)和復(fù)雜度,節(jié)約耗時(shí)提高醫(yī)療數(shù)據(jù)庫離群數(shù)據(jù)檢測的效率.

        3 醫(yī)療數(shù)據(jù)庫離群數(shù)據(jù)層次深度學(xué)習(xí)檢測

        醫(yī)療數(shù)據(jù)庫中,針對數(shù)據(jù)類別的確定有多種方式,可依據(jù)不同設(shè)備采集到的數(shù)據(jù)進(jìn)行分類,可依據(jù)不同種類疾病進(jìn)行數(shù)據(jù)分類,還可依據(jù)不同身體部位進(jìn)行數(shù)據(jù)分類等,只有依據(jù)同一分類方式獲取得到的醫(yī)療數(shù)據(jù)才具有實(shí)際意義.因此,本文提出了基于深度學(xué)習(xí)的醫(yī)療數(shù)據(jù)分類和檢測框架,在每一分類層次上都能夠?qū)崿F(xiàn)數(shù)據(jù)檢測,即采用層次化深度學(xué)習(xí)方法對醫(yī)療數(shù)據(jù)庫中存在的離群數(shù)據(jù)進(jìn)行檢測.

        現(xiàn)有的離群數(shù)據(jù)檢測算法一般都是根據(jù)專家經(jīng)驗(yàn)設(shè)定對象鄰域半徑,結(jié)果隨機(jī)性和主觀性較大[13].本文所提的基于層次化深度學(xué)習(xí)的醫(yī)療數(shù)據(jù)庫離群數(shù)據(jù)檢測算法中,深度學(xué)習(xí)是基于模擬人腦進(jìn)行學(xué)習(xí)的一種神經(jīng)網(wǎng)絡(luò),本文采用一種基于卷積神經(jīng)網(wǎng)絡(luò)的深度網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行離群數(shù)據(jù)檢測;層次化是指包含了專家知識(shí)層次和數(shù)據(jù)屬性取值分布信息層次兩部分,依據(jù)這兩者構(gòu)建深度網(wǎng)絡(luò)分類器,有效感知離群數(shù)據(jù),提高離群數(shù)據(jù)檢測結(jié)果的準(zhǔn)確率.基于層次化深度學(xué)習(xí)的離群數(shù)據(jù)檢測結(jié)構(gòu)框架如圖1 所示.

        根據(jù)圖1 可知,層次化深度學(xué)習(xí)檢測框架中,基于專家知識(shí)和數(shù)據(jù)屬性取值分布信息這兩個(gè)層次分類,構(gòu)建了深度網(wǎng)絡(luò)分類器.接下來主要通過對數(shù)據(jù)差異度量來訓(xùn)練分類器,從而實(shí)現(xiàn)離群數(shù)據(jù)檢測,具體過程如下:

        圖1 層次化深度學(xué)習(xí)檢測框架

        醫(yī)療數(shù)據(jù)庫離群數(shù)據(jù)存在混合型屬性值和數(shù)據(jù)型屬性值,為了有效的對兩者之間存在的差異進(jìn)行度量,主要通過度量鄰域距離實(shí)現(xiàn)[13,14].設(shè)HEOMB(x,y)代表的是重疊度量值,其計(jì)算公式如下:

        式中,參數(shù)dc ji(x,y)的計(jì)算公式如下:

        通過式(22)確定鄰域半徑 εc j:

        式中,std(cj)代 表的是屬性cj取值時(shí)對應(yīng)的標(biāo)準(zhǔn)差,可以通過該標(biāo)準(zhǔn)差對屬性均值的分散程度進(jìn)行衡量[15].如果標(biāo)準(zhǔn)差std(cj)的 值較大時(shí),表明在屬性cj上大部分?jǐn)?shù)據(jù)的均值和取值之間存在的差異較大;如果std(cj)的值較小時(shí),表明在屬性cj上大部分?jǐn)?shù)據(jù)的均值和取值之間存在的差異較小[16,17].

        λ代表的是專家設(shè)定的參數(shù),鄰域半徑的大小可以通過參數(shù)λ 進(jìn)行調(diào)整[18].

        設(shè)VDM(x,y)代表的是差異度量值,其計(jì)算公式為:

        式中,x,y為對象集中存在的對象;P代表的是對象集對應(yīng)的特征集;df(xf,yf)代 表的是xf、yf之間存在的距離.

        為了確定數(shù)據(jù)在數(shù)據(jù)庫中的離群程度,離群度量數(shù)據(jù)型屬性的取值[19,20].用NVDM(xi,xj)代表某存在對象xi和yi之 間的鄰域值差異度量值,設(shè)NOF代表的是鄰域離群因子,其計(jì)算公式如下:

        設(shè) μ代表的是預(yù)設(shè)的離群點(diǎn)判定閾值,對比鄰域離群因子NOF與閾值μ 的大小.如果滿足如下條件,則該數(shù)據(jù)為離群數(shù)據(jù),否則為離群數(shù)據(jù).對所有的數(shù)據(jù)判斷完,即完成了對醫(yī)療數(shù)據(jù)庫中離群數(shù)據(jù)的檢測.

        4 實(shí)驗(yàn)分析與結(jié)果

        為了驗(yàn)證基于層次化深度學(xué)習(xí)的醫(yī)療數(shù)據(jù)庫離群數(shù)據(jù)檢測算法的整體有效性,需要對其進(jìn)行測試.

        實(shí)驗(yàn)條件設(shè)置如表1 所示.

        表1 實(shí)驗(yàn)條件設(shè)置情況

        實(shí)驗(yàn)數(shù)據(jù):本文使用UCI 機(jī)器學(xué)習(xí)庫中的Annealing和Wisconsin Breast Cancer 數(shù)據(jù)集(網(wǎng)址:http://archive.ics.uci.edu/ml/).為增強(qiáng)實(shí)驗(yàn)說服力,將本文所提的基于層次化深度學(xué)習(xí)的醫(yī)療數(shù)據(jù)庫離群數(shù)據(jù)檢測算法(算法1)與文獻(xiàn)[2](算法2)、文獻(xiàn)[3](算法3)、文獻(xiàn)[4]中的基于局部密度的數(shù)據(jù)庫離散數(shù)據(jù)檢測算法(算法4)、文獻(xiàn)[5]中的基于密度的數(shù)據(jù)庫離群數(shù)據(jù)檢測算法(算法5)、文獻(xiàn)[6]中的基于約簡策略的數(shù)據(jù)庫離散數(shù)據(jù)檢測算法(算法6)、文獻(xiàn)[7]中的基于混合式聚類算法的離群點(diǎn)挖掘在異常檢測中的應(yīng)用方法(算法7)進(jìn)行對比測試.

        實(shí)驗(yàn)選取的評價(jià)指標(biāo)及計(jì)算方式如下:

        (1)計(jì)算代價(jià):數(shù)據(jù)在實(shí)際應(yīng)用中,由于過濾不佳或其他問題,易導(dǎo)致錯(cuò)誤率增加,加大計(jì)算代價(jià),本實(shí)驗(yàn)以計(jì)算代價(jià)為指標(biāo)進(jìn)行分析,選取代價(jià)權(quán)值體現(xiàn)不同算法的計(jì)算代價(jià)情況,代價(jià)權(quán)值越高,計(jì)算代價(jià)越大.

        (2)檢測時(shí)間:在迭代次數(shù)相同的條件下,測試本文算法和算法4、算法5、算法6、算法7 等5 種不同算法檢測離群數(shù)據(jù)的執(zhí)行時(shí)間,執(zhí)行時(shí)間越短證明檢測效率越高.

        (3)離群點(diǎn)檢測率:為了進(jìn)一步驗(yàn)證本文所提的基于層次化深度學(xué)習(xí)的醫(yī)療數(shù)據(jù)庫離群數(shù)據(jù)檢測算法的整體有效性,將離群點(diǎn)檢測率作為對比指標(biāo)進(jìn)行實(shí)驗(yàn),計(jì)算方法如下:

        設(shè)L代表的是離群點(diǎn)檢測率,其計(jì)算公式如下:

        式中,Nl代 表的是檢測出正確的離群點(diǎn)總數(shù);Nz代表的是數(shù)據(jù)集中存在的離群點(diǎn)總數(shù).

        (4)離群點(diǎn)誤差率:將離群點(diǎn)誤差率作為對比指標(biāo),對基于層次化深度學(xué)習(xí)的醫(yī)療數(shù)據(jù)庫離群數(shù)據(jù)檢測算法、算法2、算法5、算法6、算法7 進(jìn)行測試.

        設(shè)W代表的是離群點(diǎn)誤差率,其計(jì)算公式如下:

        式中,M1代 表的是輸出的離群點(diǎn)總數(shù);M2代表的是正確離群點(diǎn)總數(shù);S代表的是數(shù)據(jù)集總數(shù).

        4.1 計(jì)算代價(jià)對比

        對本文基于層次化深度學(xué)習(xí)的醫(yī)療數(shù)據(jù)庫離群數(shù)據(jù)檢測算法與算法2、算法3、算法4 進(jìn)行對比,結(jié)果如圖2 所示.

        圖2 計(jì)算代價(jià)對比

        分析圖2 可以看出,本文基于層次化深度學(xué)習(xí)的醫(yī)療數(shù)據(jù)庫離群數(shù)據(jù)檢測算法的計(jì)算代價(jià)明顯較低,代價(jià)權(quán)值不超過1.5,而算法2、算法3、算法4 的代價(jià)權(quán)值集中在1.0~3.0 之間,算法2 最高,代價(jià)權(quán)值多在2.5 以上,由此可以看出,本文算法的計(jì)算代價(jià)小,具有一定的優(yōu)勢.因?yàn)楸疚乃惴ㄍㄟ^對網(wǎng)格進(jìn)行劃分再合并,去除了數(shù)據(jù)集中的非離群數(shù)據(jù),即進(jìn)行了數(shù)據(jù)過濾,有效提高了數(shù)據(jù)質(zhì)量,降低了計(jì)算代價(jià).

        4.2 檢測時(shí)間對比

        在迭代次數(shù)相同的條件下,5 種不同算法檢測離群數(shù)據(jù)的執(zhí)行時(shí)間測試結(jié)果如圖3 所示.

        圖3 5 種不同算法的執(zhí)行時(shí)間對比

        分析圖3 可知,隨著迭代次數(shù)的不斷增加,不同算法的在檢測離群數(shù)據(jù)時(shí)的執(zhí)行時(shí)間也在不斷發(fā)生變化.其中,本文所提的基于層次化深度學(xué)習(xí)的醫(yī)療數(shù)據(jù)庫離散數(shù)據(jù)檢測算法在多次迭代中的最多執(zhí)行時(shí)間為200 s,其執(zhí)行時(shí)間折線僅在迭代次數(shù)為300 次時(shí)與基于混合式聚類算法的離群點(diǎn)挖掘在異常檢測中的應(yīng)用方法的執(zhí)行時(shí)間折線相交,證明該算法的執(zhí)行時(shí)間明顯少于基于局部密度的數(shù)據(jù)庫離散數(shù)據(jù)檢測算法、基于密度的數(shù)據(jù)庫離群數(shù)據(jù)檢測算法、基于約簡策略的數(shù)據(jù)庫離散數(shù)據(jù)檢測算法、基于混合式聚類算法的離群點(diǎn)挖掘在異常檢測中的應(yīng)用方法的執(zhí)行時(shí)間.這是主要因?yàn)榛趯哟位疃葘W(xué)習(xí)的醫(yī)療數(shù)據(jù)庫離群數(shù)據(jù)檢測算法采用動(dòng)態(tài)網(wǎng)格劃分方法對數(shù)據(jù)進(jìn)行篩選,有效縮小了數(shù)據(jù)檢測的范圍和規(guī)模,因此節(jié)省了檢測數(shù)據(jù)所用的時(shí)間,大大提高了檢測效率.

        4.3 離群點(diǎn)檢測率對比

        對基于層次化深度學(xué)習(xí)的醫(yī)療數(shù)據(jù)庫離群數(shù)據(jù)檢測算法、算法2、算法3、算法6、算法7 進(jìn)行測試.

        基于層次化深度學(xué)習(xí)的醫(yī)療數(shù)據(jù)庫離群數(shù)據(jù)檢測算法、算法2、算法3、算法6、算法7 的離群點(diǎn)檢測率計(jì)算結(jié)果如表2 所示.

        表2 5 種不同算法的離群點(diǎn)檢測率測試結(jié)果(%)

        為了更直觀、清晰地對比不同算法的離群點(diǎn)檢測率,將表2 中的數(shù)據(jù)用折線圖的形式表現(xiàn),如圖4 所示.

        圖4 5 種不同算法的離群點(diǎn)檢測率對比

        分析表2 和圖4 中的數(shù)據(jù)可知,在5 次不同迭代中,本文所提的基于層次化深度學(xué)習(xí)的醫(yī)療數(shù)據(jù)庫離群數(shù)據(jù)檢測算法的平均離群點(diǎn)檢測率為97.6%,算法4 的平均離群點(diǎn)檢測率為83.0%,算法5 的平均離群點(diǎn)檢測率為75.8%,算法6 的平均離群點(diǎn)檢測率為69.4%,算法7 的平均離群點(diǎn)檢測率為82.2%.對比5 種不同算法的離群點(diǎn)檢測率可知,基于層次化深度學(xué)習(xí)的醫(yī)療數(shù)據(jù)庫離群數(shù)據(jù)檢測算法的離群點(diǎn)檢測率始終高于另外4 種算法,進(jìn)一步證明了本文所提算法的有效性.究其原因,是因?yàn)楸疚乃惴ɑ诙鄬哟紊疃葘W(xué)習(xí)進(jìn)行離群數(shù)據(jù)檢測,融合了卷積神經(jīng)網(wǎng)絡(luò)和層次分類兩者的優(yōu)勢,有效提高了算法的離群點(diǎn)檢測率.

        4.4 離群點(diǎn)誤差率對比

        基于層次化深度學(xué)習(xí)的醫(yī)療數(shù)據(jù)庫離群數(shù)據(jù)檢測算法、算法2、算法5、算法6、算法7 的離群點(diǎn)誤差率計(jì)算結(jié)果如表3 所示.

        表3 5 種不同算法的離群點(diǎn)誤差率計(jì)算結(jié)果

        為了更直觀地對比不同算法的離群點(diǎn)誤差率,將表3 中的數(shù)據(jù)用折線圖的形式表現(xiàn),如圖5 所示.

        分析表3 和圖5 可知,在五次不同迭代中,本文所提的基于層次化深度學(xué)習(xí)的醫(yī)療數(shù)據(jù)庫離群數(shù)據(jù)檢測算法的平均離群點(diǎn)誤差率為0.12%;算法2 的平均離群點(diǎn)誤差率為0.288%;算法5 的平均離群點(diǎn)誤差率為0.292%;算法6 的平均離群點(diǎn)誤差率為0.35%,算法7 平均離群點(diǎn)誤差率為0.316%.對比5 種不同算法的平均離群點(diǎn)誤差率可知,基于層次化深度學(xué)習(xí)的醫(yī)療數(shù)據(jù)庫離群數(shù)據(jù)檢測算法的離群點(diǎn)誤差率始終低于另外4 種算法,證明了本文所提算法的有效性.本文算法融合專家知識(shí)和數(shù)據(jù)的屬性取值分布信息,從多個(gè)層次感知離群數(shù)據(jù)信息,從而降低了離群數(shù)據(jù)檢測誤差.

        圖5 5 種不同算法的離群點(diǎn)誤差率對比

        綜上所述,本文所提的基于層次化深度學(xué)習(xí)的醫(yī)療數(shù)據(jù)庫離散數(shù)據(jù)檢測算法的離群點(diǎn)檢測率較高、離群點(diǎn)誤差率較低.這主要是因?yàn)榛趯哟位疃葘W(xué)習(xí)的醫(yī)療數(shù)據(jù)庫離群數(shù)據(jù)檢測算法在過濾離群數(shù)據(jù)時(shí),采用動(dòng)態(tài)網(wǎng)格劃分法降低數(shù)據(jù)檢測的計(jì)算代價(jià),縮短了檢測執(zhí)行時(shí)間,而在計(jì)算鄰域半徑時(shí),融合專家知識(shí)和數(shù)據(jù)的屬性取值分布信息,降低了檢測誤差,大大提高了基于層次化深度學(xué)習(xí)的醫(yī)療數(shù)據(jù)庫離群數(shù)據(jù)檢測算法的有效性.

        5 結(jié)語

        醫(yī)療信息量的不斷增長以及信息技術(shù)的飛速進(jìn)步,使醫(yī)療數(shù)據(jù)庫中積累了大量數(shù)據(jù).如何在醫(yī)療數(shù)據(jù)庫中及時(shí)、高效、準(zhǔn)確的獲取信息,是目前亟需解決的問題之一.針對當(dāng)前醫(yī)療數(shù)據(jù)庫離群數(shù)據(jù)檢測算法存在檢測效率低、離群點(diǎn)檢測率低和離群點(diǎn)誤差率高的問題,本文提出基于層次化深度學(xué)習(xí)的醫(yī)療數(shù)據(jù)庫離群數(shù)據(jù)檢測算法,可以精準(zhǔn)的在短時(shí)間內(nèi)完成醫(yī)療數(shù)據(jù)庫中離群數(shù)據(jù)的檢測,解決了當(dāng)前醫(yī)療數(shù)據(jù)庫離群數(shù)據(jù)檢測算法中存在的問題,具有計(jì)算代價(jià)小、檢測耗時(shí)短、離群點(diǎn)檢測率高、離群點(diǎn)誤差率低的優(yōu)點(diǎn),為數(shù)據(jù)檢測、挖掘技術(shù)的發(fā)展奠定了基礎(chǔ).在未來的研究階段,將深入對不同屬性的離群數(shù)據(jù)進(jìn)行精細(xì)檢測,進(jìn)一步提高檢測效果.

        猜你喜歡
        深度數(shù)據(jù)庫檢測
        “不等式”檢測題
        “一元一次不等式”檢測題
        “一元一次不等式組”檢測題
        深度理解一元一次方程
        深度觀察
        深度觀察
        深度觀察
        數(shù)據(jù)庫
        數(shù)據(jù)庫
        小波變換在PCB缺陷檢測中的應(yīng)用
        久久AⅤ天堂Av无码AV| 人妻无码αv中文字幕久久琪琪布| 在线观看av永久免费| 久久dvd| 美利坚合众国亚洲视频| 日本xxxx色视频在线观看| 国产人妻人伦精品1国产盗摄| 亚洲免费观看网站| 日韩亚洲午夜精品一区二区三区| 女同同志熟女人妻二区| 天下第二社区在线视频| 99热在线精品播放| 日本午夜一区二区视频| 亚洲日本国产精品久久| 亚洲日韩av无码| 亚洲欧美日韩综合在线观看| 中文字幕中乱码一区无线精品| 国产自拍精品视频免费| 日日婷婷夜日日天干| 欧美在线观看一区二区| 国产三级在线观看高清| 亚洲天堂av三区四区不卡| 毛片亚洲av无码精品国产午夜| 亚洲色成人WWW永久在线观看| 久久久精品人妻一区二区三区免费| 日本丰满老妇bbw| 毛茸茸的中国女bbw| 男人深夜影院无码观看| 国产高清人肉av在线一区二区| 亚洲乱亚洲乱妇| 99国产超薄丝袜足j在线观看 | h动漫尤物视频| 人妖一区二区三区在线| 亚洲av无码精品蜜桃| 日韩高清无码中文字幕综合一二三区| 亚洲一区二区三区美女av | 精品国产免费一区二区三区| 在线中文字幕有码中文| 亚洲成人黄色av在线观看| 亚洲乱码一区二区三区在线观看 | 91尤物视频在线观看|