亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于棧式降噪自編碼器模型的糖尿病預(yù)測(cè)研究

        2017-10-23 03:39:05
        福建質(zhì)量管理 2017年18期
        關(guān)鍵詞:特征糖尿病模型

        (重慶工商大學(xué)智能制造服務(wù)國際科技合作基地 重慶 400047)

        基于棧式降噪自編碼器模型的糖尿病預(yù)測(cè)研究

        簡恒

        (重慶工商大學(xué)智能制造服務(wù)國際科技合作基地重慶400047)

        我國是一個(gè)人口大國,與此同時(shí),慢性病患者人數(shù)也居世界首位,而糖尿病及其相關(guān)并發(fā)癥是其中的一個(gè)重要組成部分。隨著國民經(jīng)濟(jì)的發(fā)展,居民對(duì)健康需求日益強(qiáng)烈,因此,把根據(jù)人的各項(xiàng)生化指標(biāo)為依據(jù)的糖尿病預(yù)測(cè)研究放在更加突出的地位就顯得尤為重要。本文在總結(jié)前人利用傳統(tǒng)淺層模型進(jìn)行預(yù)測(cè)研究的基礎(chǔ)上,針對(duì)其模型擬合效果和泛化能力不強(qiáng)的缺點(diǎn),提出一種基于底層棧式降噪自編碼器和頂層分類神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)模型。首先對(duì)數(shù)據(jù)進(jìn)行清洗并歸一化,在利用自編碼的無監(jiān)督學(xué)習(xí)對(duì)特征進(jìn)行識(shí)別與重學(xué)習(xí),逐層貪婪學(xué)習(xí)以后,再將將棧式降噪自編碼器接入有監(jiān)督的神經(jīng)網(wǎng)絡(luò)進(jìn)行分類預(yù)測(cè),最后再利用有監(jiān)督的學(xué)習(xí)進(jìn)行參數(shù)的微調(diào)。

        糖尿??;預(yù)測(cè);棧式降噪自編碼器;特征提??;數(shù)據(jù)預(yù)處理

        一、引言

        基于人的各項(xiàng)生化指標(biāo)進(jìn)行糖尿病的特征學(xué)習(xí)與預(yù)測(cè)已經(jīng)成為國內(nèi)外研究的重點(diǎn),其中能構(gòu)建出性能優(yōu)良的數(shù)據(jù)模型是預(yù)測(cè)的關(guān)鍵。針對(duì)于現(xiàn)在日益陡增的糖尿病生化指標(biāo)的數(shù)據(jù),傳統(tǒng)的淺層模型既不能有效的表達(dá)出其深層次的特征,又不能進(jìn)行精準(zhǔn)的預(yù)測(cè)。例如,決策樹模型雖然理解和解釋起來簡單,且決策樹[1]也可以根據(jù)邏輯關(guān)系進(jìn)行構(gòu)建,但其結(jié)果很不穩(wěn)定,只要數(shù)據(jù)中一個(gè)很小的變化可能就會(huì)導(dǎo)致一個(gè)完全不同的樹。另外,傳統(tǒng)提取特征的方式大多都是人工提取特征,需要設(shè)計(jì)特征選擇器或者根據(jù)。支持向量機(jī)[2]的最終決策函數(shù)只由少數(shù)的支持向量所確定,計(jì)算的復(fù)雜性取決于支持向量的數(shù)目,而不是樣本空間的維數(shù),但其缺點(diǎn)也十分明顯,它對(duì)大規(guī)模訓(xùn)練樣本難以實(shí)施,并無法解決多分類的問題。人工神經(jīng)網(wǎng)絡(luò)[3]的非線性擬合能力很強(qiáng),這使它特別適合于求解內(nèi)部機(jī)制復(fù)雜的問題,但其BP(back propagation)算法訓(xùn)練速度慢,且訓(xùn)練很有可能會(huì)失敗。Logistic回歸算法[4]的計(jì)算速度很快,能夠有效的節(jié)省硬件資源,但是容易欠擬合,并且分類的精度不高。從特征學(xué)習(xí)的角度來看,傳統(tǒng)的特征學(xué)習(xí)都是采用人工提取特征的方法,且特征器需要專家經(jīng)驗(yàn)且耗時(shí)[5],這樣不僅效率地下,而且還很難排除人為因素的干擾。深度學(xué)習(xí)作為人工智能技術(shù)的重要方法之一,在各個(gè)領(lǐng)域都表現(xiàn)出不凡的優(yōu)勢(shì),例如,計(jì)算機(jī)視覺、語音識(shí)別、自然語言處理等。面對(duì)呈指數(shù)速度增長的海量數(shù)據(jù)信息,如何從大數(shù)據(jù)中提取出對(duì)預(yù)測(cè)結(jié)果有效的特征,幫助我們建立模型去擬合原有的數(shù)據(jù)并進(jìn)行預(yù)測(cè)成為該領(lǐng)域中的一大難題。通常人的各項(xiàng)生化指標(biāo)數(shù)據(jù)具有不確定性和動(dòng)態(tài)性等特點(diǎn),且噪聲較多,數(shù)據(jù)之間且包含較多的非線性關(guān)系,對(duì)于利用人的各項(xiàng)生化指標(biāo)數(shù)據(jù)進(jìn)行預(yù)測(cè)未來是否會(huì)患有糖尿病一直都是國內(nèi)外研究的熱點(diǎn)。針對(duì)深度學(xué)習(xí)的優(yōu)勢(shì),尤其是自編碼器的無監(jiān)督學(xué)習(xí)機(jī)制,為研究糖尿病預(yù)測(cè)提供了一種新的思路。

        二、棧式降噪自編碼器預(yù)測(cè)模型

        (一)自編碼器

        圖1 自編碼器結(jié)構(gòu)

        設(shè)ω1∈Rm×n、b1∈Rm分別表示輸入層與隱藏層的權(quán)值與偏置,ω2∈Rm×n、b2∈Rm分別表示隱藏層與重構(gòu)可視層的權(quán)值與偏置,假設(shè)每一個(gè)神經(jīng)元的激活非線性激活函數(shù)都是ReLu函數(shù),對(duì)于自編碼器在編碼過程中如下所示

        解碼過程為:

        (二)SDAEP模型

        對(duì)于的人的生化指標(biāo)數(shù)據(jù){(x(1),y(1)),(x(2),y(2)),(x(3),y(3))…},經(jīng)過棧式降噪自編碼器的學(xué)習(xí)后,將構(gòu)建出的有更好特征表達(dá)的數(shù)據(jù)接入神經(jīng)網(wǎng)絡(luò)模型,就構(gòu)成了糖尿病的預(yù)測(cè)模型SDAEP(Staked Denoising AutoEncoder based Prediction model)結(jié)構(gòu)如圖3所示

        圖3 SDAEP結(jié)構(gòu)

        在棧式降噪自編碼器模型中,h1與h2均為自編碼器的隱藏層,h3為自編碼器連接的輸出層帶有sigmoid分類器的神經(jīng)網(wǎng)絡(luò)層。通過棧式化的多層降噪自編碼器的特征學(xué)習(xí),將經(jīng)過處理的數(shù)據(jù)進(jìn)行特征提取,獲取了具有更好表達(dá)的新的特征,在利用神經(jīng)網(wǎng)絡(luò)的輸出層的分類器對(duì)未來這些人是否會(huì)患有糖尿病做出預(yù)測(cè)。

        三、SDAEP模型的學(xué)習(xí)算法

        (一)貪婪學(xué)習(xí)算法

        所謂貪婪學(xué)習(xí)算法是指,在對(duì)問題的求解過程中,總是做出來在當(dāng)前看來是最好的選擇。即不從整體最優(yōu)上加以考慮,只做出在當(dāng)前情況下的最優(yōu)解。棧式降噪自編碼器預(yù)測(cè)模型之所以不直接用梯度下降算法訓(xùn)練是因?yàn)殡S著隨著神經(jīng)網(wǎng)絡(luò)的層數(shù)增加,利用前向傳播到最終的輸出層后,將訓(xùn)練值與實(shí)際值作差在進(jìn)行反向傳播計(jì)算梯度的時(shí)候,會(huì)導(dǎo)致梯度快速下降,以至于在最初的幾層神經(jīng)網(wǎng)絡(luò)當(dāng)中,權(quán)值的變化會(huì)非常的小,使得神經(jīng)網(wǎng)絡(luò)無法訓(xùn)練。這時(shí)我們采用逐層貪婪學(xué)習(xí)算法,先對(duì)前面的DAE的每一層,分別進(jìn)行無監(jiān)督的預(yù)訓(xùn)練,等預(yù)訓(xùn)練完成以后再連接分類器進(jìn)行有監(jiān)督的訓(xùn)練,能夠使SDAEP快速達(dá)到最優(yōu)。

        (二)棧式降噪自編碼器的學(xué)習(xí)算法

        棧式降噪自編碼器的參數(shù)學(xué)習(xí)采用反向傳播算法,先將處理好的數(shù)據(jù)輸入到輸入層,經(jīng)前向傳播得到得到L2,L3,…直到輸出層Lnl的激活值a(2),…,a(nl),再根據(jù)自編碼器的整體代價(jià)函數(shù)計(jì)算出訓(xùn)練值與實(shí)際值的差值后,經(jīng)反向傳播算法計(jì)算梯度,回傳到輸出層,逐層微調(diào)權(quán)值與偏置。假設(shè)棧式降噪自編碼器的輸出層為第nl層,輸出的目標(biāo)值為y,則棧式降噪自編碼器各輸出層和隱藏層各節(jié)點(diǎn)的誤差表達(dá)式分別為:

        δ(nl)=-(y-a(nl)f'(z(nl))

        其中,l=nl-1,nl-2,nl-3,…,2,式中f為ReLu激活函數(shù),f'(Z(l))表示第ι層激活函數(shù)f(z)對(duì)輸入z的導(dǎo)函數(shù)值。

        利用梯度下降法更新權(quán)值和偏置參數(shù),設(shè)α為學(xué)習(xí)率,迭代更新表達(dá)式為:

        w(l)=w(l)-α[▽w(l)J(W,b;x,y)]

        b(l)=b(l)-α[▽b(l)J(W,b;x,y)]

        通過不斷的迭代來調(diào)整權(quán)值w以及偏置b以減小自編碼器整體代價(jià)函數(shù)的值,以此來優(yōu)化預(yù)測(cè)模型。

        四、實(shí)驗(yàn)設(shè)計(jì)與分析

        本次實(shí)驗(yàn)的軟件平臺(tái)為MATLAB R2015b,數(shù)據(jù)預(yù)處理的實(shí)驗(yàn)平臺(tái)為Python3.6,編程實(shí)現(xiàn)算法。

        模型的評(píng)價(jià)標(biāo)準(zhǔn)為均方偏差以及分類準(zhǔn)確率

        分類準(zhǔn)確率=100*(1-error)

        為了處分反應(yīng)模型的效果,以人的生化指標(biāo)為依據(jù)的糖尿病數(shù)據(jù)集為例,對(duì)比了目前在糖尿病預(yù)測(cè)領(lǐng)域較為常用的BP神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)(SVR)模型,如表1所示

        表1 同一數(shù)據(jù)集下不同模型的預(yù)測(cè)效果

        由此可以見得,SDAEP的預(yù)測(cè)效果要優(yōu)于BP神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)的,雖然BP神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)的分類準(zhǔn)確率相差無異,但均方誤差差距較大,且其隨機(jī)初始化的權(quán)值和偏置也沒有經(jīng)過無監(jiān)督預(yù)訓(xùn)練的SDAEP穩(wěn)定,泛化能力還有待提升,經(jīng)過上述對(duì)比,可以看出SDAEP的預(yù)測(cè)性能更好。

        五、結(jié)語

        棧式降噪自編碼器預(yù)測(cè)模型克服了傳統(tǒng)淺層模型泛化能力不強(qiáng)的確定,并對(duì)數(shù)據(jù)的特征進(jìn)行重學(xué)習(xí),使其有了更好的表達(dá),而自編碼其自身獨(dú)特的逐層貪婪的學(xué)習(xí)方法也改進(jìn)了神經(jīng)網(wǎng)絡(luò)隨機(jī)初始化的缺點(diǎn),比單獨(dú)使用反向傳播在通過梯度下降法來微調(diào)權(quán)值和偏置的神經(jīng)網(wǎng)絡(luò)收斂速度更快,所以棧式降噪自編碼器在對(duì)糖尿病的預(yù)測(cè)領(lǐng)域具有重要的應(yīng)用研究和推廣價(jià)值。

        [1]馬瑾,孫穎,劉尚輝.決策樹模型在住院2型糖尿病患者死因預(yù)測(cè)中的應(yīng)用[J].中國衛(wèi)生統(tǒng)計(jì),2013.6,30(3):422-423

        [2]洪燁.基于機(jī)器學(xué)習(xí)算法的糖尿病預(yù)測(cè)模型研究[M].哈爾濱工業(yè)大學(xué)碩士學(xué)位論文,2016.6

        [3]郭奕瑞,李玉清,王高帥,劉曉田,張路寧,張紅艷,王炳源,王重建.人工神經(jīng)網(wǎng)絡(luò)模型在2型糖尿病風(fēng)險(xiǎn)預(yù)測(cè)中的應(yīng)用[N].鄭州大學(xué)學(xué)報(bào)(醫(yī)學(xué)版),2014,3,49(2):180-183

        [4]曹文哲,應(yīng)俊,陳廣飛,周丹.基于Logistic回歸和隨機(jī)森林算法的2型糖尿病并發(fā)視網(wǎng)膜病變風(fēng)險(xiǎn)預(yù)測(cè)及對(duì)比研究[J].2016,03:1674-1633

        [5]Martin Langkvist,Lars Karlsson,Amy Loutfi.A review of unsupervised feature learning and deep learning for time-series modeling[J].Pattern Recognition Letters,2014(42):11-24

        猜你喜歡
        特征糖尿病模型
        一半模型
        糖尿病知識(shí)問答
        中老年保健(2022年5期)2022-08-24 02:35:42
        糖尿病知識(shí)問答
        中老年保健(2022年1期)2022-08-17 06:14:56
        糖尿病知識(shí)問答
        中老年保健(2021年5期)2021-08-24 07:07:20
        糖尿病知識(shí)問答
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        如何表達(dá)“特征”
        不忠誠的四個(gè)特征
        抓住特征巧觀察
        真实夫妻露脸爱视频九色网| 在线无码国产精品亚洲а∨| 日韩av无码午夜福利电影| 中文字幕日韩精品永久在线| 精品国产天堂综合一区在线| 天天天天躁天天爱天天碰| 免费一级毛片麻豆精品| 三级黄色片一区二区三区| 美女人妻中出日本人妻| 精品少妇无码av无码专区| 无码国产亚洲日韩国精品视频一区二区三区| 人妻无码AⅤ中文系列久久免费| 日本一区二区三级在线| 国产精品三级av及在线观看| 中国精学生妹品射精久久| 两个人免费视频大全毛片| 国产交换精品一区二区三区| 无遮挡18禁啪啪羞羞漫画| 国产一在线精品一区在线观看| 久久青青草视频免费观看| 亚洲一区二区三区偷拍女| 亚洲国产天堂久久综合网| 国产精品片211在线观看| 丰满熟女人妻中文字幕免费| 国产无码十八禁| 91精品国产综合久久国产| 欧美激情肉欲高潮视频| 国产乱理伦片在线观看| 久久无码中文字幕东京热| 国产综合开心激情五月| 免费网站看v片在线18禁无码| 国内免费AV网站在线观看| 青青草免费在线视频导航 | 久久国产劲爆∧v内射| 伊人色综合视频一区二区三区| 久久夜色精品国产亚洲噜噜| 亚洲国产精品国自产拍av在线| 日本精品中文字幕人妻| 中文字字幕人妻中文| 极品熟妇大蝴蝶20p| 亚洲中文字幕高清视频|