亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于LSTM與XGBOOST混合模型的孕婦產(chǎn)后出血預(yù)測(cè)①

        2020-03-18 07:55:04周彤彤袁貞明胡文勝
        關(guān)鍵詞:特征信息模型

        周彤彤,俞 凱,袁貞明,盧 莎,胡文勝

        1(杭州師范大學(xué) 信息科學(xué)與工程學(xué)院,杭州 311121)

        2(移動(dòng)健康管理教育部工程研究中心,杭州 311121)

        3(杭州市婦產(chǎn)科醫(yī)院,杭州 310008)

        引言

        聯(lián)合國(guó)千年發(fā)展目標(biāo)中,第五個(gè)議題是關(guān)于改善孕產(chǎn)婦的健康問(wèn)題.報(bào)告顯示,過(guò)去25 年期間,孕產(chǎn)婦死亡率仍高達(dá)約十萬(wàn)分之四十五[1],孕婦產(chǎn)后大出血是造成全球孕婦死亡的重要因素之一,在我國(guó)居首位.研究顯示,在經(jīng)濟(jì)發(fā)達(dá)的國(guó)家和地區(qū),產(chǎn)婦產(chǎn)后出血的概率會(huì)顯著提升.隨著經(jīng)濟(jì)與社會(huì)的發(fā)展,孕產(chǎn)婦健康問(wèn)題成為人們關(guān)心的熱點(diǎn)問(wèn)題.據(jù)調(diào)研,某東部醫(yī)院一年中39.09%的孕婦有產(chǎn)后出血的情況,4.13%的產(chǎn)婦出現(xiàn)產(chǎn)后大出血情況.產(chǎn)后出血一旦發(fā)生,預(yù)后嚴(yán)重,若持續(xù)時(shí)間較長(zhǎng)、休克較重,即便獲救,仍有可能發(fā)生嚴(yán)重并發(fā)后遺癥,因此產(chǎn)后出血的防治工作意義重大[2].

        然而,現(xiàn)有醫(yī)學(xué)手段難以直接對(duì)孕婦產(chǎn)后大出血進(jìn)行精準(zhǔn)的預(yù)測(cè).目前,醫(yī)學(xué)上無(wú)法準(zhǔn)確判定產(chǎn)后大出血的成因,臨床上醫(yī)生只能根據(jù)某些癥狀如胎盤前置、妊高癥等經(jīng)驗(yàn)判斷產(chǎn)婦大出血的可能性.隨著醫(yī)療信息化的發(fā)展,孕產(chǎn)婦的基本生理特征、歷次孕檢信息都被記錄在電子病歷中,這為醫(yī)生全面掌握孕婦身體狀況,預(yù)判產(chǎn)后出血風(fēng)險(xiǎn)提供了便利.然而,由于產(chǎn)后出血相關(guān)因素眾多且聯(lián)系復(fù)雜,即使是經(jīng)驗(yàn)豐富的醫(yī)生,面對(duì)這些體量巨大、類型異構(gòu)、內(nèi)部關(guān)聯(lián)復(fù)雜的臨床大數(shù)據(jù),都難以全面客觀地進(jìn)行分析[3],對(duì)缺乏經(jīng)驗(yàn)的年輕醫(yī)生更是一個(gè)巨大的挑戰(zhàn).隨著機(jī)器學(xué)習(xí)、深度學(xué)習(xí)的發(fā)展,借助計(jì)算機(jī)手段挖掘電子病歷數(shù)據(jù)之間的隱藏關(guān)系[4],建立疾病風(fēng)險(xiǎn)預(yù)測(cè)模型,為復(fù)雜的疾病診斷提供支持,成為近年來(lái)計(jì)算機(jī)與醫(yī)學(xué)領(lǐng)域研究的熱點(diǎn).本文嘗試?yán)冕t(yī)院電子病歷中孕婦基本數(shù)據(jù)以及歷次孕檢數(shù)據(jù)結(jié)合機(jī)器學(xué)習(xí)方法,實(shí)現(xiàn)對(duì)孕婦產(chǎn)后大出血的預(yù)測(cè).

        目前,醫(yī)學(xué)上常利用傳統(tǒng)機(jī)器學(xué)習(xí)或深度神經(jīng)網(wǎng)絡(luò)構(gòu)建疾病預(yù)測(cè)模型.深度模型對(duì)于時(shí)間序列數(shù)據(jù)有良好的處理能力,然而深度模型難以解釋,醫(yī)學(xué)上對(duì)于模型的可解釋性有較高的要求,傳統(tǒng)樹模型具有良好的可解釋性[5],通過(guò)回溯樹的結(jié)構(gòu)能夠探究出決策形成的原因,為醫(yī)生診斷提供參考.

        孕檢的電子病歷數(shù)據(jù)中包含產(chǎn)后大出血相關(guān)的特征,孕檢數(shù)據(jù)中孕周的變化間是有關(guān)聯(lián)的時(shí)間序列數(shù)據(jù).傳統(tǒng)樹模型難以挖掘時(shí)間序列中隱含的信息,LSTM(長(zhǎng)短期記憶網(wǎng)絡(luò))模型[6]是一種時(shí)間遞歸神經(jīng)網(wǎng)絡(luò),適合處理和預(yù)測(cè)時(shí)間序列中間隔和延遲相對(duì)較長(zhǎng)的重要事件.XGBoost 模型是一種優(yōu)秀的集成樹模型,具有高效,靈活,魯棒的特點(diǎn).為結(jié)合兩者優(yōu)點(diǎn),本文利用LSTM 和XGBoost 構(gòu)建產(chǎn)后大出血混合預(yù)測(cè)模型.

        1 數(shù)據(jù)集處理

        模型用到的孕婦數(shù)據(jù)分為孕婦基礎(chǔ)信息和孕檢信息兩部分,孕婦基礎(chǔ)信息包含孕婦自身基本信息,如孕婦的身高、體重、年齡、過(guò)往孕史、家庭遺傳病史等.孕檢信息分為首次孕檢和歷次孕檢,首次孕檢信息存儲(chǔ)孕婦進(jìn)行第一次孕檢的結(jié)果,歷次孕檢包含孕婦在孕期內(nèi)每次孕檢的結(jié)果,主要包含胎兒的生長(zhǎng)情況、孕婦的體征指標(biāo),如血壓、血糖、腹圍等.

        1.1 數(shù)據(jù)預(yù)處理

        數(shù)據(jù)預(yù)處理是提高數(shù)據(jù)質(zhì)量,避免數(shù)據(jù)缺失、錯(cuò)誤對(duì)模型性能影響的重要步驟.本文中,數(shù)據(jù)預(yù)處理主要分3 部分:缺失值處理、歸一化處理以及孕檢數(shù)據(jù)的標(biāo)準(zhǔn)化.

        孕檢數(shù)據(jù)中存在各孕婦孕檢項(xiàng)目不同或未記錄檢查結(jié)果的情況,需進(jìn)行缺失值處理.根據(jù)實(shí)際情況,孕檢結(jié)果中未記錄數(shù)據(jù)為該項(xiàng)目正常值,另外孕檢結(jié)果的眾數(shù)或平均值也為該項(xiàng)目的正常值.因此,在實(shí)驗(yàn)中缺失的離散值、連續(xù)值分別采用其他孕婦同一孕檢項(xiàng)目的眾數(shù)與平均值填充.

        通過(guò)數(shù)據(jù)預(yù)處理的數(shù)據(jù)中存在不同的孕檢項(xiàng)目具有不同的單位和量綱的情況,實(shí)驗(yàn)通過(guò)歸一化處理得到統(tǒng)一量綱的數(shù)據(jù),消除不同的量綱對(duì)于模型帶來(lái)的影響[7].歸一化采用式(1)所示的計(jì)算方法,其中x表示當(dāng)前特征值,xmax、xmin表示當(dāng)前特征值的最大值和最小值.為標(biāo)準(zhǔn)化后的特征值,標(biāo)準(zhǔn)化后的數(shù)據(jù)范圍為[-1,1].

        在訓(xùn)練數(shù)據(jù)集中,孕婦孕檢次數(shù)范圍為1 至84,為方便模型處理,需要對(duì)孕檢數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化.標(biāo)準(zhǔn)化依據(jù)醫(yī)學(xué)上對(duì)孕期的劃分以及模型適合的數(shù)據(jù)格式進(jìn)行處理.在醫(yī)學(xué)上將孕期劃分為孕前期、孕中期、孕后期3 個(gè)階段[8],通常情況下孕婦的孕檢頻率依次增加,同時(shí)孕檢結(jié)果的重要性也認(rèn)為是依次增加.孕婦通常在孕早期內(nèi)孕檢次數(shù)較少,故本文將孕早期即孕周1 至孕周12 內(nèi)的孕檢記錄為一次;孕中期即孕13 周至孕28 周數(shù)量相對(duì)也較少,分為3 次,即[13-18]周,[19-23]周,[24-28]周;孕后期即孕29 周至孕40 周孕檢次數(shù)較多,每?jī)芍茏鳛橐粋€(gè)周期.由于存在晚產(chǎn)的情況,40 周以后還會(huì)出現(xiàn)孕檢信息,本文將41 周之后作為一個(gè)新的孕檢周期.將同一孕檢周期內(nèi)的多次孕檢結(jié)果的均值作為本次孕檢周期內(nèi)的孕檢結(jié)果值,若孕婦在某周期內(nèi)無(wú)孕檢數(shù)據(jù),則將該周期的孕檢結(jié)果值均置為空值.孕檢數(shù)據(jù)的標(biāo)準(zhǔn)化如表1 所示.

        表1 歷次孕檢數(shù)據(jù)劃分

        1.2 特征構(gòu)建

        電子病歷數(shù)據(jù)中不同的檢查項(xiàng)目反映了孕婦不同層面的情況.其中,年齡、血型、孕次、病史等孕婦的基本信息,不受本次懷孕的影響,反映出孕婦自身身體的基本素質(zhì),因此將孕婦基礎(chǔ)信息構(gòu)建為孕婦基礎(chǔ)特征群;而首次孕檢時(shí)記錄的孕婦懷孕初始時(shí)的血壓、體重、高危因素等,反映出孕初期的基本情況,可以據(jù)此評(píng)估孕婦在孕程初期的基本狀態(tài),因此將首次孕檢的數(shù)據(jù)構(gòu)建為首次孕檢特征群;歷次孕檢結(jié)果記錄了整個(gè)孕期的動(dòng)態(tài)發(fā)展過(guò)程,且具有時(shí)序的特點(diǎn),將其構(gòu)建為歷次孕檢特征群.而為了增加實(shí)驗(yàn)中模型對(duì)時(shí)序數(shù)據(jù)變化關(guān)系的學(xué)習(xí)能力,本文將歷次孕檢的變化記錄提取為新的特征群,稱為歷次孕檢結(jié)果變化特征群.通過(guò)數(shù)據(jù)預(yù)處理及特征構(gòu)建,本文共構(gòu)建了如表2 所示的4 個(gè)特征群.其中,歷次孕檢結(jié)果變化特征群記錄處理后的不同孕檢周期的結(jié)果變化值,實(shí)驗(yàn)中孕期分為11 段,因此孕檢結(jié)果變化共有10 次記錄,若孕婦在該孕檢周期內(nèi)無(wú)孕檢結(jié)果則將該差值置為空值,若下一孕檢周期有記錄則下一周期差值為與最近的前次孕檢周期結(jié)果的差值,例如某孕婦僅進(jìn)行兩次孕檢,在孕期1 內(nèi)進(jìn)行一次孕檢,孕期10 進(jìn)行一次孕檢,則該孕婦僅有第9 次孕檢結(jié)果變化有記錄,其余置為空值.

        表2 實(shí)驗(yàn)特征說(shuō)明

        2 構(gòu)建基于LSTM 和XGBoost 的混合模型

        孕婦產(chǎn)后出血受到多方面因素的影響,實(shí)驗(yàn)數(shù)據(jù)同時(shí)包含時(shí)序數(shù)據(jù)和非時(shí)序數(shù)據(jù)兩部分,如上一章所介紹,電子病歷中記錄的數(shù)據(jù)包括:孕婦的身高、血型、孕次等基礎(chǔ)信息,為非時(shí)序數(shù)據(jù);孕婦歷次孕檢的數(shù)據(jù),如體重、血糖、腹圍等,此為時(shí)序數(shù)據(jù).模型需要具有處理時(shí)序數(shù)據(jù)之間的變化關(guān)系,同時(shí),在醫(yī)療應(yīng)用中模型應(yīng)具有良好的可解釋性,從而幫助醫(yī)生根據(jù)經(jīng)驗(yàn)對(duì)預(yù)測(cè)結(jié)果進(jìn)行判斷,另外,方便醫(yī)生了解疾病的影響因素.LSTM 模型在時(shí)間序列數(shù)據(jù)預(yù)測(cè)具有良好的效果,而XGBoost 模型作為傳統(tǒng)的集成模型在擁有良好性能的同時(shí)具有較強(qiáng)的可解釋性,在實(shí)際的疾病預(yù)測(cè)應(yīng)用中,兩者都存在各自的缺陷,LSTM 模型作為深度模型在擁有較好性能但難以對(duì)模型的結(jié)果做出解釋,而XGBoost 作為傳統(tǒng)集成模型無(wú)法提取時(shí)序數(shù)據(jù)中的時(shí)序信息.本文利用LSTM 模型提取數(shù)據(jù)中的時(shí)序信息結(jié)合XGBoost 模型實(shí)現(xiàn)在模型擁有良好性能的同時(shí)對(duì)結(jié)果具有一定的可解釋性.混合模型能夠?yàn)獒t(yī)生的診斷提供參考意見,獲取高危風(fēng)險(xiǎn)因素,方便針對(duì)性的對(duì)某些特征進(jìn)行檢查.

        混合模型的構(gòu)建分成兩個(gè)部分.首先,構(gòu)建LSTM模型數(shù)據(jù)集,利用LSTM 模型對(duì)數(shù)據(jù)中的時(shí)序特征進(jìn)行處理,得到預(yù)測(cè)結(jié)果;然后,利用LSTM 模型結(jié)果構(gòu)建新的特征,結(jié)合原有數(shù)據(jù)集組成新的數(shù)據(jù)集訓(xùn)練XGBoost 模型,并利用訓(xùn)練后的模型得到最終結(jié)果.LSTM 模型作為深度學(xué)習(xí)模型和集成模型的XGBoost在結(jié)構(gòu)上有較大的差異,因此,混合模型能夠較好地降低模型過(guò)擬合的風(fēng)險(xiǎn).構(gòu)建混合模型的流程如圖1 所示.

        圖1 模型流程圖

        2.1 LSTM 模型

        長(zhǎng)短期記憶網(wǎng)絡(luò)(Long Short Term Memory),簡(jiǎn)稱LSTM,是循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)[9]的優(yōu)秀改進(jìn),屬于反饋神經(jīng)網(wǎng)絡(luò).相對(duì)于傳統(tǒng)RNN 網(wǎng)絡(luò),LSTM 能夠改善“梯度消失”的問(wèn)題[10],同時(shí),LSTM 在學(xué)習(xí)長(zhǎng)期依賴的[11]問(wèn)題上有更加優(yōu)秀的表現(xiàn).LSTM 模型的結(jié)構(gòu)如圖2所示.

        LSTM 在RNN 結(jié)構(gòu)的基礎(chǔ)上增加每層結(jié)構(gòu)的控制門,控制門分3 類:Forget Gate(遺忘門)、Input Gate(輸入門)、Output Gate(輸出門)[12].通過(guò)控制門的開關(guān)判斷網(wǎng)絡(luò)的狀態(tài)在該層的輸出是否達(dá)到設(shè)定的閾值,從而選擇是否將其加入本層的計(jì)算中.

        圖2 LSTM 結(jié)構(gòu)

        遺忘門在LSTM 中控制神經(jīng)元以一定的概率丟棄信息,根據(jù)上一序列隱藏狀態(tài)h(t-1)及本次序列的輸入,利用激活函數(shù)得到門的輸出ft,如式(2)所示:

        其中,σ為激活函數(shù),Wf為隱藏層到門的權(quán)重,Uf為輸入層到門的權(quán)重,bf為偏執(zhí)向量.

        輸入門負(fù)責(zé)處理輸入信息,輸入門利用Sigmoid和tanh 兩個(gè)激活函數(shù)的輸出的乘積更新神經(jīng)元的信息,如式(3)、式(4)所示:

        更新神經(jīng)元的信息來(lái)自兩個(gè)部分,一是Ct-1與遺忘門的乘積,二是it和at的乘積,如式(5)所示:

        在更新神經(jīng)元后通過(guò)輸出門控制得到t時(shí)刻神經(jīng)元的輸出ht,如式(6)所示:

        2.2 XGBoost 模型

        XGBoost 是2014 年被提出的分布式梯度提升算法(Boosting)工具庫(kù),其具有高效、靈活、魯棒的特點(diǎn),相對(duì)于其他Boosting 方法[13],XGBoost 增加正則化項(xiàng),能夠防止模型過(guò)擬合.XGBoost 目標(biāo)函數(shù)如式(7)所示:

        包含正則化項(xiàng),為模型的輸出,yi為真實(shí)標(biāo)簽,fk為表示第k個(gè)基分類器,T表示葉子數(shù),ω表示葉子節(jié)點(diǎn)的權(quán)重,γ為懲罰項(xiàng).

        利用泰勒公式[14]將式(7)展開得到式(9):

        式中,gi與hi以及 Ω(ft)表達(dá)公式分別如式(10)~式(12)如下:

        將式(10)~式(12)代入式(9)得到葉子節(jié)點(diǎn)權(quán)重公式如式(13)所示:

        式中,Gj、Hj分別表示一階梯度和二階梯度在葉子節(jié)點(diǎn)i的值.將式(13)帶入式(9)得到目標(biāo)函數(shù)的最優(yōu)解如式(14)所示:

        3 實(shí)驗(yàn)與分析

        3.1 實(shí)驗(yàn)過(guò)程

        本文在我國(guó)東部某醫(yī)院2018 年間產(chǎn)科所接診的所有孕產(chǎn)婦的電子病歷中,選取了包含產(chǎn)后出血記錄的14 409 條樣本構(gòu)建數(shù)據(jù)集.根據(jù)醫(yī)學(xué)標(biāo)準(zhǔn)將胎兒娩出后24 小時(shí)內(nèi)產(chǎn)婦出血量超過(guò)500 ml 的樣本作為產(chǎn)后大出血的正樣本.其中正樣本701 條,負(fù)樣本13 708條.隨機(jī)抽取70%的正樣本和70%的負(fù)樣本組成訓(xùn)練集,剩余30%的正樣本和30%的負(fù)樣本組成測(cè)試集.在實(shí)驗(yàn)中采用10 折交叉驗(yàn)證的方式尋找模型最優(yōu)參數(shù).

        將LSTM 模型應(yīng)用于產(chǎn)后大出血的預(yù)測(cè),神經(jīng)元節(jié)點(diǎn)和網(wǎng)絡(luò)層數(shù)直接影響最終效果[15].實(shí)驗(yàn)中采用輸入數(shù)據(jù)特征維度作為輸入層的神經(jīng)元數(shù)量;輸出層對(duì)應(yīng)一個(gè)神經(jīng)元表示是否會(huì)發(fā)生產(chǎn)后大出血.LSTM 隱藏層[16]的節(jié)點(diǎn)數(shù)通常利用式(15)確定.

        其中,N為隱藏節(jié)點(diǎn)數(shù)量,m、n為輸入、輸出節(jié)點(diǎn)數(shù),a為區(qū)間[1,10]內(nèi)的常數(shù).實(shí)驗(yàn)中輸入節(jié)點(diǎn)個(gè)數(shù)為59 個(gè),輸出節(jié)點(diǎn)個(gè)數(shù)為1 個(gè),根據(jù)式(11)得到隱藏節(jié)點(diǎn)數(shù)量為8~18 個(gè).實(shí)驗(yàn)中通過(guò)利用同一數(shù)據(jù)集選擇不同隱藏層節(jié)點(diǎn)的方法最終選擇隱藏層節(jié)點(diǎn)數(shù)為15 個(gè).

        將LSTM 模型得到的結(jié)果作為新的特征加入構(gòu)建新的數(shù)據(jù)集,并利用該數(shù)據(jù)集訓(xùn)練XGBoost 模型.

        3.2 評(píng)價(jià)指標(biāo)選取

        本文目標(biāo)為分類,選取ROC 曲線[17]及曲線下面積AUC 作為模型性能的評(píng)價(jià)標(biāo)準(zhǔn).ROC 曲線的橫坐標(biāo)為假陽(yáng)性率,表示被劃分為正類的結(jié)果中負(fù)實(shí)例占所有負(fù)實(shí)例的比例;縱坐標(biāo)為真陽(yáng)性率,表示被劃分為正類的結(jié)果中正實(shí)例占所有正實(shí)例的比例.根據(jù)選取的不同劃分正負(fù)類的閾值,形成ROC 曲線.AUC 是一個(gè)概率值,計(jì)算方法是ROC 曲線下的面積,取值范圍為區(qū)間[0.1,1],AUC 值越大表明該模型的分類性能越好.

        3.3 結(jié)果分析

        XGBoost 模型在迭代650 輪時(shí)取得最優(yōu)效果,AUC 值為0.70,ROC 曲線如圖3 所示.

        圖3 預(yù)測(cè)產(chǎn)后出血的ROC 曲線

        從圖3 中可知,基于LSTM 和XGBoost 的混合模型在利用孕婦數(shù)據(jù)和孕檢數(shù)據(jù)對(duì)產(chǎn)后大出血進(jìn)行預(yù)測(cè)能夠在40%的假陽(yáng)率下準(zhǔn)確預(yù)測(cè)出77%的大出血數(shù)據(jù),能夠?yàn)楫a(chǎn)前準(zhǔn)備工作提供參考意見.同時(shí),即使在本文中被誤判為會(huì)發(fā)生產(chǎn)后大出血的孕婦,相對(duì)于其他孕婦,依然面臨更高的產(chǎn)后大出血風(fēng)險(xiǎn).因此,針對(duì)這些孕婦進(jìn)行相關(guān)準(zhǔn)備對(duì)進(jìn)一步降低生產(chǎn)風(fēng)險(xiǎn)仍有重要意義.

        XGBoost 模型給出的重要特征如圖4 所示.通過(guò)輸出特征重要程度,可以判斷哪些因素對(duì)產(chǎn)后大出血有更顯著的影響,從而輔助醫(yī)生分析孕婦的生產(chǎn)情況,是否要提前做好產(chǎn)后大出血的相關(guān)準(zhǔn)備工作.LSTM 模型構(gòu)建的新特征是最終模型結(jié)果中最重要的特征,可見LSTM 和XGBoost 的混合模型對(duì)于提高預(yù)測(cè)的準(zhǔn)確率是有效的.模型給出的重要特征如圖4 所示,其中胎盤相關(guān)因素、血壓相關(guān)因素、年齡等在醫(yī)學(xué)實(shí)踐中都是經(jīng)驗(yàn)豐富的醫(yī)生預(yù)判孕婦產(chǎn)后大出血的重要依據(jù),與醫(yī)學(xué)先驗(yàn)知識(shí)相符.另外體重、貧血、肝功能、腎功能、畸形、流產(chǎn)次數(shù)等因素對(duì)產(chǎn)后出血的也有不可忽略的影響.由于因素較多且不夠直觀,即使是經(jīng)驗(yàn)豐富的醫(yī)生也難以直接從冗長(zhǎng)的病歷中直接得出結(jié)論,對(duì)缺乏經(jīng)驗(yàn)的醫(yī)生而言難度更高,準(zhǔn)確性也更難把握.因此,醫(yī)生可以結(jié)合本模型的預(yù)測(cè)結(jié)果,提前采取治療措施或分娩備血方案,降低產(chǎn)后大出血的發(fā)生概率.

        圖4 特征重要性

        表3 為各模型在同一測(cè)試集上的性能和運(yùn)行時(shí)間,測(cè)試集包含4000 條數(shù)據(jù).

        表3 各模型AUC 值及運(yùn)行時(shí)間

        結(jié)合圖4 和表3 可看出LSTM 模型構(gòu)造的特征能夠較大幅度提高模型的效果,而混合模型在三者中效果最好,同時(shí)運(yùn)行時(shí)間也最長(zhǎng).而LSTM 模型在運(yùn)行時(shí)間最長(zhǎng)的前提下,單模型預(yù)測(cè)效果卻最差,可能的原因是數(shù)據(jù)中正負(fù)樣本偏差較大.

        4 總結(jié)

        LSTM 與XGBoost 混合模型在構(gòu)建數(shù)據(jù)集時(shí)應(yīng)結(jié)合不同模型的特點(diǎn).LSTM 模型對(duì)時(shí)間序列信息有較強(qiáng)的處理能力,在數(shù)據(jù)集中將每次孕檢數(shù)據(jù)的時(shí)間進(jìn)行周期化處理,強(qiáng)化時(shí)間特征;針對(duì)XGBoost 模型無(wú)法提取時(shí)間信息,需要提取孕檢結(jié)果的變化,幫助模型獲取隱藏的時(shí)序信息.本文中,電子病歷數(shù)據(jù)包含著孕婦孕期內(nèi)的多類信息,不同類型的信息有不同的特點(diǎn),為適應(yīng)不同模型對(duì)數(shù)據(jù)的要求,需要對(duì)數(shù)據(jù)做出不同的處理,如孕婦多次孕檢結(jié)果反映了孕期內(nèi)孕婦身體狀況和胎兒生長(zhǎng)的動(dòng)態(tài)變化,屬于時(shí)間序列數(shù)據(jù),LSTM模型對(duì)時(shí)間序列信息有較強(qiáng)的處理能力,在數(shù)據(jù)集中將每次孕檢數(shù)據(jù)的時(shí)間進(jìn)行周期化處理,強(qiáng)化時(shí)間特征;針對(duì)XGBoost 模型無(wú)法提取時(shí)間信息,需要提取孕檢結(jié)果的變化,幫助模型獲取隱藏的時(shí)序信息.將LSTM 模型對(duì)時(shí)間序列的處理能力和XGBoost 模型的可解釋性結(jié)合,對(duì)孕婦產(chǎn)后大出血作出預(yù)測(cè).實(shí)驗(yàn)結(jié)果表明,利用LSTM 模型處理時(shí)間序列數(shù)據(jù)并將預(yù)測(cè)結(jié)果作為新特征訓(xùn)練XGBoost 模型相對(duì)于原有單模型能夠有效提高模型的性能,因此利用混合模型對(duì)孕婦產(chǎn)后大出血進(jìn)行預(yù)測(cè)是可行的.XGBoost 給出的重要特征能夠幫助醫(yī)生篩選高?;颊?通過(guò)提前備血等方式降低大出血可能帶來(lái)的風(fēng)險(xiǎn).本文采用混合模型在性能提升的同時(shí)模型的運(yùn)行時(shí)間長(zhǎng)于單模型,如何降低模型的運(yùn)行時(shí)間,滿足大數(shù)據(jù)條件下的預(yù)測(cè)是后期工作的重點(diǎn).

        猜你喜歡
        特征信息模型
        一半模型
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        如何表達(dá)“特征”
        不忠誠(chéng)的四個(gè)特征
        抓住特征巧觀察
        訂閱信息
        中華手工(2017年2期)2017-06-06 23:00:31
        3D打印中的模型分割與打包
        展會(huì)信息
        線性代數(shù)的應(yīng)用特征
        河南科技(2014年23期)2014-02-27 14:19:15
        老太脱裤让老头玩ⅹxxxx| 亚洲一二三四五中文字幕| 午夜视频在线观看日本| 国产91久久麻豆黄片| 久久午夜福利无码1000合集| 高清偷自拍亚洲精品三区| 国产农村妇女毛片精品久久 | 国产一区二区熟女精品免费| av日韩高清一区二区| 精品国产三级a∨在线欧美| 人妻插b视频一区二区三区| 无遮挡边摸边吃奶边做视频免费| 无码中文字幕加勒比一本二本| 亚洲成在人网av天堂| 91青青草在线观看视频| 亚洲一区二区三区成人网| 欧美乱妇高清无乱码免费| 免费人妻精品一区二区三区 | 成年站免费网站看v片在线| 亚洲精品无码av中文字幕| 国产精品18禁久久久久久久久| 亚洲欧洲一区二区三区波多野| 男女视频网站免费精品播放| 日本一区二区在线免费看| 亚洲av午夜福利精品一区| 狠狠色噜噜狠狠狠888米奇视频 | 开心五月激情综合婷婷色| 国产精品美女久久久久久2018| 不卡a v无码在线| 最新日韩精品视频免费在线观看| 91亚洲国产成人精品一区.| 久久精品国产亚洲av麻豆色欲| 丰满人妻被黑人猛烈进入| 欧美日韩国产色综合一二三四| 少妇bbwbbw高潮| 亚洲一区在线二区三区| 国精产品一区一区三区| 国产免国产免费| 又大又粗弄得我出好多水| 99福利影院| 日本韩国一区二区高清|