亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        集成氣象環(huán)境數(shù)據(jù)的門診量預測研究

        2020-04-29 11:01:06張家艷鄭建立
        智能計算機與應用 2020年2期
        關鍵詞:門診量差分環(huán)境監(jiān)測

        張家艷, 鄭建立

        (上海理工大學, 上海 200093 )

        0 引 言

        門診是醫(yī)院對外服務的窗口。人口老齡化導致患者人數(shù)的增加以及人們越來越關注自身健康狀況,每年的門診壓力越來越大。此外,門診量與體檢和住院服務的工作量直接相關[1]。對門診病人數(shù)量進行準確和可靠的預測,有助于科學合理地分配醫(yī)院的人力物力資源如醫(yī)生坐診人數(shù)、醫(yī)療設備等,從而能更好應對門診壓力。

        在研究門診量隨時間變化過程中,影響其變化的因素太多,難以考慮全面。由于時間序列模型僅考慮日期因素,故常把門診預測當作時間序列數(shù)據(jù)分析。在時間序列模型中,最常見的是差分整合移動自回歸模型(ARIMA)[2-3]。ARIMA起初是出于經(jīng)濟學目的設計,現(xiàn)已廣泛用于醫(yī)學領域。如范曉欣等人[4]用ARIMA預測門急診人次,mape為7.01%。近年來,人們采用深度學習等新技術預測,如Wang等人[5]將時間序列分解,再用廣義回歸神經(jīng)網(wǎng)絡模型預測; Huang等人[6]使用經(jīng)驗模式分解結合粒子群算法優(yōu)化的反向傳播人工神經(jīng)網(wǎng)絡預測;相比傳統(tǒng)技術,均得到了更準確的預測結果。但深度學習技術在大數(shù)據(jù)量上效果較好,針對少數(shù)據(jù)量的情況,常采用機器學習方法。Islam等人[7]用支持向量回歸預測社區(qū)醫(yī)院的門診人次。Yang等人[8]用多層感知器預測門診就診上呼吸道感染人數(shù)。2016年以來,xgboost[9]在Kaggle等各大數(shù)據(jù)科學比賽中都得到廣泛應用,成為比賽中的高分模型。

        空氣污染是一個重大的全球性問題,空氣里的污染物能夠影響人體健康。同時,天氣的變化也能給人帶來不適,這些可能都影響門診量的變化。Seo等人[10]采用環(huán)境監(jiān)測數(shù)據(jù)與氣象數(shù)據(jù)建立韓國結膜炎門診量預測模型,發(fā)現(xiàn)門診量O3濃度相關系數(shù)為0.49。經(jīng)學者研究發(fā)現(xiàn),臺灣干眼病與環(huán)境監(jiān)測因素如一氧化碳、二氧化氮等的含量正相關(P<0.05)[11]。因此,在對門診量進行預測時,選擇氣象因素及環(huán)境監(jiān)測因素作為門診預測因素是必要的。

        1 xgboost算法

        極端梯度提升(Extreme Gradient Boosting,xgboost)是在集成學習GBDT的基礎上對目標函數(shù)進行了二階泰勒展開,在陳剛等人[12]提出之后,就得到了廣泛的應用,在許多問題上得到了優(yōu)勝的解決方案。

        1.1 xgboost

        xgboost是在GBDT上進行改進的算法,故也是由k個cart樹集成學習而來。但不同的是GBDT的基函數(shù)為決策樹,而xgboost的基函數(shù)為其他的機器學習器。在xgboost中,損失函數(shù)的計算公式在GBDT的損失函數(shù)的基礎上加上了正則化項Ω(ht),即損失函數(shù)為:

        (1)

        其中,Ω(ht)計算公式為:

        (2)

        其中,γ,λ為正則化系數(shù);J為葉子節(jié)點的個數(shù);wt, j為對應葉子節(jié)點Rt, j的輸出值。

        在GBDT中,損失函數(shù)僅僅對誤差部分做負梯度、即一階泰勒展開,但在xgboost中對誤差部分做二階泰勒展開,從而使擬合結果更準確,即:

        (3)

        在最小化損失函數(shù)的過程中,由于L(yi,ft-1(xi))為常數(shù),故不影響最小化的過程,可省略。同時,由上知wt, j的定義,而ht(xi)為xi經(jīng)過第t個決策樹處理后在子節(jié)點區(qū)域的輸出值,故式(3)可改為:

        (4)

        其中,

        1.2 xgboost的差分化處理

        機器學習技術廣泛應用在機器翻譯,語音識別等領域,而這些領域的數(shù)據(jù)有些是非數(shù)值數(shù)據(jù),很少有數(shù)值不平穩(wěn)的情況。但作為時間序列數(shù)據(jù),門診量經(jīng)常會存在不平穩(wěn)的情況。非平穩(wěn)序列包含了季節(jié)、趨勢等因素,這些不確定因素使預測結果的準確性降低[13]。故在數(shù)據(jù)預處理時,先對數(shù)據(jù)進行平穩(wěn)性檢測,如不平穩(wěn),常用的方法是進行差分化處理,即將數(shù)據(jù)的后一個數(shù)減去前一個數(shù),依次相減得到數(shù)據(jù)集,重復檢測直到數(shù)據(jù)轉化成平穩(wěn)序列,最后將預測結果進行反差分化得到最終預測結果。

        本文數(shù)據(jù)采用ADF平穩(wěn)性檢測結果得到p-value值為0.874 3,即數(shù)據(jù)是不平穩(wěn)的。將數(shù)據(jù)集進行一次差分后便發(fā)現(xiàn)p-value值變?yōu)?,數(shù)據(jù)已經(jīng)變成平穩(wěn)序列了。

        2 差分化xgboost門診量預測

        2.1 數(shù)據(jù)獲取與預處理

        本文采用kettle工具抽取了上海市某三甲醫(yī)院2017/01~2019/05年的門診日值數(shù)據(jù)。對假期和周末的門診異常值,匯合氣象環(huán)境數(shù)據(jù)后一起進行處理。

        在中國氣象數(shù)據(jù)網(wǎng)上,下載了對應2017/01~2019/05的氣象數(shù)據(jù)。這些數(shù)據(jù)總共包括22個氣象特征,對其中缺失值和異常值采用均值法進行處理。選取的主要氣象數(shù)據(jù)特征及值見表1。

        表1 部分氣象數(shù)據(jù)特征及值

        同期環(huán)境監(jiān)測數(shù)據(jù)來自于pm2.5歷史數(shù)據(jù)網(wǎng)站[13],其中的數(shù)據(jù)全部來自于國家環(huán)境保護部。對數(shù)據(jù)中的缺失數(shù)值采用均值處理。環(huán)境監(jiān)測數(shù)據(jù)特征及值見表2。

        表2 環(huán)境監(jiān)測數(shù)據(jù)特征及值

        整合上述三份數(shù)據(jù),刪除其中的周末以及假期數(shù)據(jù),共得到565份數(shù)據(jù)。從這565份數(shù)據(jù)中選取508份作為訓練集,將剩下的57份數(shù)據(jù)作為預測集。

        2.2 xgboost模型訓練

        2.2.1 超參數(shù)取值

        本算法在調(diào)參時首先采用隨機搜索調(diào)參法,確定大致的參數(shù)范圍,然后采用網(wǎng)格搜索調(diào)參法獲取最優(yōu)的參數(shù)組合。

        在本次隨機搜索調(diào)參時,采用三折交叉驗證,n_iters選擇為10即搜索次數(shù)為10。在隨機搜索調(diào)參的結果上,取每個超參數(shù)左鄰和右鄰幾個數(shù)一起作為網(wǎng)格搜索參數(shù)的初始值,最終得到的網(wǎng)格搜索參數(shù)結果見表3。

        表3 超參數(shù)取值

        2.2.2 評價標準

        對于門診量預測的結果,采用平均百分比誤差(mean absoulute percent error,mape)來衡量預測值與真實值之間的差距,采用模型擬合度R2來衡量模型的擬合程度,其計算公式具體如下:

        (5)

        (6)

        其中,yreal表示實際的門診量值;ypred表示門診量預測值;yavg表示門診量平均值。

        mape越小說明預測的準確程度越高,R2越大說明模型選擇越合理。

        2.3 結果

        2.3.1 門診量預測

        在模型確定之后,便可以訓練模型進行門診量預測。未來50天日門診量預測值與真實值的對比曲線如圖1所示。其中,虛線即為未來50天的預測值,實線為未來50天的真實值,由圖1可以看出除了在最高值或最低值處有部分偏差之外,預測走向基本一致。

        圖1 未來50天日門診量預測值與真實值

        Fig. 1 Forecast and actual values of daily outpatient visits in future 50 d

        2.3.2 差分化處理對預測結果的影響

        在數(shù)據(jù)預處理后,將數(shù)據(jù)進行差分化處理,轉化為平穩(wěn)序列,再進行預測,最終得到的預測結果是差分數(shù)據(jù)。在計算R2和mape時,需要將差分數(shù)據(jù)反差分化得到最終數(shù)據(jù)集。差分處理與未進行差分處理的R2和mape值見表4??梢钥闯觯瑢τ诜欠€(wěn)定的時間序列數(shù)據(jù),差分處理對預測結果的準確性影響明顯,因此在預測之前進行差分處理是必要的。

        表4 差分對模型結果的影響

        2.3.3 氣象及環(huán)境監(jiān)測因素對預測結果的影響

        對于門診量的預測,傳統(tǒng)的方法就是采用日期和門診量數(shù)據(jù)當作時間序列數(shù)據(jù)進行預測。這種方法解決了門診量影響因素太多無法選取全部因素的問題。在此方法中,只用時間變量來替代所有變化的因素,從而達到大致較好的預測結果。但時間因素是個籠統(tǒng)的特征,內(nèi)在的變量太多,時間變量并不能完全替代這些變量。本文將對疾病影響較大的氣象因素及環(huán)境監(jiān)測數(shù)據(jù)再加上時間變量一起預測門診量,比僅采用時間變量預測效果好。結果見表5。

        表5 預測結果對比

        3 結束語

        門診量數(shù)據(jù)為時間序列數(shù)據(jù),由于數(shù)據(jù)隨著時間變化存在波動現(xiàn)象,即數(shù)據(jù)是不穩(wěn)定的,常見的機器學習和深度學習領域,很少需要時間序列處理,故該領域的常規(guī)化處理思路便沒有差分化這一方法。為了改善預測效果,翻閱了大量統(tǒng)計學文獻后,進行了差分化處理,結果顯示采用差分化處理后的xgboost模型預測方法,得到的預測結果之平均絕對百分比誤差低于原生數(shù)據(jù)的xgboost模型,展現(xiàn)了強大的預測能力。而且,相對于僅用時間來預測門診量的方法,將氣象、環(huán)境監(jiān)測因素引入門診量預測的方法,其平均絕對百分比誤差及模型擬合度均獲得更好的效果。與其他門診量預測的研究相比[7-8],本文提出的模型的預測結果高于平均水平。由于數(shù)據(jù)集較小,深度學習方法效果不好,在后續(xù)的研究中,可以考慮抽取更多的臨床數(shù)據(jù)以擴大數(shù)據(jù)量以及引入經(jīng)濟因素,并采用優(yōu)化的深度學習模型,進一步增大預測的準確性。

        猜你喜歡
        門診量差分環(huán)境監(jiān)測
        COVID-19疫情對一家三級醫(yī)院兒內(nèi)科門診量和比例的影響
        數(shù)列與差分
        遺傳編程在醫(yī)院日門診量預測中的應用
        環(huán)境監(jiān)測系統(tǒng)的數(shù)據(jù)分析與處理
        電子制作(2019年19期)2019-11-23 08:41:54
        大氣污染問題的環(huán)境監(jiān)測
        北京市通州區(qū)空氣污染與醫(yī)院門診量關系初探
        對環(huán)境監(jiān)測數(shù)據(jù)造假必須零容忍
        公民與法治(2016年4期)2016-05-17 04:09:15
        便攜式GC-MS在環(huán)境監(jiān)測中的應用
        基于差分隱私的大數(shù)據(jù)隱私保護
        相對差分單項測距△DOR
        太空探索(2014年1期)2014-07-10 13:41:50
        特一级熟女毛片免费观看| 黄色成人网站免费无码av| 日本一二三区免费在线| 97久久草草超级碰碰碰| 中文字幕乱码亚洲无线| 久久久久人妻一区二区三区| 少妇裸淫交视频免费看| 男女肉粗暴进来120秒动态图| 中文有码亚洲制服av片| 久久少妇呻吟视频久久久| 亚洲精品无码久久久久sm| 97精品熟女少妇一区二区三区| 免费看欧美日韩一区二区三区| 久久777国产线看观看精品| 国产在线精品亚洲视频在线| 醉酒后少妇被疯狂内射视频| 每日更新在线观看av| 少妇特殊按摩高潮惨叫无码| 国产精品久久久久久婷婷| 亚洲国产高清精品在线| 99精品又硬又爽又粗少妇毛片| 人禽无码视频在线观看| 日本又色又爽又黄的a片18禁| 日韩av在线亚洲女同| 亚洲av理论在线电影网| 色欲综合一区二区三区| 亚洲综合色视频在线免费观看| 国产精品毛片一区二区| 中文字幕av高清人妻| 国产AV无码无遮挡毛片| 国产一区二区三区在线观看免费| 免费无码又爽又刺激网站直播| 亚洲天堂av黄色在线观看| 人人妻人人澡av| 国产内射合集颜射| 色偷偷偷久久伊人大杳蕉| 中文字幕午夜精品久久久| 一区二区三区蜜桃在线视频| 无码视频一区二区三区在线观看| 青青国产揄拍视频| 日本午夜理论一区二区在线观看 |