徐香 朱家明
摘 ?要:構(gòu)建BP神經(jīng)網(wǎng)絡(luò)模型,對(duì)我國病毒性肝炎發(fā)病趨勢(shì)進(jìn)行預(yù)測(cè).收集1990-2019年全國病毒性肝炎發(fā)病率的數(shù)據(jù),分別構(gòu)建ARIMA模型、支持向量回歸、BP神經(jīng)網(wǎng)絡(luò)、ARIMA-SVR、ARIMA-BPANN模型,對(duì)病毒性肝炎發(fā)病率進(jìn)行預(yù)測(cè).實(shí)驗(yàn)結(jié)果表明,BP神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)的效果最佳,得到測(cè)試集的擬合值和真實(shí)值的RMSE(平均殘差平方和的平方根)和MAPE(平均絕對(duì)百分誤差)分別只有0.427 3和0.385 8,遠(yuǎn)小于其他預(yù)測(cè)模型.
關(guān)鍵詞:病毒性肝炎;發(fā)病率;BP神經(jīng)網(wǎng)絡(luò);預(yù)測(cè)
[ ? 中圖分類號(hào) ? ?]R512.6[ ? ?文獻(xiàn)標(biāo)志碼 ? ] ?A
Prediction of Incidence Rate of Viral Hepatitis Based
on BP Neural Network
XU Xiang1,ZHU Jiaming2*
(1.The Fourth People's Hospital of Bengbu,Bengbu ?233010,China; 2.School of
Statistics and Applied Mathematics,Anhui University of Finance and Economics,Bengbu ?233030,China)
Abstract:The trend of viral hepatitis in China was predicted by modeling. First,collect the relevant data of the incidence rate of viral hepatitis in China from 1990 to 2019,and build ARIMA model,support vector regression,BP neural network,ARIMA-SVR,ARIMA-BPANN and other models to predict the incidence rate of viral hepatitis. The experimental results show that the prediction effect of BP neural network is the best,The RMSE (square root of the mean residual sum of squares) and MAPE (mean absolute percentage error) of the fitting value and the real value of the test set obtained by this model are only 0.427 3 and 0.385 8,respectively,which are far less than other prediction models.
Key words: viral hepatitis; incidence rate; BP neural network; forecast
2019年1-7月中國病毒性肝炎發(fā)病人數(shù)為934 295例,死亡人數(shù)為372人;2018年中國病毒性肝炎發(fā)病人數(shù)為1 280 015例,死亡人數(shù)為531人.病毒性肝炎的發(fā)病率與受病原體變異的速度有關(guān),與易感者積累速度有關(guān),還受環(huán)境的影響.[1]病毒性肝炎的發(fā)生從歷史數(shù)據(jù)上看存在一定的規(guī)律,這有利于人們利用各種適用模型對(duì)其發(fā)病率進(jìn)行預(yù)測(cè),從而有效地為衛(wèi)生部門主動(dòng)防控工作提供有效參考.[2,3]本文以1990-2019年我國病毒性肝炎的年發(fā)病率為數(shù)據(jù),研究BP神經(jīng)網(wǎng)絡(luò)模型對(duì)病毒性肝炎發(fā)病率的預(yù)測(cè).
1 數(shù)據(jù)來源和研究方法
1.1 數(shù)據(jù)來源
本文數(shù)據(jù)來源:國家統(tǒng)計(jì)局官網(wǎng)(http://www.stats.gov.cn/tjsj/)年度數(shù)據(jù)中甲乙類法定報(bào)告?zhèn)魅静“l(fā)病率,中國疾病預(yù)防控制局網(wǎng)站(http://www.nhc.gov.cn/jkj/pqt/new_list. shtml)全國法定傳染病疫情概況.
1.2 研究方法
BP神經(jīng)網(wǎng)絡(luò)[4-9]作為一種模型,其運(yùn)行模式是向前傳遞信號(hào),反向傳遞誤差.[10]在向前傳遞時(shí),首先將數(shù)據(jù)錄入到輸入層,然后將輸入層的數(shù)據(jù)傳到隱含層進(jìn)行處理,最后經(jīng)過輸出層輸出.如果輸出結(jié)果和預(yù)想期望的值不一樣,那么會(huì)進(jìn)入下一個(gè)過程,即反向傳遞.此時(shí)每一個(gè)層次作出相應(yīng)的調(diào)整,包括模型中的權(quán)值以及不同層次之間的閾值,目的是進(jìn)一步優(yōu)化輸出值,使其接近或等于期望值.[11]算法步驟為:
(1)輸入輸出維數(shù)和訓(xùn)練集的設(shè)置.
(2)數(shù)據(jù)歸一化.
(3)確定網(wǎng)絡(luò)結(jié)構(gòu)和函數(shù)設(shè)定:首先設(shè)置BP神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)層數(shù)和各層節(jié)點(diǎn)數(shù).基于1990-2019年病毒性肝炎發(fā)病率30年的數(shù)據(jù),將輸入層節(jié)點(diǎn)數(shù)設(shè)定為27,輸出層神經(jīng)元數(shù)設(shè)定為3,將學(xué)習(xí)函數(shù)設(shè)定為{'logsig','purelin'}、traincgp和learnwh.
(4)網(wǎng)絡(luò)的建立和檢驗(yàn).用設(shè)定的訓(xùn)練集訓(xùn)練網(wǎng)絡(luò),測(cè)試集測(cè)試病毒性肝炎數(shù)據(jù)網(wǎng)絡(luò),反復(fù)執(zhí)行第 (3)~(4) 步,以測(cè)試集的實(shí)際輸出值和期望輸出值的MSE最小為標(biāo)準(zhǔn),找出最佳網(wǎng)絡(luò).
(5)評(píng)價(jià)模型預(yù)測(cè)效果.計(jì)算訓(xùn)練集原始數(shù)據(jù)(真實(shí)值)與預(yù)測(cè)結(jié)果(預(yù)測(cè)值)的平均絕對(duì)誤差、均方誤差、總方差;對(duì)2019-2021年數(shù)據(jù)預(yù)測(cè)值與原始數(shù)據(jù)進(jìn)行誤差分析,評(píng)價(jià)BP神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)效果.
2 結(jié)果與分析
2.1 BP神經(jīng)網(wǎng)絡(luò)模型對(duì)病毒性肝炎發(fā)病率的預(yù)測(cè)
BP神經(jīng)網(wǎng)絡(luò)模型對(duì)病毒性肝炎發(fā)病率的訓(xùn)練樣本集進(jìn)行訓(xùn)練,測(cè)試樣本集的仿真結(jié)果和2019-2021年病毒性肝炎發(fā)病率預(yù)測(cè)結(jié)果見圖1.在訓(xùn)練次數(shù)為5 000次,收斂誤差為0.000 01,每迭十次顯示一次的設(shè)定下,1990-2016年的網(wǎng)絡(luò)模型對(duì)訓(xùn)練樣本的擬合平均絕對(duì)誤差、均方誤差、總方差分別為0.419 7,0.294 3,7.945 5.對(duì)測(cè)試集的擬合情況和誤差分析見表1和表2.由圖2可知,BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練集擬合模型的可決系數(shù)R=0.999 97,表明該模型擬合程度很好.
2.2 五個(gè)模型的比較
采用ARIMA、支持向量回歸、BP神經(jīng)網(wǎng)絡(luò)、ARIMA-SVR、ARIMA-BPANN模型對(duì)病毒性肝炎發(fā)病率進(jìn)行預(yù)測(cè)[11-14],模型擬合的RMSE分別為3.266 6,2.364 1,0.427 3,4.753 5,3.675 5;MAPE分別為2.494 9,2.296 9,0.385 8,4.531 5,2.964 1.組合模型中,RMSE(ARIMA-SVR)>RMSE(ARIMA-BPANN),MAPE(ARIMA-SVR)>MAPE(ARIMA-BPANN),組合模型中ARIMA-BPANN較優(yōu).在五種模型中,BPANN的RMSE和MAPE最小,預(yù)測(cè)值與真實(shí)值差距最小,擬合誤差在真實(shí)值中占比最小,預(yù)測(cè)效果最好.
五種模型對(duì)2019-2021年的病毒性肝炎發(fā)病率的預(yù)測(cè)值與其真實(shí)值的對(duì)比見圖3.初步看出,BP神經(jīng)網(wǎng)絡(luò)模型與SVR模型對(duì)病毒性肝炎發(fā)病率的預(yù)測(cè)值與病毒性肝炎發(fā)病率的真實(shí)值較為接近.
3 結(jié)論與研究展望
對(duì)傳染病爆發(fā)及時(shí)有效的預(yù)測(cè)是傳染病預(yù)測(cè)控制工作的重點(diǎn),本文采用ARIMA、SVR、BP神經(jīng)網(wǎng)絡(luò)、ARIMA-SVR和ARIMA-BPANN模型分別對(duì)1990-2019年的病毒性肝炎發(fā)病率進(jìn)行擬合,結(jié)果表明,BP神經(jīng)網(wǎng)絡(luò)模型的預(yù)測(cè)效果優(yōu)于其他兩種單一模型和兩種組合模型.衡量我國各類肝炎流行程度的重要參考依據(jù)就是病毒性肝炎的發(fā)病率,流行病防控中心可以采用本文對(duì)病毒性肝炎發(fā)病率的模型合理預(yù)測(cè)其發(fā)病趨勢(shì).
病毒性肝炎的發(fā)展受公共政策、人口流動(dòng)、氣象條件等多種因素影響,如果將這些因素納入模型,在更高維度上擬合數(shù)據(jù),可以為流行病發(fā)病率分析、預(yù)測(cè)、預(yù)防提供更多有效參考.進(jìn)一步研究病毒性肝炎的誘導(dǎo)病因以及這些病因所涉及的現(xiàn)實(shí)條件,為未來疾病防控提供參考.
參考文獻(xiàn)
[1]付之鷗,周揚(yáng),陳誠,等.時(shí)間序列分析與機(jī)器學(xué)習(xí)方法在預(yù)測(cè)肺結(jié)核發(fā)病趨勢(shì)中的應(yīng)用[J].中國衛(wèi)生統(tǒng)計(jì),2020,37(2):190-195.
[2]Wah W,Das S,Earnest A,et al. Time series analysis of demographic and temporal trends of tuberculosis in Singapore[J],BMC public health,2014,14(1):1121.
[3]劉曉芬. 膠南市1990~2012年病毒性肝炎流行特征分析及預(yù)測(cè)研究[D].濟(jì)南:山東大學(xué),2014.
[4]吳越怡,朱家明,劉辛邑,等.基于BP神經(jīng)網(wǎng)絡(luò)對(duì)合金收得率影響因素的研究[J].河南科技學(xué)院學(xué)報(bào):自然科學(xué)版,2020,48(5):57-64.
[5]李細(xì)榮,林碩.基于BP神經(jīng)網(wǎng)絡(luò)的地基壓實(shí)度測(cè)量方法[J].牡丹江師范學(xué)院學(xué)報(bào):自然科學(xué)版,2022(1):54-56.
[6]朱家明,燕惹弟,張航,等.基于BP神經(jīng)網(wǎng)絡(luò)對(duì)脫氧合金冶煉中元素收得率的預(yù)測(cè)[J].青海大學(xué)學(xué)報(bào),2020,38(4):70-77.
[7]劉光宇,曹禹,黃懿,等.基于BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的圖像壓縮技術(shù)研究[J].牡丹江師范學(xué)院學(xué)報(bào):自然科學(xué)版,2021(2):23-29.
[8]朱家明,馬曉旭,陳榮燕,等.基于灰色關(guān)聯(lián)度和神經(jīng)網(wǎng)絡(luò)對(duì)科創(chuàng)板擬上市企業(yè)估值的研究[J].齊齊哈爾大學(xué)學(xué)報(bào):自然科學(xué)版,2020,36(5):79-83+94.
[9]劉文東,吳瑩,艾靜,等.BP神經(jīng)網(wǎng)絡(luò)在痢疾發(fā)病趨勢(shì)預(yù)測(cè)中的應(yīng)用研究[J].中國衛(wèi)生統(tǒng)計(jì),2012,29(6):801-804.
[10]侯少康,劉耀儒,張凱.基于IPSO-BP混合模型的TBM掘進(jìn)參數(shù)預(yù)測(cè)[J/OL].巖石力學(xué)與工程學(xué)報(bào):1-11[2020-06-10].
[11]刁秀芳,李望晨.基于SVM模型和ARIMA模型在擬合病毒性肝炎發(fā)病率中的應(yīng)用[J].現(xiàn)代預(yù)防醫(yī)學(xué),2017,44(9):1545-1548.
[12]向超. 基于ARIMA-SVR組合模型的動(dòng)力煤價(jià)格預(yù)測(cè)與實(shí)證研究[D].北京:對(duì)外經(jīng)濟(jì)貿(mào)易大學(xué),2019,26-28.
[13]朱家明,段寒冰,王子健,等.基于ARIMA模型對(duì)北京垃圾分類對(duì)策的計(jì)量分析[J].中央民族大學(xué)學(xué)報(bào):自然科學(xué)版,2020,29(2):49-56.
[14]朱家明,陳妍群,金靜.基于ARIMA模型對(duì)我國外匯儲(chǔ)備余額的預(yù)測(cè)分析[J].長沙理工大學(xué)學(xué)報(bào):自然科學(xué)版,2020,17(1):92-97.
編輯:琳莉