亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        2011—2017年基于百度搜索指數(shù)的全國(guó)手足口病預(yù)測(cè)研究

        2020-07-27 05:32:52紀(jì)煥林張燕婷羅淦豐
        關(guān)鍵詞:口病百度傳染病

        紀(jì)煥林,張燕婷,羅淦豐,李 克

        (1.汕頭大學(xué)醫(yī)學(xué)院公共衛(wèi)生與預(yù)防醫(yī)學(xué)教研室,廣東 汕頭 515041;2.中山大學(xué)公共衛(wèi)生學(xué)院醫(yī)學(xué)統(tǒng)計(jì)與流行病學(xué)系,廣東廣州 510080;3.中山大學(xué)公共衛(wèi)生學(xué)院(深圳),廣東 深圳 518107)

        手足口病是以多種腸道病毒為病原體的傳染病,目前已成為全國(guó)傳染病報(bào)告發(fā)病率排名前五的丙類傳染病[1],對(duì)5歲以下的兒童造成了嚴(yán)重的疾病負(fù)擔(dān)[2]。傳統(tǒng)的疾病監(jiān)測(cè)系統(tǒng)是通過(guò)逐層上報(bào)的形式,數(shù)據(jù)發(fā)布上有延遲。近年來(lái),已有不少研究通過(guò)挖掘互聯(lián)網(wǎng)搜索數(shù)據(jù),建立數(shù)學(xué)模型對(duì)傳染病進(jìn)行預(yù)測(cè)[3-4],證明了網(wǎng)絡(luò)搜索數(shù)據(jù)對(duì)傳染病疫情有一定的預(yù)測(cè)能力。本研究旨在建立一個(gè)結(jié)合百度關(guān)鍵詞搜索指數(shù)和全國(guó)手足口病發(fā)病數(shù)的自回歸移動(dòng)平均模型(autoregressive integrated moving average,ARIMA),對(duì)手足口病的發(fā)病進(jìn)行監(jiān)測(cè)和預(yù)測(cè)。

        1 資料與方法

        1.1 數(shù)據(jù)來(lái)源

        2011—2017年手足口病的發(fā)病數(shù)據(jù)來(lái)源于中國(guó)疾病預(yù)防與控制中心公布的數(shù)據(jù)(http://www.phsciencedata.cn/Share/),其中2011年1月—2016年12月數(shù)據(jù)用于模型擬合,2017年1—12月的數(shù)據(jù)用于模型驗(yàn)證。對(duì)應(yīng)時(shí)間的百度關(guān)鍵詞搜索指數(shù)數(shù)據(jù)從百度指數(shù)官網(wǎng)(http://index.baidu.com)上以月為單位進(jìn)行收集。

        1.2 研究?jī)?nèi)容與方法

        1.2.1 構(gòu)建綜合百度搜索指數(shù) 從手足口病的疾病名稱、癥狀、治療和預(yù)防4個(gè)維度入手,結(jié)合相關(guān)領(lǐng)域文獻(xiàn),參考百度關(guān)鍵詞挖掘工具(http://tool.chinaz.com/baidu/words.aspx)選擇關(guān)鍵詞并擴(kuò)展,初步獲取了240個(gè)與手足口病相關(guān)的基礎(chǔ)關(guān)鍵詞,計(jì)算每個(gè)關(guān)鍵詞的搜索指數(shù)與手足口病發(fā)病數(shù)的Spearman相關(guān)系數(shù),按照相關(guān)系數(shù)r>7且有統(tǒng)計(jì)學(xué)意義(P<0.05)的原則,篩選出最終納入分析的關(guān)鍵詞。然后構(gòu)建綜合百度搜索指數(shù),即計(jì)算每個(gè)關(guān)鍵詞的搜索指數(shù)與發(fā)病數(shù)的相關(guān)系數(shù)在所有相關(guān)系數(shù)之和中的權(quán)重系數(shù),再將該權(quán)重系數(shù)與對(duì)應(yīng)的關(guān)鍵詞的搜索指數(shù)相乘,最后求和得到。最后計(jì)算綜合百度搜索指數(shù)與全國(guó)發(fā)病數(shù)據(jù)的Spearman相關(guān)系數(shù),確定相關(guān)性的大小。相關(guān)公式如下:

        式中,ρi為第i個(gè)關(guān)鍵詞的搜索指數(shù)與發(fā)病數(shù)的相關(guān)系數(shù);Weighti為第i個(gè)關(guān)鍵詞的權(quán)重系數(shù);Keywordi為第i個(gè)關(guān)鍵詞的搜索指數(shù)。

        1.2.2 模型擬合 ARIMA模型是一種將ARMA模型與差分運(yùn)算組合的時(shí)間序列預(yù)測(cè)方法,即建立一個(gè)由因變量和隨機(jī)誤差對(duì)平穩(wěn)時(shí)間序列的滯后值影響的模型,公式為ARIMA(p,d,q)×(P,D,Q)s,該模型應(yīng)用的前提條件是所要預(yù)測(cè)數(shù)列的個(gè)體值需相對(duì)穩(wěn)定[5]。本研究通過(guò)時(shí)序圖及單位根檢驗(yàn)來(lái)判斷時(shí)間序列的平穩(wěn)性,采用差分處理將不平穩(wěn)的序列轉(zhuǎn)換為平穩(wěn)序列,用極大似然法估計(jì)模型參數(shù)。模型殘差通過(guò)Ljung-Box方法判斷是否為隨機(jī)序列。根據(jù)赤池信息準(zhǔn)則來(lái)判斷模型的擬合優(yōu)度,AIC值最小時(shí)為最優(yōu)模型。以上方法通過(guò)R軟件中的“tseries”和“forecast”包實(shí)現(xiàn)。

        1.2.3 模型預(yù)測(cè) 模型的預(yù)測(cè)效果使用均方根誤差百分比(root mean squared percent error,RMSPE)和平均絕對(duì)百分比誤差(mean absolute percent error,MAPE)來(lái)評(píng)價(jià)[6],其值越小,說(shuō)明模型預(yù)測(cè)性能越好。計(jì)算公式如下:

        式中,Ti表示第i個(gè)真實(shí)值;Pi表示第i個(gè)預(yù)測(cè)值。

        1.3 統(tǒng)計(jì)學(xué)方法

        模型的分析及作圖使用軟件R 3.4.1,檢驗(yàn)水準(zhǔn)均為a=0.05,P<0.05認(rèn)為差異有統(tǒng)計(jì)學(xué)意義。

        2 結(jié)果

        2.1 2011—2017年全國(guó)手足口病發(fā)病概況

        2011—2017年全國(guó)共計(jì)發(fā)病達(dá)14 787 625人,月平均發(fā)病數(shù)176 043人,年平均發(fā)病率約154/10萬(wàn)。

        2.2 關(guān)鍵詞的篩選與綜合百度搜索指數(shù)的構(gòu)建

        分別對(duì)240個(gè)百度關(guān)鍵詞搜索指數(shù)和全國(guó)手足口病發(fā)病數(shù)進(jìn)行相關(guān)分析,按r>0.7,P<0.05的條件,篩選出19個(gè)關(guān)鍵詞,見(jiàn)表1。根據(jù)19個(gè)關(guān)鍵詞的百度搜索指數(shù)及其與全國(guó)手足口病發(fā)病數(shù)的相關(guān)系數(shù)進(jìn)行加權(quán)來(lái)構(gòu)建綜合百度搜索指數(shù)。全國(guó)手足口病發(fā)病數(shù)與綜合百度搜索指數(shù)的相關(guān)系數(shù)r=0.94,P<0.05。

        2.3 模型擬合

        2.3.1 時(shí)間序列平穩(wěn)化 用2011年1月—2016年12月的發(fā)病數(shù)據(jù)構(gòu)建時(shí)間序列,繪制時(shí)序圖,發(fā)現(xiàn)序列為非平穩(wěn)序列,需進(jìn)行差分處理。差分后通過(guò)單位根檢驗(yàn)得DF=-4.176 5,P<0.05,說(shuō)明該序列已經(jīng)平穩(wěn),d與D取值為1。序列的季節(jié)周期為12個(gè)月,故s=12。

        2.3.2 模型的定階 繪制自相關(guān)圖和偏自相關(guān)圖后發(fā)現(xiàn)自相關(guān)系數(shù)拖尾,q可取值0。偏自相關(guān)系數(shù)2階后截尾,p可取值1或2。P,Q值一般不會(huì)超過(guò)2,分別對(duì)P,Q值取0、1逐個(gè)嘗試,結(jié)合AIC值判斷,最終確定的模型為ARIMA(2,1,0)(0,1,1)12,此模型的AIC值最小。

        表1 19個(gè)百度關(guān)鍵詞與手足口病發(fā)病數(shù)的相關(guān)性

        2.3.3 模型驗(yàn)證 對(duì)此模型殘差進(jìn)行白噪聲檢驗(yàn),Ljung-Box統(tǒng)計(jì)量Q=0.165,P=0.684,未通過(guò)顯著性檢驗(yàn),殘差是隨機(jī)序列,證明該模型已充分提取原序列信息,可進(jìn)行預(yù)測(cè)。

        2.4 模型預(yù)測(cè)效果比較

        2017年1—12月手足口病實(shí)際發(fā)病數(shù)與模型預(yù)測(cè)發(fā)病數(shù)見(jiàn)表2,進(jìn)一步計(jì)算模型的預(yù)測(cè)效果指標(biāo),得到基于百度指數(shù)的模型的MAPE=24.86%,RMAPE=29.86%;單獨(dú)利用發(fā)病歷史數(shù)據(jù)的模型的MAPE=27.58%,RMAPE=35.50%,說(shuō)明前者的預(yù)測(cè)準(zhǔn)確度要更好。基于百度搜索指數(shù)建立的ARIMA模型與單獨(dú)利用發(fā)病歷史數(shù)據(jù)建立的ARIMA模型的預(yù)測(cè)效果見(jiàn)圖1、圖2。

        3 討論

        百度指數(shù)是大數(shù)據(jù)時(shí)代重要的統(tǒng)計(jì)分析數(shù)據(jù),客觀地記錄了各個(gè)關(guān)鍵詞每日的搜索量。網(wǎng)絡(luò)搜索詞量的動(dòng)態(tài)變化一定程度上反映了該地區(qū)相關(guān)疾病流行情況和人群中發(fā)病及求醫(yī)的信息[7]。ARIMA模型是應(yīng)用于傳染病預(yù)測(cè)最常用的方法之一[8-9],其綜合考慮了傳染病的周期性、季節(jié)性、隨機(jī)性等可能影響序列平穩(wěn)性的因素,提高了模型的預(yù)測(cè)和擬合效果。利用網(wǎng)絡(luò)搜索數(shù)據(jù)進(jìn)行傳染病的預(yù)測(cè)已成為研究熱點(diǎn)之一,國(guó)外研究基于“谷歌”搜索引擎已有登革熱[10]、流行性感冒[11]谷歌趨勢(shì)預(yù)測(cè),國(guó)內(nèi)更多的研究是挖掘百度搜索指數(shù),進(jìn)行不同數(shù)學(xué)模型預(yù)測(cè),如流行性感冒[12]、登革熱[13]、紅斑性肢痛癥[14]等,也有對(duì)清遠(yuǎn)市做基于百度指數(shù)的手足口病不同數(shù)學(xué)模型的預(yù)測(cè)研究[15-16],但目前尚無(wú)基于百度搜索指數(shù)的全國(guó)手足口病ARIMA發(fā)病預(yù)測(cè)模型研究。

        表2 2017年1—12月的實(shí)際發(fā)病數(shù)與模型預(yù)測(cè)發(fā)病數(shù)(人)

        圖1 基于百度搜索指數(shù)的ARIMA模型預(yù)測(cè)效果圖

        圖2 基于發(fā)病歷史數(shù)據(jù)的ARIMA模型預(yù)測(cè)效果圖

        本研究利用關(guān)鍵詞挖掘工具,從240個(gè)百度關(guān)鍵詞最終篩選出19個(gè)相關(guān)系數(shù)大于0.7的關(guān)鍵詞,然后加權(quán)構(gòu)建綜合百度搜索指數(shù),提高了預(yù)測(cè)的精確度。綜合百度搜索指數(shù)與手足口病發(fā)病數(shù)的相關(guān)性為0.94,同時(shí),兩者變化的趨勢(shì)較為一致,說(shuō)明使用百度指數(shù)進(jìn)行手足口病發(fā)病的預(yù)測(cè)是合理且可靠的。利用建立的ARIMA模型進(jìn)行預(yù)測(cè),發(fā)現(xiàn)用結(jié)合百度搜索指數(shù)建立的ARIMA模型相對(duì)于只基于手足口病發(fā)病數(shù)建立的ARIMA模型,前者的MAPE值以及RMSPE值都比較低,說(shuō)明使用百度搜索指數(shù)可以更好地提升ARIMA模型的預(yù)測(cè)性能。

        本研究也存在一定局限性,百度關(guān)鍵詞受到網(wǎng)民文化教育水平、個(gè)體健康需求等的影響,導(dǎo)致關(guān)鍵詞范圍寬泛;另一方面,人們也可能受媒體報(bào)道的影響,使百度指數(shù)存在媒體效應(yīng),造成百度指數(shù)的虛浮。盡管如此,挖掘互聯(lián)網(wǎng)大數(shù)據(jù)對(duì)傳染病進(jìn)行發(fā)病預(yù)測(cè)的方法,為傳染病的監(jiān)測(cè)和防控提供了一個(gè)新思路。隨著大數(shù)據(jù)時(shí)代的來(lái)臨,百度指數(shù)作為一個(gè)方便、免費(fèi)、易得的數(shù)據(jù)來(lái)源,應(yīng)用前景廣泛,未來(lái)可以使用不同的數(shù)學(xué)模型,結(jié)合全國(guó)或不同地區(qū)的傳染病發(fā)病數(shù)據(jù),建立預(yù)測(cè)性能更優(yōu)的傳染病監(jiān)測(cè)系統(tǒng)。

        猜你喜歡
        口病百度傳染病
        《傳染病信息》簡(jiǎn)介
        傳染病信息(2022年3期)2022-07-15 08:25:08
        傳染病的預(yù)防
        肝博士(2022年3期)2022-06-30 02:48:50
        3種傳染病出沒(méi) 春天要格外提防
        手足口病那些事
        警惕手足口病
        幼兒園(2020年18期)2020-12-30 11:58:02
        孩子“口腔潰瘍”警惕手足口病惹禍
        Robust adaptive UKF based on SVR for inertial based integrated navigation
        呼吸道傳染病為何冬春多發(fā)
        百度年度熱搜榜
        百度遭投行下調(diào)評(píng)級(jí)
        美女叉开双腿让男人插| 亚洲av福利无码无一区二区| 久久无码人妻精品一区二区三区| 国产精品三级在线观看| 色偷偷av一区二区三区人妖| 中文字幕人妻互换av| 亚洲国产高清一区av| 精品国产亚洲亚洲国产| 久久久无码人妻精品无码| 国产精品成人va| 亚洲av乱码一区二区三区女同 | 美女丝袜美腿玉足视频| 18禁裸体动漫美女无遮挡网站| 欧美一区二区三区红桃小说| 亚洲区在线播放| 一区二区三区国产大片| 国产一区二区黄色录像| 无码人妻av一区二区三区蜜臀 | 亚洲欧美日韩精品久久| 国产精品 人妻互换| 国产精品无码一区二区在线国| 精品粉嫩国产一区二区三区| 黄色av亚洲在线观看| 国产顶级熟妇高潮xxxxx| 亚洲色成人网一二三区| 日韩午夜三级在线视频| 99riav国产精品视频| 国产人妻无码一区二区三区免费 | 少妇人妻陈艳和黑人教练| 国产精品久久久久久无码| 91热国内精品永久免费观看| 精品婷婷国产综合久久| 国产精品三级av及在线观看 | 丁香美女社区| 精品亚洲成a人在线观看青青| 亚洲熟女av超清一区二区三区| 色婷婷亚洲精品综合影院| 一区二区三区视频| 亚欧国产女人天堂Av在线播放| 中文字幕日本一区二区在线观看| 久久精品国产91精品亚洲|