王梓寬,于海雯
(1. 南昌大學(xué)前湖學(xué)院,330031,南昌;2. 南昌大學(xué)信息工程學(xué)院,330031,南昌)
隨著社會(huì)與經(jīng)濟(jì)的發(fā)展,人們的生活水平和生活方式發(fā)生了深刻變化。人口老齡化及城鎮(zhèn)化的加速等,心血管病危險(xiǎn)因素流行趨勢越發(fā)明顯,導(dǎo)致了心血管病的發(fā)病人數(shù)持續(xù)增加,且今后10 a心血管病患病人數(shù)仍將繼續(xù)增長[1]。根據(jù)2019年中國衛(wèi)生健康統(tǒng)計(jì)年鑒[2]中的數(shù)據(jù),心血管病(心臟病、腦血管病)死亡占城鄉(xiāng)居民總死亡原因的首位,2018年心血管病農(nóng)村死亡率為322.31/(10萬),其中心臟病死亡率為162.12/(10萬),腦血管病死亡率為160.19/(10萬);城市心血管病死亡率為275.22/(10萬),其中心臟病死亡率為146.34/(10萬),腦血管病死亡率為128.88/(10萬);2018年農(nóng)村、城市心血管病死亡占全部死因的比率分別為46.66%和43.8%。心血管病事件的發(fā)生主要?dú)w因于血壓和總膽固醇水平升高等原因,在1958—1959年、1979—1980年、1991年、2002年進(jìn)行過4次全國范圍內(nèi)的高血壓抽樣調(diào)查[3],≥15歲人群高血壓的患病粗率分別為5.1%、7.7%、13.6%、17.6%,總體呈上升趨勢。心血管病的疾病負(fù)擔(dān)日漸加重,已成為重大的公共衛(wèi)生問題[1]。能否較準(zhǔn)確地預(yù)測心血管病死亡率,有利于指導(dǎo)預(yù)防心血管病事件的發(fā)生和公共衛(wèi)生事業(yè)的可持續(xù)發(fā)展。因此研究心血管死亡率的預(yù)測方法對(duì)引導(dǎo)我國公共衛(wèi)生事業(yè)的健康發(fā)展是非常有意義的。
灰色預(yù)測理論的核心和基礎(chǔ)是GM(1,1)模型[4-6],它適用于時(shí)間短、數(shù)據(jù)少、波動(dòng)小、具有長期趨勢的預(yù)測對(duì)象。對(duì)隨機(jī)波動(dòng)較大的對(duì)象,其預(yù)測值就會(huì)出現(xiàn)偏高或者偏低,擬合程度較差。馬爾柯夫預(yù)測模型則適合于一個(gè)隨機(jī)變化的動(dòng)態(tài)系統(tǒng),根據(jù)狀態(tài)間的轉(zhuǎn)移概率來預(yù)測系統(tǒng)未來發(fā)展趨勢。目前不少研究者把灰色GM(1,1)模型與馬爾柯夫預(yù)測模型相結(jié)合[7-10],即灰色-馬爾柯夫預(yù)測模型。本文主要研究灰色-馬爾柯夫的心血管病死亡率預(yù)測模型,提出了一種改進(jìn)的灰色-馬爾柯夫預(yù)測模型,并利用1991—2018年統(tǒng)計(jì)數(shù)據(jù)[2,11]進(jìn)行數(shù)值模擬。數(shù)值模擬結(jié)果表明本文提出的改進(jìn)的灰色-馬爾柯夫預(yù)測模型是有效的。
GM(1,1)模型是最簡單的灰色動(dòng)態(tài)預(yù)測模型[4-6],它的建模原理及過程如下所述。
(1)
其中a和u是需由x(1)來確定的參數(shù)。對(duì)式(1)中的方程兩邊在[k,k+1]上積分得
(2)
顯然,x(1)(k+1)-x(1)(k)=x(0)(k+1),于是式(2)等價(jià)為
(3)
當(dāng)k取從1到n-1時(shí),則得超定方程組
(4)
(5)
于是,得到GM(1,1)預(yù)測模型為
(6)
設(shè){Yn,n=0,1,2,…}是一個(gè)離散型隨機(jī)變量序列,且Yn所可能取值屬于E,而E是個(gè)包含有限個(gè)元素的集合,在此即為有限個(gè)狀態(tài)的集合。如果Yn+1的條件概率只依賴于Yn的值,即P(Yn+1=in+1|Yn=in,Yn-1=in-1,…,Y0=i0)=P(Yn+1=in+1|Yn=in),則稱該隨機(jī)過程是個(gè)有限狀態(tài)的馬爾柯夫鏈[7-8]。在描述馬爾柯夫鏈的概率分布時(shí),最重要的是條件概率pij(k)=P(Yk+1=j|Yk=i),它表示在時(shí)刻k時(shí)Yk取i值的條件下,在下一時(shí)刻Yk+1取j值的概率,一般稱pij(k)為k時(shí)刻的一步轉(zhuǎn)移概率。若隨機(jī)變量從i狀態(tài)轉(zhuǎn)移到j(luò)狀態(tài)的條件概率與時(shí)刻k無關(guān),即pij(k)=P(Yk+1=j|Yk=i)pij,則稱其為齊次馬爾柯夫鏈。
設(shè)P為齊次馬爾柯夫鏈的一步轉(zhuǎn)移概率pij的矩陣,即
(7)
(8)
為進(jìn)一步提高預(yù)測精度,本文提出以下改進(jìn)的灰色-馬爾柯夫預(yù)測模型,即取
(9)
為x(0)(k)的新擬合值和預(yù)測值,其中β0,β1,β2,β3,β4,β5為待定參數(shù)。在下面對(duì)心血管病死亡率的預(yù)測中,利用MATLAB軟件中函數(shù)regress直接計(jì)算出β0,β1,β2,β3,β4,β5,使用格式為:
b= regress(y,A,alpha),
其中y為原始數(shù)據(jù)x(0)(k),A為對(duì)應(yīng)于回歸系數(shù)β0,β1,β2,β3,β4,β5的矩陣,alpha為置信水平α(缺省時(shí)α=0.05);輸出b是一個(gè)六維列向量,它的分量分別是β0,β1,β2,β3,β4,β5的計(jì)算值。
為給出灰色-馬爾柯夫預(yù)測模型中狀態(tài)劃分,先給出中心趨勢曲線的定義。
成立,則稱F(k)為原始數(shù)據(jù)的中心趨勢曲線。
本文分別選取1991—2018年農(nóng)村與城市心血管死亡率[2,11]作為預(yù)測對(duì)象,其中1991—2016年的數(shù)據(jù)作為原始數(shù)據(jù)來建立灰色-馬爾柯夫鏈預(yù)測模型,2017年、2018年的數(shù)據(jù)作為預(yù)測樣本數(shù)據(jù),從而觀察預(yù)測效果。
首先,在方程組(4)中代入1991—2016年的數(shù)據(jù),求得方程組(4)的最小二乘解。于是,得到農(nóng)村、城市心血管病死亡率的灰色GM(1,1)預(yù)測模型分別為:
改進(jìn)的灰色-馬爾柯夫模型的預(yù)測效果見圖1,其與GM(1,1)模型預(yù)測的對(duì)比以及精度檢驗(yàn)見表1。
(a)農(nóng)村心血管病死亡率 (b)城市心血管病死亡率
表1 改進(jìn)的灰色-馬爾柯夫模型與GM(1,1)模型擬合結(jié)果以及精度檢驗(yàn)
表1 (續(xù))
根據(jù)表2[5]中的精度檢驗(yàn)分級(jí)標(biāo)準(zhǔn)及表1、表3中的計(jì)算結(jié)果,可知本文提出的改進(jìn)的灰色-馬爾柯夫與模型能很好地對(duì)心血管病死亡率進(jìn)行預(yù)測,且對(duì)農(nóng)村心血管病死亡率的預(yù)測具有更好的結(jié)果,其中原因可能是城市心血管病死亡率在2002年較其他年份非常低而導(dǎo)致模型的精度偏弱。
表2 精度檢驗(yàn)分級(jí)標(biāo)準(zhǔn)
表3 改進(jìn)的灰色-馬爾柯夫模型與GM(1,1)模型預(yù)測結(jié)果
本文針對(duì)1991-2018年農(nóng)村與城市心血管病死亡率的統(tǒng)計(jì)數(shù)據(jù),選用灰色-馬爾柯夫模型來對(duì)其進(jìn)行預(yù)測,提出了一種改進(jìn)的灰色-馬爾柯夫心血管病死亡率預(yù)測模型,數(shù)值模擬結(jié)果表明改進(jìn)的灰色-馬爾柯夫預(yù)測模型是有效的,特別是對(duì)當(dāng)前農(nóng)村心血管病死亡率的預(yù)測,這將有利于預(yù)防和指導(dǎo)心血管病防治公共衛(wèi)生事業(yè)的發(fā)展。實(shí)際上,心血管病與高血壓、血脂異常、空氣污染等許多因素有關(guān),如何建立心血管病事件與重要因素之間因果關(guān)系,從而建立更好的預(yù)測模型是需要繼續(xù)深入研究的。