馬 霞,高玉潔,刑青紅,李冬青
(太原工業(yè)學院 理學系,山西 太原 030008)
流行性腦脊髓膜炎(簡稱流腦)是由腦膜炎奈瑟菌引起的呼吸道傳染病.分析流腦流行疫情動態(tài)對預測流腦流行有重要意義[1].灰色模型是利用較少的或不確切的表示灰色系統(tǒng)行為特征的原始數(shù)據(jù)序列生成變換后建立起來的[2].灰色系統(tǒng)理論以“部分信息已知,部分信息未知”的“小樣本”“貧信息”不確定性系統(tǒng)為研究對象,主要通過對“部分”已知信息的生成、開發(fā),提取有價值的信息實現(xiàn)對系統(tǒng)運行行為、演化規(guī)律的正確描述和有效監(jiān)控[3].灰色模型在預測手足口病、肺結(jié)核、梅毒等方面已有較多的應用[4-6].
利用灰色系統(tǒng)理論可對被測系統(tǒng)的發(fā)展變化進行全面的分析觀察和長期預測,近幾年來該理論已廣泛應用于生物醫(yī)學領(lǐng)域,并取得了較好效果[7].本文將利用我國法定傳染病報告的2011-2018年流腦年發(fā)病數(shù)據(jù)[8],結(jié)合數(shù)據(jù)預處理的幾種方法(開四次方根,取自然對數(shù),三點數(shù)據(jù)平滑和二階弱化算子處理),消除數(shù)據(jù)的隨機波動,建立GM(1,1)模型進行預測,從中可以看出流腦在我國未來幾年的整體流行發(fā)病趨勢,為流腦的防控工作提供一定的依據(jù).
2011-2018年每年流腦的發(fā)病數(shù)數(shù)據(jù)來源于疾病控制中心網(wǎng)站,見表1.
表1 2011-2018年流腦的發(fā)病數(shù)[8]
將2011-2018各年的發(fā)病人數(shù)設(shè)為原始數(shù)列,即
X(0)=(x(0)(1),x(0)(2),…x(0)(8))=(265,227,227,205,126,117,133,133)
對X(0)作一次累加,得
X(1)=(x(1)(1),x(1)(2),…,x(1)(8))=(265,492,719,924,1 050,1 167,1 300,1 433)
對X(1)作緊鄰均值生成,得
于是可得矩陣
及參數(shù)列
YN=(x(0)(2),x(0)(3),…x(0)(8))T=(227,227,205,126,117,133,133)T
利用MATLAB軟件計算得出:a=0.126 0,b=283.870 4.
可得GM(1,1)模型:
由于a=0.126 0,-a≤0.3,故GM(1,1)模型可用于中長期預測;
圖1 模型的預測值與法定報告的流腦發(fā)病數(shù)的對比
根據(jù)建立的GM(1,1)模型,利用MATLAB求解得模型預測值以及模型的精度檢驗等級,見表2和3.并將模型的預測值與法定報告的流腦發(fā)病數(shù)呈現(xiàn)在曲線圖1中進行比較.由表中數(shù)據(jù)可知,僅有小誤差概率的精度為一級,均方差比的精度為二級,而模型預測值的相對誤差較大,由此可見直接利用原始數(shù)據(jù)建立的灰色模型預測精度一般.因此,需要消除數(shù)據(jù)的波動變化,減少數(shù)據(jù)的隨機性以及調(diào)整數(shù)據(jù)的變化態(tài)勢,對原始數(shù)據(jù)進行必要的預處理,使之建立的灰色GM(1,1)模型預測精度較高.
表2 基于2011年~2018年數(shù)據(jù)模型的預測值
表3 GM(1,1)模型預測我國流腦每年發(fā)病情況的精度值
下面我們將采用數(shù)據(jù)開4次方,數(shù)據(jù)取對數(shù),數(shù)據(jù)平滑和二階弱化算子4種方法[9]對數(shù)據(jù)進行預處理,然后在建立相應的GM(1,1)模型進行預測分析.
1)數(shù)據(jù)開四次方:即對我國流腦發(fā)病人數(shù)原始數(shù)據(jù)列開四次方,參照上述建模過程可得灰色模型為:
2)取自然對數(shù):對原始數(shù)據(jù)列取對數(shù)即對我國流腦發(fā)病人數(shù)原始數(shù)據(jù)列取對數(shù),得GM(1,1)灰色模型為:
3)數(shù)據(jù)平滑法:預處理的數(shù)據(jù)平滑設(shè)計為三點平滑,具體按照式下式進行:
X(0)(t)=(X(0))(t-1)+2X(0)(t)+X(0)(t+1))/4
序列兩端點分別按照下式處理:
X(0)(1)=(3X(0))(1)+2X(0)(2))/4,X(0)(m)=(X(0)(m-1)+3X(0)(m))/4
參照上述建模過程可得灰色模型:
4)二階弱化算子處理:序列算子弱化處理方法是將原點數(shù)據(jù)(即最新數(shù)據(jù))不變換,其前面的數(shù)據(jù)則按照下式進行變換:
在上式的基礎(chǔ)上,鑒于預測精度的影響,文中對數(shù)據(jù)進行了二階弱化算子的預處理,具體即是在上式所得數(shù)據(jù)的基礎(chǔ)上再按照下式進行進一步的處理:
參照上述建模過程可得灰色模型為:
按照上述過程,利用MATLB軟件分別計算出用自然對數(shù)、三點平滑、二階弱化算子處理后的原始序列建立的灰色模型的精度,精度值見表4.基于2011年~2018年的流腦發(fā)病數(shù)據(jù),將2016,2017和2018年的數(shù)據(jù)與四種數(shù)據(jù)預處理后建立的模型預測值進行相對誤差對比,見表5.在對原始數(shù)據(jù)進行四次方根處理、自然對數(shù)處理和三次平滑處理所得的灰色模型預測值相對誤差相差不大,精度均為二級,精度一般,預測模型的效果并不理想.而二階弱化算子處理所得模型預測精度很好,且在近三年來,隨著年份的增加,預測精度也相應提高.利用MATLAB軟件計算得出四種方法預處理后的原始序列建立的模型的預測值如表6所示,并將預測值與與法定報告的流腦發(fā)病數(shù)呈現(xiàn)在曲線圖中進行比較,如圖2所示.由表6可知,利用二階弱化算子處理原始數(shù)據(jù)得到的預測模型預測的2019-2023年的流腦發(fā)病數(shù)基本處于穩(wěn)定值,從另一方面說明該病在我國的流行不會出現(xiàn)大范圍的爆發(fā),但也不會消失會一直持續(xù)存在.因此,我們應該做好相應的預防控制措施.
表4 我國流腦2011-2018年發(fā)病情況模型精度值(數(shù)據(jù)預處理后的GM(1,1)模型)
表5 基于2011年~2018年數(shù)據(jù)的預測模型及其相對誤差比較(誤差%)
表6 數(shù)據(jù)預處理建立的GM(1,1) 模型預測2019-2023年流腦的發(fā)病數(shù)
本文以2011-2018年我國流行性腦脊髓膜炎每年的發(fā)病數(shù)為例,通過對原始數(shù)據(jù)累加以及四種數(shù)據(jù)預處理的辦法,建立相應的灰色模型來預測未來幾年的流腦發(fā)病數(shù).通過比較得出采用二階弱化算子的數(shù)據(jù)預處理方法,所得的灰色模型的預測精度較好,且在近三年來,隨著年份的增加,預測精度也相應提高很多;通過模型預測得出2019-2013年流腦在我國的發(fā)病數(shù)據(jù)可知,該疾病的發(fā)病狀況基本處于穩(wěn)定狀態(tài),不會大范圍的爆發(fā).本文不足之處在于沒有考慮可能會影響流腦發(fā)病情況的各種因素,如疫苗、溫度,地區(qū),性別、年齡等,只是在數(shù)據(jù)上進行處理,這也為未來我們的工作提供一定的建議.
圖2 我國流腦年發(fā)病數(shù)與模型預測值的擬合曲線圖