曹可 呂繼續(xù)
摘? 要:基于某傳染病從2004至2016年的發(fā)病數與死亡數數據,繪制了該傳染病流行病的散點圖,判斷該流行病每年發(fā)病人數呈曲線式降低。通過最小二乘法的方法對該流行病進行了曲線擬合,擬合結果顯示冪函數、3次函數、4次函數。都能較好地擬合該流行病的變化趨勢,通過比對發(fā)現3次函數擬合效果最好。最后,使用3次函數對該流行病2019年的發(fā)病人數進行了預測。
關鍵詞:最小二乘法? 曲線擬合? 傳染病預測
中圖分類號:TP18;N945.24 ? ?文獻標識碼:A 文章編號:1672-3791(2019)11(c)-0228-02
疾病是我們每個人都會遇到的問題,生活中的疾病感染源廣泛,那么我們就需要對疾病的感染人群的健康情況進行分析、預測,從而采取必要的措施來進行疾病的預防。
身處大數據時代,分析數據成為了一種趨勢,對于已知的數據,我們可以采用多種方法對數據進行管理、分析、預測,從而得出對我們有用的數據信息。最小二乘法是最經典的數據預測、分析計算方法。該文利用最小二乘法將已知的數據進行數值分析,繪制不同類型的函數圖形,對比分析選取最優(yōu)函數。根據所得到的最優(yōu)函數對該種流行病2019年的發(fā)病人數進行預測。
1? 最小二乘法實現原理及過程
通過實現原理的闡述,以及算法的具體實現過程介紹最小二乘法擬合。
1.1 最小二乘法實現原理
最小二乘法是一種常用的優(yōu)化方法,它采用的是求出平方的最小值得到誤差的最小值。對于給出的一組數據,通過對這組數據的誤差最小值的求解得到最適合函數,根據函數就可以對數據進行預測。
1.2 最小二乘法實現過程
對于給定的數據[1]點{(xi,yi),i=0,1,…,n},假設yi=方f(xi),(i=1,2,…,n)擬合出一個函數y=S(x)與所給的數據{(xi,yi),i=1,2,…,n},使得δi=S(xi)-yi(i=0,1,…,n)。設0(x),1(x),…,n(x)是C[a,b]上的線性無關函數簇。以(x)為基地找到一個使得min{0,1,…,n}最小的S(x),根據得到的函數y=S(x)對接下來的數據進行預測,這就是最小二乘法曲線擬合。
2? 基于流行病數據曲線擬合
根據現有的流行病數據,繪制表1,年份為所在年份的后兩位,如4代表2004年,以此類推。
3? 散點圖分析及曲線擬合預測
通過對散點繪制圖像分析,選擇較合適的擬合曲線,對發(fā)病人數進行預測。
3.1 擬合散點圖分析
根據擬合的曲線可觀測出4次函數最逼近散點,從而得到如圖1所示的最能描述時間與發(fā)病人數的擬合曲線[2]。
3.2 曲線擬合對比預測
根據散點圖分析我們進行曲線擬合,冪函數擬合,并進行對比??捎^測出3次函數最逼近散點,從而得到最能描述發(fā)病人數與時間的曲線方程[3]。
發(fā)病人數與時間的方程式為:
y=257.75+4+11490.5973-183315.5282+1192752.05-
1501238.253
根據擬合的曲線方程,預測得到2019年此流行病的發(fā)病人數為207848。
4? 結語
對于該文中的傳染病每年發(fā)病人數的預測,采用了最小二乘法進行曲線擬合。為了更好地擬合效果,期間使用python語言進行了多次冪函數的擬合,隨后將擬合得到的曲線進行比較,選取最能描述時間與發(fā)病人數的關系的曲線方程進行預測。因數值較大,最后采用python程序對結果進行簡單的預測,得出較為精確的值。該文涉及到的最小二乘法預測流行病人群的發(fā)病。死亡情況,可根據預測得出的結果采取有效的措施,對流行病進行合理有效的控制。
參考文獻
[1] 陳韋名.曲線擬合原理及其應用研究[D].長沙理工大學,2018.
[2] 唐鵬,李嬌,苗純,等.基于matplotlib繪制材料力學中梁的彎矩圖的研究[J].中國多媒體與網絡教學學報,2019(5):36-37.
[3] 段彥君,周西鳳.基于最小二乘法的宿州市GDP曲線擬合及預測研究[J].現代商業(yè),2018(34):65-67.