2012年全國數(shù)學建模的D題是患病率的預測與控制問題。影響患病率的因素主要氣壓,溫度,日照時間,相對濕度,溫度差等。我們在模型中主要從氣壓,溫度,相對濕度三個因素來考慮對未來時間對腦卒中的發(fā)病率進行預測及其控制。
在建模前,我們對數(shù)據(jù)做了如下準備工作:一、對原始數(shù)據(jù)進行預處理, 將原始數(shù)據(jù)的錯誤值,缺失值通過spss軟件進行了數(shù)據(jù)趨勢的替換或補全。二、 查閱了相關的資料,了解腦卒中的分為腦出血、腦血栓及腦栓塞,結合其病灶、特征及其臨床指標,對二、三問題的情況進行分析。
本文從城鄉(xiāng)人口職業(yè)患病率相差很大的現(xiàn)象入手,根據(jù)氣壓、溫度、相對濕度三個自變量建立多元非線性回歸患病方程。我們并將該非線性方程通過標準化轉換為線性回歸方程,采用回歸分析的思想處理了患病率與環(huán)境因素的關系。
一、問題重述
腦卒中(腦中風)是目前威脅人類生命的嚴重疾病之一,由于其患病的難逆轉性,隱蔽性,和潛伏周期較長,與周圍的生活環(huán)境息息相關。這種疾病的誘因已被證實與環(huán)境因素,包括氣溫和濕度之間存在密切的關系,我們本題通過中國某市提供患腦卒中的病人的基本信息和該地區(qū)的逐日氣象數(shù)據(jù),來該疾病的預防及治療提供依據(jù)和參考。
我們通過病人的基本情況來討論換腦卒中的城鄉(xiāng)差別、男女比例、集中的年齡段和職業(yè)差別。
通過對該市的氣象數(shù)據(jù)進行整合與分析,標準化數(shù)據(jù)用來判定外界環(huán)境的變化(溫度、大氣壓、相對濕度等)與腦卒中之間存在的內在聯(lián)系。結合對腦卒中的發(fā)病的系統(tǒng)描述和與環(huán)境變化的關系,對高危人群的發(fā)病的征兆和病發(fā)前的預防提出相應的意見。
通過對問題二三的研究和論述,找出腦卒中的預防方法和資料手段,對我國的醫(yī)療保障體系提出建議,對衛(wèi)生行政部門和醫(yī)療機構合理調配醫(yī)務力量、改善就診治療環(huán)境、配置床位和醫(yī)療藥物提供現(xiàn)實的依據(jù)。
二、模型基本假設
(一)對腦卒中中腦出血和腦血栓的患病情況做同一考慮;
(二)其他環(huán)境因素如日照時間不納入第二問考慮范圍;
(三)發(fā)病率與環(huán)境(溫度、大氣壓、相對濕度)變化存在一定的線性或非線性關系;
(四)病人的年齡取1到100歲之間;
(五)數(shù)據(jù)處理后職業(yè)[9]全為其他職業(yè)。
三、問題分析
本問題是關于腦卒中患病情況的預測與控制問題。
問題一:
我們首先根據(jù)病人的基本信息,對原始數(shù)據(jù)進行預處理,從原始數(shù)據(jù)中提取出有效的數(shù)據(jù)并對缺失值,錯誤值進行補完或更正。根據(jù)出來好的數(shù)據(jù)對病人基本情況進行統(tǒng)計描述。分別對數(shù)據(jù)集中趨勢、離散趨勢、分布特征等參數(shù)進行計算,求均值,標準差、方差、四分位數(shù)間距、偏度、峰度等值,求出該數(shù)據(jù)的大致趨勢。
問題二:
我們利用題目所給四年內的環(huán)境數(shù)據(jù),建立多元非線性模型,對數(shù)據(jù)標準化處理,轉換為多元線性回歸方程,求出人口患病率與氣壓,溫度,相對濕度的關系。
問題三:
利用以上兩問得到的數(shù)據(jù),加上查閱的資料,結合城鎮(zhèn)化差別,醫(yī)療保障體系,文化水平差異,地區(qū)差異,對高危人群提出預警干預方案,及其對中國人口腦卒中患病率合理的預測和分析,從而實現(xiàn)對該疾病的控制。根據(jù)中華人民共和國衛(wèi)生部腦防辦的文件對個人,及其醫(yī)療行政單位和醫(yī)療機構提出建設性意見。
四、模型的建立及求解
性別數(shù)據(jù)在離散趨勢上表現(xiàn)為標準差=0.5、方差=0.25、四分位數(shù)間距=1
年齡數(shù)據(jù)在分布特征上表現(xiàn)為偏度=0.16、峰度=-1.98
職業(yè)數(shù)據(jù)在集中趨勢在表現(xiàn)為如均值=2.17
職業(yè)數(shù)據(jù)在離散趨勢上表現(xiàn)為標準差=2.21、方差=4.88、四分位數(shù)間距=2
年齡數(shù)據(jù)在分布特征上表現(xiàn)為偏度=1.8、峰度=2.0
我們將男性和女性的人數(shù)分離出來。得到男性患病得為33395人,女性患病的為21753人,男女患病比例圖。
通過對男女發(fā)病比例圖,我們了解到男性在整個患病人群中占54%,
女性占46%,男性的患病比例比女性高。
在給定的數(shù)據(jù)中還有患病者的年齡,職業(yè)。為了能系統(tǒng)的描述患病的情況。我們又從兩個方面分析患病情況,第一種情況:不同性別不同年齡段患病情況;第二種情況:不同性別不同職業(yè)的患病情況。
我們分析第一種情況:不同性別不同年齡段患病情況。對于年齡的分段 聯(lián)合國世界衛(wèi)生組織提出新的年齡分段:
但是我們考慮到這種分段法對于該數(shù)據(jù)的統(tǒng)計描述結果不能很好的體現(xiàn)需說明問題,尤其在疾病發(fā)病率越來越偏向中青年化的當今。我們采用20年為一段對年齡進行分段。分為0—19歲、20—39歲、40—59歲、60—79歲、80—100歲。
對第一種情況我們可以得出:在整個數(shù)據(jù)中男性發(fā)病率主要集中60歲—79歲占全部調查男性的60%,女性發(fā)病率主要集中60歲—79歲,占全部調查女性的48%。由此得出不論男女,腦卒中的發(fā)病率主要集中還是集中60歲—79歲這一年齡段內。
第二種情況:不同性別不同職業(yè)患病情況。
我們討論這種情況是應為現(xiàn)在的職業(yè)病很普遍,我們想探究腦卒中是否與職業(yè)有關。因此我們在這種情況下建立的相應的圖來進行描述。 可看出腦卒中的發(fā)病人群主要集中在農(nóng)民,所以農(nóng)民在整個職業(yè)中屬于高危人群。
為了能夠農(nóng)民(高危人群)更加詳細的分析,我們將農(nóng)民的人數(shù)進行整合不分性別,討論起發(fā)病的時間段。同時為第三問建立提前預防的數(shù)學依據(jù)。
通過計算我得到調查數(shù)據(jù)中農(nóng)民總人數(shù)為42547人。同時我們也將農(nóng)民的年齡分為0—19歲、20—39歲、40—59歲、60—79歲、80—100歲。不同年齡段農(nóng)的發(fā)病情況。
通過對數(shù)據(jù)的整理,我們詳細的分析出的腦卒中在調查人群中男女所比例、不同性別所占比例和不同職業(yè)中的所占比例。得出了相應的結論:
在整個調查中,男性患腦卒中的比例大于女性。在不同性別中男女發(fā)病年齡段主要集中在60—80歲(不包括80)。從職業(yè)方面可得出, 腦卒中的主要發(fā)病人群集中分布在農(nóng)民。
總結
借助了圖形和簡單的運算,大致了解發(fā)病人群的一些特征,病人基本信息是從發(fā)病人群中產(chǎn)生的,其特征也反映了發(fā)病人群的特征,對病人基本信息的描述也是對其發(fā)病人群的一個近似的描述,從年齡上60-80歲顯著,性別上男性顯著,職業(yè)上農(nóng)民顯著這一結論。
(作者單位:重慶三峽職業(yè)學院)