李薇,朱家明,董曉冉
(安徽財(cái)經(jīng)大學(xué) 統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院,安徽 蚌埠 233030)
近幾年來(lái),過(guò)敏性疾病案例一直增加,已成為社會(huì)普遍關(guān)注的問(wèn)題.因其無(wú)法徹底根治,故世界衛(wèi)生組織將其列為21世紀(jì)需要重點(diǎn)研究和防治的三大疾病之一.通過(guò)各類學(xué)術(shù)研究前沿的表述,可知這種疾病的發(fā)生具有明顯的遺傳特征.不僅內(nèi)在效應(yīng)起著全部拉動(dòng)力,外物刺激也會(huì)導(dǎo)致過(guò)敏性疾病的發(fā)生.尤其是沙塵暴、霧霾和生態(tài)環(huán)境惡化等因素對(duì)過(guò)敏原的間接影響,直接擴(kuò)大了過(guò)敏物的傳播范圍,提高了過(guò)敏原的接觸概率.為了防治過(guò)敏性疾病,過(guò)敏原的檢測(cè)和分析是必不可少的探知手段.而過(guò)敏性疾病的產(chǎn)生與生態(tài)環(huán)境有著密切的聯(lián)系,研究環(huán)境指標(biāo)與過(guò)敏性疾病發(fā)病情況之間的關(guān)系,從而做出實(shí)際的應(yīng)對(duì)措施降低過(guò)敏性疾病的發(fā)病率,對(duì)過(guò)敏性疾病的預(yù)防與治療具有重要的意義.
關(guān)于環(huán)境指標(biāo)與人體健康之間的關(guān)系國(guó)內(nèi)外學(xué)者已有大量研究.近年來(lái),大氣環(huán)境因素對(duì)過(guò)敏性疾病、呼吸系統(tǒng)的影響受到越來(lái)越多的關(guān)注.姜賽芝等人[1]通過(guò)某市的實(shí)時(shí)空氣質(zhì)量檢測(cè)數(shù)據(jù)記錄,以及同期呼吸道病毒監(jiān)測(cè)陽(yáng)性者的數(shù)據(jù)收集,研究分析空氣污染與兒童呼吸道病毒感染的相關(guān)性,并提出PM2.5與呼吸道合胞病毒感染密切相關(guān)的結(jié)論.劉志強(qiáng)[2]利用變應(yīng)原定量免疫印跡法對(duì)42例過(guò)敏性皮膚病患者進(jìn)行過(guò)敏原檢測(cè),并通過(guò)陽(yáng)性率分析過(guò)敏性皮膚病的致病原因,以及各疾病種類在不同季節(jié)和性別的過(guò)敏原情況.李敏[3]采用軟件及非參數(shù)檢驗(yàn)對(duì)各污染物與傳染病的關(guān)系進(jìn)行多元線性回歸和線性相關(guān)分析,得出影響法定傳染病的主要因素.
本文數(shù)據(jù)來(lái)源于南昌市某醫(yī)院關(guān)于過(guò)敏原檢測(cè)的數(shù)據(jù),其中包括檢測(cè)日期、性別、年齡、科室及各過(guò)敏原結(jié)果(過(guò)敏原包括樹(shù)組合(柳樹(shù)/楊樹(shù)/榆樹(shù))、普通豚草、艾蒿、塵螨組合(屋塵螨/粉塵螨)、屋塵、貓毛、狗上皮、蟑螂、霉菌組合、律草、雞蛋白、牛奶、花生、黃豆、海魚(yú)組合、蝦、蟹).為了便于解決問(wèn)題,提出以下幾條假設(shè):⑴假設(shè)各過(guò)敏原的傳播過(guò)程是相互獨(dú)立的;⑵假設(shè)過(guò)敏原檢測(cè)全為陰性的為未過(guò)敏人群;⑶假設(shè)除數(shù)據(jù)中的17種過(guò)敏原之外的過(guò)敏原對(duì)模型結(jié)果不產(chǎn)生影響.⑷假設(shè)患者具有正確選擇科室測(cè)試過(guò)敏原的能力.⑸對(duì)過(guò)敏原強(qiáng)度向上取整.⑹假設(shè)各種過(guò)敏原的感染能力都是有效的,不存在相互抵消現(xiàn)象.
根據(jù)科室查診結(jié)果,分析各類過(guò)敏性疾病與時(shí)間、季節(jié)、性別、年齡之間的相關(guān)關(guān)系.針對(duì)這一問(wèn)題,分三個(gè)步驟來(lái)解決.首先,按科室計(jì)算各類過(guò)敏原所導(dǎo)致的過(guò)敏人數(shù),建立標(biāo)準(zhǔn)化矩陣;其次,根據(jù)過(guò)敏性的程度,利用MATLAB軟件,通過(guò)模糊C均值聚類將過(guò)敏性疾病聚類分成三類;最后,利用多元統(tǒng)計(jì)分析比較方法分別判斷這三類疾病與時(shí)間、季節(jié)、性別、年齡這4個(gè)影響因素之間的關(guān)系,并說(shuō)明過(guò)敏性疾病的大致變化方向及易感染人群的大概率范圍.
⑴理論準(zhǔn)備
模糊C均值聚類(FCM)是通過(guò)優(yōu)化目標(biāo)函數(shù)得到的樣本點(diǎn)對(duì)所有類中心的隸屬度,并進(jìn)行自動(dòng)分類的算法,主要是利用模糊理論對(duì)數(shù)據(jù)進(jìn)行建模.首先,人工隨機(jī)指定每個(gè)數(shù)據(jù)到各個(gè)簇的隸屬度,進(jìn)行模糊偽劃分;其次,由此隸屬度算出每個(gè)簇的質(zhì)心;最后,循環(huán)進(jìn)行,直至質(zhì)心不再發(fā)生改變.
⑵模型建立
根據(jù)醫(yī)院所提供的數(shù)據(jù),以各科室為方案,各種過(guò)敏原為指標(biāo),得出模糊矩陣:
運(yùn)用MATLAB軟件進(jìn)行模糊C均值聚類,得到過(guò)敏性疾病分類結(jié)果,繼而利用多元統(tǒng)計(jì)分析方法研究不同類型疾病的病人過(guò)敏原檢測(cè)結(jié)果之間的差異.思路如圖1所示.
圖1 思路圖
⑴模糊C均值對(duì)過(guò)敏性疾病分類的結(jié)果
過(guò)敏性疾病分類結(jié)果[4]見(jiàn)表1所示:
表1 過(guò)敏性疾病的分類結(jié)果
根據(jù)表中的聚類情況,將各類過(guò)敏性疾病在年度、季度、性別、年齡上的患病人數(shù)統(tǒng)計(jì)出來(lái),其中季節(jié)以3、4、5月為春季,6、7、8月為夏季,9、10、11月為秋季,12、1、2月為冬季來(lái)劃分;年齡以0-14歲為少年,15-35歲為青年,36-60歲為中年,61歲以上為老年來(lái)劃分.然后,分別探討過(guò)敏性疾病與年度、季度、性別、年齡之間的相關(guān)關(guān)系.
⑵不同類型疾病的病人過(guò)敏原檢測(cè)結(jié)果之間的差異結(jié)果
①對(duì)第一類過(guò)敏性疾病的分析
由統(tǒng)計(jì)所得數(shù)據(jù),對(duì)各個(gè)年份患第一類疾病的人數(shù)、各年份不同性別患第一類過(guò)敏性疾病的人數(shù)、各年份各季節(jié)的患病人數(shù)、各年齡階段患第一類過(guò)敏性疾病的人數(shù)進(jìn)行匯總,利用excel將其進(jìn)行可視化,可直觀觀察得出時(shí)間、性別、季節(jié)、年齡這4個(gè)影響因素與第一類過(guò)敏性疾病之間[5]的聯(lián)系,可視化結(jié)果見(jiàn)圖2-圖5.
圖2 第一類過(guò)敏性疾病時(shí)間趨勢(shì)圖 圖3 第一類過(guò)敏性疾病男女比例柱狀圖
由圖2可以看出,第一類過(guò)敏性疾病在2015年達(dá)到高峰值,隨后在2016年逐步降低,且在2017年有明顯的回升趨勢(shì).對(duì)此,可推測(cè),該市在2016年可能對(duì)此地的工廠排污排氣情況做出了明確規(guī)定,加大檢查力度,即對(duì)環(huán)境作出了人為改善,使得該年成為過(guò)敏癥狀的一個(gè)轉(zhuǎn)折點(diǎn).根據(jù)圖3可以看出從2013年至2014年,男女性患病比例并無(wú)多大差異,但在總體水平上女性患病率略高于男性發(fā)病率.
圖4 第一類過(guò)敏性疾病的季節(jié)變動(dòng)圖 圖5 第一類過(guò)敏性疾病的年齡相關(guān)比例圖
根據(jù)圖4可知,第一類過(guò)敏性疾病2013年、2015年在夏季發(fā)病率較高,在2014年、2016年、2017年的發(fā)病峰值都在秋季,而春季和冬季的發(fā)病率雖然不顯著,但近年來(lái)一直在持續(xù)上升.由圖5可以看出,無(wú)論在哪一年度,青年和中年人群都更容易獲第一類過(guò)敏性疾病,而少年和老年患病概率相比而言較低.這可能與青年人免疫系統(tǒng)更加強(qiáng)健,對(duì)外物的刺激或外來(lái)體的侵入更加敏感有關(guān),但總體來(lái)看,近幾年第一類過(guò)敏性疾病的針對(duì)范圍在逐步擴(kuò)大.
②對(duì)第二類過(guò)敏性疾病的分析
由于第二類疾病的過(guò)敏樣本人數(shù)較少,通過(guò)計(jì)算比例來(lái)消除樣本不足帶來(lái)的影響,從而可得各年份性別、季節(jié)、年齡比例數(shù)據(jù),見(jiàn)表2.
由表2可以看出,對(duì)于患第二類過(guò)敏性疾病的病人,在總體上,女性中年人群在春秋季節(jié)易患病,且在2014年和2016年該類過(guò)敏性疾病發(fā)病率嚴(yán)重.
③對(duì)第三類過(guò)敏性疾病的分析
對(duì)相關(guān)數(shù)據(jù)進(jìn)行提取和分析[8],我們可得各年份、性別患此類過(guò)敏性疾病的數(shù)據(jù),其可視化結(jié)果見(jiàn)圖5和圖6.
圖6 各年第三類過(guò)敏人數(shù)占比圖 圖7 第三類過(guò)敏性疾病性別比例圖
由圖6可以得出,第三類過(guò)敏性疾病在2016年的感染情況較嚴(yán)重,2015年次之,且在2017年的時(shí)候急劇減少,對(duì)此,可認(rèn)為這與某種過(guò)敏原的存在時(shí)間和空間有關(guān).由圖7可以看出,男性患第三種過(guò)敏性疾病的概率明顯大于女性患該過(guò)敏性疾病的概率,但對(duì)女性而言,近年來(lái)患該過(guò)敏性疾病的比例在不斷地增加,而對(duì)男性而言,該過(guò)敏性疾病的發(fā)病率在逐漸地被抑制.
對(duì)季節(jié)、年齡數(shù)據(jù)進(jìn)行相關(guān)處理,可得年份與這兩個(gè)指標(biāo)之間的比例表,見(jiàn)表3.
表2 第二類過(guò)敏性疾病分析表
年份2013年2014年2015年2016年2017年性別男0.33333310.200.571429女0.6666670410.428571季節(jié)春季0.66666700.200.428571夏季0.16666710.400秋季0.16666700.210.285714冬季000.200.285714年齡少年00000.428571青年0.16666710.200.142857中年0.66666700.610.142857老年0.16666700.200.285714
表3 第三類過(guò)敏性疾病的季節(jié)、年齡數(shù)據(jù)分析表
年份2013年2014年2015年2016年2017年季節(jié)春季0000.0869570夏季100.1818180.3478260秋季00.750.5454550.0434780.5冬季00.250.2727270.3913040.5年齡少年00000青年0.3333330.250.3636360.0434780中年0.6666670.50.6363640.9130430.5老年00.2500.0434780.5
由此可以看出,第三類過(guò)敏性疾病的感染者主要是自身免疫能力強(qiáng)的青年和中年群體,且在2016年該過(guò)敏癥狀各個(gè)季節(jié)的感染能力不同,但存在相似感染原.
結(jié)合過(guò)敏性疾病的影響因素,分析不同類型疾病的病人過(guò)敏原檢測(cè)結(jié)果之間的差異.針對(duì)此問(wèn)題,分三個(gè)步驟來(lái)解決.首先,注意過(guò)敏原檢測(cè)結(jié)果與過(guò)敏原種類、強(qiáng)度有關(guān),按過(guò)敏原強(qiáng)度計(jì)算出各類疾病的模糊綜合矩陣,不包括未含該種過(guò)敏原的過(guò)敏人數(shù);其次,利用貼近度判斷各類疾病之間是否有顯著的差異;最后,找出各類過(guò)敏性疾病所對(duì)的主要過(guò)敏原成分,并判斷其差異性.
⑴理論準(zhǔn)備
貼近度是描述兩個(gè)模糊集合相似或者貼近程度的一個(gè)重要數(shù)量指標(biāo).貼近度越接近于1,表示兩個(gè)模糊集越接近;貼近度越接近于0,表示兩個(gè)模糊集越相離.常用的貼近度有海明貼近度、最大—最小貼近度、歐幾里得貼近度等.
⑵模型的建立
根據(jù)上文中的分類,利用過(guò)敏原檢測(cè)強(qiáng)度的均值,可得各類疾病對(duì)應(yīng)的矩陣.
第一類過(guò)敏性疾病矩陣:
P1=[1.37,1.53,1.44,2.66,1.28,1.98,2.12,1.37,1.14,2.35,2.15,2.41,1.19,1.30,1.57,1.36,1.55]
第二類過(guò)敏性疾病矩陣:
P2=[0.00,0.00,1.00,4.00,1.50,1.00,0.00,1.50,1.00,1.00,2.00,2.80,1.00,1.00,1.67,1.00,1.50]
第三類過(guò)敏性疾病矩陣:
P3=[1.75,1.00,0.00,2.69,1.00,1.17,3.00,1.50,1.00,3.00,1.00,2.00,1.20,2.20,1.86,1.00,2.33]
對(duì)矩陣進(jìn)行貼近度[9]計(jì)算,可得最終結(jié)果如表4.
表4 貼進(jìn)度計(jì)算結(jié)果表
由此可以看出,各類疾病在過(guò)敏原強(qiáng)度之間沒(méi)有明顯的差異性,則某種差異性的存在只會(huì)體現(xiàn)在過(guò)敏原種類上,我們對(duì)數(shù)據(jù)進(jìn)行可視化,見(jiàn)圖8所示.
圖8 各類疾病各過(guò)敏原成分圖
由圖8可知,引起第一類疾病的主要過(guò)敏原種類是塵螨組合、貓毛、狗上皮、霉菌組合、律草和雞蛋白;引起第二類疾病的主要過(guò)敏原種類是塵螨組合、牛奶、海魚(yú)組合;引起第三類疾病的主要過(guò)敏原種類有樹(shù)組合、塵螨組合、狗上皮、律草、牛奶、黃豆和蟹.據(jù)此,聯(lián)系上文分析結(jié)果可知,春季和秋季患三種過(guò)敏性疾病的可能性更大,且大部分過(guò)敏癥狀都是由空氣中可接觸顆粒引起的.
定量分析從2013年到2017年過(guò)敏原檢測(cè)結(jié)果的變化趨勢(shì),選取一個(gè)環(huán)境保護(hù)指標(biāo),查找相關(guān)數(shù)據(jù)分析兩者之間的相關(guān)性[6].首先,對(duì)過(guò)敏原進(jìn)行分類,并進(jìn)行自主賦權(quán),統(tǒng)計(jì)其時(shí)間序列過(guò)敏程度,選取二氧化硫、二氧化氮、PM10、PM2.5作為環(huán)境指標(biāo),以南昌市為例,運(yùn)用模型分析4種指標(biāo)與過(guò)敏原檢測(cè)結(jié)果之間的相關(guān)性,從而選出相關(guān)性較強(qiáng)的指標(biāo).
⑴理論準(zhǔn)備
根據(jù)過(guò)敏原特性將所給過(guò)敏原分為三類,如圖9所示:
圖9 過(guò)敏原分類
由過(guò)敏原數(shù)量所占比重對(duì)三類過(guò)敏原進(jìn)行賦權(quán),如表5所示.
⑵模型的建立
皮爾遜相關(guān)系數(shù)法[7]是一種準(zhǔn)確度量?jī)蓚€(gè)變量之間的關(guān)系密切程度的統(tǒng)計(jì)學(xué)的方法,其相關(guān)系數(shù)的數(shù)學(xué)表達(dá)式為
將所得數(shù)據(jù)代入上述模型,求得各指標(biāo)與過(guò)敏反應(yīng)程度之間的相關(guān)關(guān)系[10],如表6.
表5 各過(guò)敏原種類所占權(quán)重
過(guò)敏原種類呼入類接觸類食入類權(quán)重6/174/177/17
表6 各指標(biāo)相關(guān)程度表
環(huán)境保護(hù)指標(biāo)PM2.5PM10SO2NO2r0.910.470.300.54
由對(duì)南昌市過(guò)敏原強(qiáng)度的季度平均值與南昌市環(huán)境保護(hù)指標(biāo)PM2.5的季度平均值進(jìn)行相關(guān)性分析的研究過(guò)程以及結(jié)果來(lái)看,環(huán)境指標(biāo)PM2.5的變化EPI與過(guò)敏原變化Ags之間呈正相關(guān).即為:
EPI=k*Ags
⑴在對(duì)過(guò)敏原檢測(cè)結(jié)果進(jìn)行差異性分析時(shí),通過(guò)貼近度計(jì)算,可發(fā)現(xiàn)不同類型過(guò)敏性疾病的過(guò)敏原存在著顯著差別.可針對(duì)不同的過(guò)敏原對(duì)于不同類型疾病的影響,對(duì)癥下藥.同時(shí)個(gè)人應(yīng)該根據(jù)自身情況,對(duì)生活中不同的過(guò)敏原加以防范,保證不讓過(guò)敏性疾病侵害自己的身體健康.還需結(jié)合實(shí)際環(huán)境,在不同的季節(jié)中不同的過(guò)敏原存在不同的影響,因此需要注意季節(jié)變化,在下一個(gè)季節(jié)到來(lái)之前針對(duì)下一個(gè)季節(jié)影響較大的過(guò)敏原提前做好防范措施,保證自己的身體健康.
⑵在對(duì)5年間過(guò)敏原檢測(cè)結(jié)果變化趨勢(shì)分析中,發(fā)現(xiàn)塵螨類、食品類過(guò)敏概率最高,由此倡議人們應(yīng)注意平時(shí)的生活習(xí)慣以及飲食習(xí)慣,例如多曬被子,可有效預(yù)防螨蟲(chóng),可對(duì)自身進(jìn)行過(guò)敏原檢測(cè),防止攝入過(guò)敏食品.在研究過(guò)敏原檢測(cè)結(jié)果的變動(dòng)趨勢(shì)時(shí),首先進(jìn)行數(shù)據(jù)預(yù)處理,有些數(shù)據(jù)因缺失而空格,不考慮進(jìn)統(tǒng)計(jì)計(jì)算.除此之外,在數(shù)據(jù)處理中,均存在一定的誤差,但由于數(shù)據(jù)的龐大,對(duì)模型整體影響不大.
⑶在對(duì)已建立的過(guò)敏原變化數(shù)據(jù)和近年環(huán)境指標(biāo)PM2.5進(jìn)行相關(guān)分析時(shí),量化發(fā)現(xiàn),在多種過(guò)敏原檢測(cè)中,塵螨類過(guò)敏原受環(huán)境的影響最高,隨著每單位的PM2.5平均濃度增加,過(guò)敏原陽(yáng)性率將增加0.768個(gè)單位,二者相關(guān)性較高.與此同時(shí),PM2.5濃度對(duì)其他類型的過(guò)敏原檢測(cè)也都有不同程度的影響,因此環(huán)境質(zhì)量對(duì)過(guò)敏原檢測(cè)有著一定的影響,環(huán)境惡化可能會(huì)進(jìn)一步加劇過(guò)敏性疾病的患病情況.在研究環(huán)境指標(biāo)和過(guò)敏原的相關(guān)性時(shí),僅對(duì)大氣質(zhì)量指標(biāo)進(jìn)行了分析與選擇,沒(méi)有對(duì)水質(zhì)量指標(biāo)、土壤質(zhì)量指標(biāo)、生物質(zhì)量指標(biāo)等進(jìn)行考慮,由醫(yī)院數(shù)據(jù)可知,醫(yī)院的過(guò)敏原檢測(cè)數(shù)據(jù)中包括水生物過(guò)敏原,以及植物過(guò)敏原等,那么水質(zhì)量以及土壤質(zhì)量對(duì)過(guò)敏性疾病的影響就會(huì)被忽略,而歸結(jié)到大氣質(zhì)量中去.因此,分析結(jié)果就會(huì)存在一定的誤差.研究者們可基于本文的模型或利用相關(guān)訓(xùn)練算法,深入討論過(guò)敏原的檢測(cè)結(jié)果和環(huán)境指標(biāo)、水質(zhì)量指標(biāo)、土壤質(zhì)量指標(biāo)、生物質(zhì)量指標(biāo)等之間的關(guān)系,利用建模手段來(lái)研究引起過(guò)敏性疾病的病理機(jī)制,給出人們相應(yīng)的結(jié)論和建議,避免或減少過(guò)敏性疾病的產(chǎn)生和傳播.
⑷在對(duì)過(guò)敏性疾病進(jìn)行模糊C均值聚類時(shí),二、三類疾病相較于一類疾病來(lái)說(shuō),數(shù)據(jù)量過(guò)少,分析二、三類疾病分別與時(shí)間,季節(jié),性別,年齡之間關(guān)系的代表性不強(qiáng),可能造成結(jié)果存在單一性.在對(duì)季度進(jìn)行分類時(shí),僅利用生活經(jīng)驗(yàn),主觀地將二、三、四月定位為春季,五、六、七月定為夏季并依次類推.這樣的分類對(duì)于大部分?jǐn)?shù)據(jù)來(lái)說(shuō)是準(zhǔn)確的,但是對(duì)于處于季節(jié)交替的數(shù)據(jù)來(lái)說(shuō)不夠準(zhǔn)確.由于缺失這方面的記錄數(shù)據(jù),所以只能采取經(jīng)驗(yàn)法則.如果將處在季節(jié)交替處的數(shù)據(jù)準(zhǔn)確定位,模型計(jì)算則更為準(zhǔn)確.
⑸基于上述模型的定量分析,可以意識(shí)到,環(huán)境質(zhì)量的好壞在影響人體呼吸等健康的同時(shí),也會(huì)影響過(guò)敏性疾病的暴發(fā),這進(jìn)一步加深了對(duì)保護(hù)環(huán)境的必要性認(rèn)知.多年來(lái),環(huán)境質(zhì)量問(wèn)題已經(jīng)成為人們?nèi)找骊P(guān)注的話題.大多數(shù)人潛意識(shí)里相信,環(huán)境質(zhì)量的直接損害更多在于對(duì)生活質(zhì)量的影響,而對(duì)健康的危機(jī)還未有量化性的認(rèn)知.但恰恰是環(huán)境質(zhì)量不僅對(duì)身體健康有著嚴(yán)重的影響,而且與過(guò)敏性疾病的發(fā)生與否有著極其密切的關(guān)系.因此,保護(hù)環(huán)境,保護(hù)身體健康,給自己一個(gè)安全舒適的生活環(huán)境,換取個(gè)人身體的長(zhǎng)久健康,遠(yuǎn)離疾病與折磨,讓生活更加美好.