亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于疾病與環(huán)境科學(xué)數(shù)據(jù)的跨領(lǐng)域關(guān)聯(lián)分析及應(yīng)用

        2017-03-21 08:45:32,,
        關(guān)鍵詞:項(xiàng)集顆粒物發(fā)病率

        ,,

        環(huán)境健康是醫(yī)學(xué)領(lǐng)域研究發(fā)展的一個(gè)重點(diǎn)交叉領(lǐng)域,環(huán)境對(duì)健康產(chǎn)生的影響近年來(lái)已受到國(guó)家重視,環(huán)境健康研究積極持續(xù)開(kāi)展是實(shí)現(xiàn)“健康中國(guó)2030”的重要保障,尤其一些區(qū)域性高發(fā)疾病與該地區(qū)環(huán)境狀況密不可分。

        本文以美國(guó)環(huán)境和健康領(lǐng)域開(kāi)放科學(xué)數(shù)據(jù)為例,研究一般空氣污染物、細(xì)顆粒物、氣象條件、有毒物質(zhì)等環(huán)境因素與肺癌、哮喘等疾病的關(guān)聯(lián)關(guān)系,同時(shí)結(jié)合實(shí)際應(yīng)用場(chǎng)景可視化展示環(huán)境與疾病科學(xué)數(shù)據(jù)關(guān)聯(lián)分析結(jié)果,幫助公眾了解環(huán)境條件變化容易引發(fā)某些疾病,有助于提升公眾的疾病預(yù)防意識(shí),為復(fù)雜環(huán)境條件下疾病的預(yù)防控制提供理論依據(jù),對(duì)我國(guó)環(huán)境與健康關(guān)聯(lián)關(guān)系的研究提供借鑒,也是實(shí)現(xiàn)“健康中國(guó)2030”的重要保障。

        1 數(shù)據(jù)資源

        本文采用來(lái)自美國(guó)疾病控制與預(yù)防中心網(wǎng)站[1]、美國(guó)國(guó)家環(huán)境保護(hù)署網(wǎng)站[2]開(kāi)放獲取的科學(xué)數(shù)據(jù)。數(shù)據(jù)資源分為疾病數(shù)據(jù)和空氣污染數(shù)據(jù)兩部分,疾病數(shù)據(jù)主要涉及呼吸系統(tǒng)疾病(如哮喘、肺癌等)、慢性病(如糖尿病)等,空氣污染數(shù)據(jù)包括一般空氣污染物氣體、細(xì)顆粒物與有毒物質(zhì),此外還有氣象數(shù)據(jù)。其中1999-2013年美國(guó)肺癌發(fā)病率數(shù)據(jù),包括美國(guó)全國(guó)及其各州的全種族肺癌發(fā)病率、白種人肺癌發(fā)病率、黑種人肺癌發(fā)病率、西班牙裔肺癌發(fā)病率,其中2013年數(shù)據(jù)如表1所示。

        表1 2013年美國(guó)肺癌發(fā)病率數(shù)據(jù)實(shí)例(每10萬(wàn)人)

        從美國(guó)國(guó)家環(huán)境保護(hù)署網(wǎng)站獲取1990-2016年美國(guó)環(huán)境數(shù)據(jù),分別包括各州按年度、按月份、按天記錄的一般污染物氣體(如臭氧Ozone、二氧化硫SO2、一氧化碳CO、二氧化氮NO2)、細(xì)顆粒物(如PM2.5、PM10)、氣象指標(biāo)(風(fēng)速、溫度、大氣壓等)、有毒物質(zhì)(有毒空氣污染物、揮發(fā)性有機(jī)污染物、氮氧化合物等)。

        2016年數(shù)據(jù)如表2所示。

        表2 2016年美國(guó)空氣污染物數(shù)據(jù)實(shí)例

        2 方法

        利用美國(guó)呼吸系統(tǒng)疾病數(shù)據(jù)、慢性病數(shù)據(jù)和環(huán)境記錄科學(xué)數(shù)據(jù)等資源,采用空氣污染與疾病科學(xué)數(shù)據(jù)關(guān)聯(lián)分析與應(yīng)用。首先對(duì)開(kāi)放獲取得到的美國(guó)疾病和環(huán)境數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理,其次把兩個(gè)領(lǐng)域的數(shù)據(jù)資源整合到一起,再對(duì)整合后數(shù)據(jù)資源進(jìn)行關(guān)聯(lián)分析,以及結(jié)果的應(yīng)用場(chǎng)景分析。整個(gè)過(guò)程主要包括數(shù)據(jù)資源預(yù)處理、數(shù)據(jù)資源整合、數(shù)據(jù)關(guān)聯(lián)分析和應(yīng)用。

        2.1 數(shù)據(jù)資源預(yù)處理

        由于分別通過(guò)美國(guó)疾病控制與預(yù)防中心網(wǎng)站、美國(guó)國(guó)家環(huán)境保護(hù)署網(wǎng)站開(kāi)放獲取得到疾病數(shù)據(jù)和環(huán)境數(shù)據(jù)資源,存在數(shù)據(jù)存儲(chǔ)格式多樣、空缺值、數(shù)據(jù)單位不一致等問(wèn)題,會(huì)給數(shù)據(jù)資源整合及關(guān)聯(lián)分析等帶來(lái)一些不便。因此首先對(duì)不同存儲(chǔ)格式的數(shù)據(jù)文件進(jìn)行格式轉(zhuǎn)化,統(tǒng)一存儲(chǔ)格式。然后針對(duì)環(huán)境數(shù)據(jù)中的空缺值采用均值法,進(jìn)行空缺值彌補(bǔ);同時(shí)針對(duì)疾病數(shù)據(jù)資源中確實(shí)缺失的空缺值,進(jìn)行去除空缺值處理。環(huán)境數(shù)據(jù)中針對(duì)同一環(huán)境指標(biāo)單位不統(tǒng)一的問(wèn)題,進(jìn)行不同單位之間換算,轉(zhuǎn)換成統(tǒng)一單位。

        2.2 數(shù)據(jù)資源整合

        疾病數(shù)據(jù)資源和環(huán)境數(shù)據(jù)資源是來(lái)自兩個(gè)領(lǐng)域的資源,需要對(duì)其進(jìn)行跨領(lǐng)域數(shù)據(jù)資源整合。首先按照區(qū)域把某一地區(qū)的疾病數(shù)據(jù)和該地區(qū)的環(huán)境數(shù)據(jù)對(duì)應(yīng)整合起來(lái),再按時(shí)間(年、月、日)把該地區(qū)對(duì)應(yīng)時(shí)間內(nèi)疾病情況進(jìn)行整合,最終形成時(shí)間、地區(qū)、疾病情況、空氣污染物、細(xì)顆粒物、氣象條件、有毒物質(zhì)等維度的整合數(shù)據(jù)資源集。

        2.3 數(shù)據(jù)關(guān)聯(lián)分析與應(yīng)用

        對(duì)整合后的數(shù)據(jù)資源進(jìn)行關(guān)聯(lián)分析,首先采用C4.5分類算法從空氣污染物、細(xì)顆粒物、氣象條件、有毒物質(zhì)等多種危險(xiǎn)因素中尋找對(duì)疾病發(fā)生影響較大的因素[3-4],進(jìn)而利用關(guān)聯(lián)分析方法構(gòu)建這些危險(xiǎn)因素分別與疾病發(fā)生之間的關(guān)聯(lián)關(guān)系,再把這些關(guān)聯(lián)關(guān)系進(jìn)行可視化形式展示,最后結(jié)合關(guān)聯(lián)結(jié)果進(jìn)行分析,同時(shí)研究成果在中國(guó)工程科技知識(shí)中心醫(yī)藥衛(wèi)生知識(shí)服務(wù)系統(tǒng)中得以應(yīng)用。

        本文利用關(guān)聯(lián)分析發(fā)現(xiàn)隱藏在整合后的環(huán)境與疾病數(shù)據(jù)集中眾多危險(xiǎn)因素與疾病發(fā)生之間的聯(lián)系。關(guān)聯(lián)關(guān)系的挖掘主要包括兩步:一是找出所有的頻繁項(xiàng)集,這些項(xiàng)集的每一個(gè)頻繁出現(xiàn)的次數(shù)至少與最小支持計(jì)數(shù)一樣;二是由頻繁項(xiàng)集產(chǎn)生強(qiáng)關(guān)聯(lián)規(guī)則,這些規(guī)則必須滿足最小支持度和最小置信度[5]。

        Apriori算法是一種常用的頻繁項(xiàng)集挖掘算法。本文采用Apriori算法,使用逐層搜索的迭代方法,其中k項(xiàng)集用于探索(k+1)項(xiàng)集[5]。首先,通過(guò)遍歷掃描數(shù)據(jù)庫(kù),累計(jì)每個(gè)項(xiàng)的計(jì)數(shù),并收集滿足最小支持度的項(xiàng),找出頻繁1項(xiàng)集的集合。該集合記為L(zhǎng)1。然后,使用L1找出頻繁2項(xiàng)集的集合L2,使用L2找出L3,如此下去,直到不能再找到頻繁k項(xiàng)集。找到每個(gè)Lk需要一次數(shù)據(jù)庫(kù)的完整掃描。由找出的頻繁項(xiàng)集產(chǎn)生強(qiáng)關(guān)聯(lián)規(guī)則,強(qiáng)關(guān)聯(lián)規(guī)則滿足最小支持度和最小置信度,置信度計(jì)算公式如式(1)。

        (1)

        用項(xiàng)集的支持度計(jì)數(shù)表示置信度,其中suppport_count(A∪B)是包含項(xiàng)集A∪B的數(shù)目,suppport_count(A)是包含項(xiàng)集A的數(shù)目。由于關(guān)聯(lián)規(guī)則是由頻繁項(xiàng)集產(chǎn)生的,所以每個(gè)規(guī)則都自動(dòng)地滿足最小支持度,本文使用Weka 3.5.8軟件,設(shè)置最小支持度閾值為60%,最小置信度閾值為70%,生成的頻繁項(xiàng)集(如{PM2.5}、{PM2.5,PM10}、{PM10,NO2,SO2}等)和它們的支持度可預(yù)先存放在散列表中,便于它們被快速訪問(wèn),具體關(guān)聯(lián)關(guān)系展示見(jiàn)下文。

        3 關(guān)聯(lián)分析結(jié)果

        本文針對(duì)一般污染物氣體、細(xì)顆粒物、氣象因素、有毒物質(zhì)等環(huán)境因素與肺癌、哮喘等疾病開(kāi)展關(guān)聯(lián)分析,同時(shí)把分析結(jié)果應(yīng)用到項(xiàng)目實(shí)踐中。

        3.1 1999-2013年美國(guó)各州肺癌發(fā)病率與環(huán)境關(guān)聯(lián)關(guān)系

        通過(guò)分別對(duì)1999-2013年美國(guó)各個(gè)州肺癌發(fā)病率與空氣污染物、細(xì)顆粒物、氣象指標(biāo)、有毒物質(zhì)等進(jìn)行關(guān)聯(lián)分析,得到如下結(jié)果。

        關(guān)聯(lián)規(guī)則前件{PM2.5,PM10}、{PM2.5,SO2}、{PM2.5,SO2,NO2}、{PM10,Ozone, CO},可以推導(dǎo)出后件{肺癌},置信度分別為93%、81%、84%、79%,可以看出一般污染物氣體(Ozone、SO2、CO、NO2)和細(xì)顆粒物(PM2.5、PM10)對(duì)肺癌發(fā)病率影響較大,且隨著空氣污染物濃度和細(xì)顆粒物濃度變大,肺癌發(fā)病率也隨之增加,尤其是細(xì)顆粒物濃度對(duì)肺癌發(fā)病率的影響更加明顯,如圖1所示。

        從總體趨勢(shì)上看2013年美國(guó)各個(gè)州的PM2.5濃度從低到高遞增,肺癌發(fā)病率隨之升高(但不排除個(gè)別州的PM2.5濃度高而肺癌發(fā)病率偏低的情況出現(xiàn))。與一般污染物氣體和細(xì)顆粒物相比,風(fēng)速、溫度、大氣壓等氣象指標(biāo)對(duì)各州肺癌發(fā)病率的影響不太明顯。

        圖1 2013年美國(guó)各州肺癌發(fā)病率與PM2.5濃度關(guān)聯(lián)關(guān)系

        3.2 1995-2010年美國(guó)加利福尼亞州哮喘患病率與環(huán)境關(guān)聯(lián)關(guān)系

        對(duì)1995-2010年美國(guó)加利福尼亞州哮喘病患病率與空氣污染物、細(xì)顆粒物、氣象指標(biāo)、有毒物質(zhì)等進(jìn)行關(guān)聯(lián)分析,可以看出以下3點(diǎn)。

        1995-2010年加州哮喘病患病率總體呈現(xiàn)緩慢上升趨勢(shì),而在這16年間,臭氧濃度基本穩(wěn)定,二氧化硫、一氧化碳、二氧化氮濃度呈現(xiàn)下降趨勢(shì)明顯,尤其是2000年以后二氧化硫、一氧化碳、二氧化氮等一般污染物氣體濃度下降顯著,所以1995-2010年加州哮喘病患病率增加與一般污染物氣體關(guān)聯(lián)不太大。

        1995-2010年間細(xì)顆粒物對(duì)加州哮喘病患病率增加有影響,尤其是PM2.5對(duì)患病影響明顯。如圖2所示,1995-2010年加州PM2.5濃度呈上升趨勢(shì),尤其1997-1999年P(guān)M2.5濃度上升明顯,期間哮喘病患病率也在增加;2006-2008年P(guān)M2.5濃度逐年上升,哮喘病患病率也在增加;2000-2004年間哮喘患病率逐年增加,可能與1997-1999年P(guān)M2.5濃度快速上升引發(fā)患病的時(shí)滯性有關(guān)。

        1995-2010年氣象指標(biāo)(風(fēng)速、溫度、大氣壓等)和有毒物質(zhì)與加州哮喘病患病率關(guān)聯(lián)不太明顯。

        圖2 1995-2010年美國(guó)加州哮喘患病率與PM2.5關(guān)聯(lián)關(guān)系

        3.3 可視化展示

        本文基于美國(guó)疾病控制與預(yù)防中心和美國(guó)國(guó)家環(huán)境保護(hù)署的開(kāi)放科學(xué)數(shù)據(jù),開(kāi)展環(huán)境與疾病關(guān)聯(lián)分析,同時(shí)利用MyEclipse軟件實(shí)現(xiàn)分析結(jié)果的可視化展示,并把涉及的一般空氣污染物氣體、細(xì)顆粒物、氣象因素、有毒物質(zhì)與疾病之間的關(guān)聯(lián)分析結(jié)果已應(yīng)用到中國(guó)工程科技知識(shí)中心醫(yī)藥衛(wèi)生知識(shí)服務(wù)系統(tǒng)中環(huán)境健康板塊,其中2013年美國(guó)各州肺癌發(fā)病率分布、2013年美國(guó)各州NO2濃度排序分別如圖3、圖4所示。

        圖3 2013年美國(guó)各州肺癌發(fā)病率分布

        圖4 2013年美國(guó)各州NO2濃度排序

        4 討論與結(jié)論

        本文基于美國(guó)開(kāi)放科學(xué)數(shù)據(jù),整合處理空氣污染物、細(xì)顆粒物、氣象因素、有毒物質(zhì)等環(huán)境條件與肺癌、哮喘等疾病的跨領(lǐng)域數(shù)據(jù)資源,研究環(huán)境與疾病之間的關(guān)聯(lián)關(guān)系,并結(jié)合實(shí)際應(yīng)用場(chǎng)景可視化展示關(guān)聯(lián)分析結(jié)果,利于增進(jìn)公眾對(duì)環(huán)境條件變化易引發(fā)某些疾病的了解,有助于公眾提升疾病預(yù)防的意識(shí)。為我國(guó)環(huán)境健康領(lǐng)域研究有序開(kāi)展提供借鑒,為實(shí)現(xiàn)“健康中國(guó)2030”的提供重要保障。近年北美和歐洲在環(huán)境健康領(lǐng)域都已開(kāi)展了大量的研究[6-8]。美國(guó)國(guó)家疾控中心已成立專門(mén)機(jī)構(gòu)長(zhǎng)期開(kāi)展環(huán)境健康研究,對(duì)環(huán)境與高發(fā)疾病的影響進(jìn)行深入挖掘。歐洲空氣污染與健康項(xiàng)目(Air Pollution and Health:A European Approach)研究溫暖季節(jié)里,臭氧濃度增加與每天新增死亡人數(shù)的關(guān)系[9],以及與心血管疾病、呼吸系統(tǒng)疾病死亡人數(shù)增加之間的關(guān)系[10]。Brooke A.在美國(guó)亞特蘭大、達(dá)拉斯、圣路易斯等多個(gè)城市中,研究環(huán)境空氣污染引起急診門(mén)診哮喘病就診量的變化,發(fā)現(xiàn)年齡是哮喘發(fā)病的敏感因素,在學(xué)齡兒童中更加明顯[11]。近年來(lái)我國(guó)也逐漸關(guān)注地域、氣象、環(huán)境等與疾病的關(guān)聯(lián)影響[12-14]。殷永文等人研究上海市霧霾期間PM2.5、PM10污染與呼吸科、兒科呼吸科日均門(mén)診人數(shù)的相關(guān)性,發(fā)現(xiàn)PM10日均濃度每增加50μg/m3,呼吸科、兒科呼吸科日均門(mén)診人數(shù)分別增加3%和0.5%;PM2.5日均濃度每增加34μg/m3,呼吸科、兒科呼吸科日均門(mén)診人數(shù)分別增加3.2%和1.9%,而且PM2.5、PM10污染對(duì)門(mén)診人數(shù)影響的滯后累積效應(yīng)大于當(dāng)日效應(yīng)[15]。安愛(ài)萍等人對(duì)近年來(lái)我國(guó)大氣環(huán)境現(xiàn)狀對(duì)人體健康影響進(jìn)行了綜述,涉及大氣污染物對(duì)身體健康的急、慢性作用、氣象要素變化誘發(fā)心腦血管疾病、呼吸系統(tǒng)疾病與免疫系統(tǒng)功能的影響[16]。

        與之前研究不同,本文采用基于Apriori算法的關(guān)聯(lián)分析方法,不僅從眾多污染物中提取與疾病關(guān)聯(lián)關(guān)系明顯的污染物,且實(shí)現(xiàn)了結(jié)果的可視化展示,有利于加深公眾對(duì)環(huán)境健康問(wèn)題更直觀的理解。

        由于本文利用開(kāi)放數(shù)據(jù)開(kāi)展關(guān)聯(lián)分析,暫沒(méi)有獲取到患者的既往病史、家族史、是否吸煙等信息,是目前研究的不足。同時(shí)本文側(cè)重在已有數(shù)據(jù)基礎(chǔ)上,研究分析以往時(shí)間段內(nèi)環(huán)境對(duì)疾病的影響,但如果利用已有數(shù)據(jù)預(yù)測(cè)未來(lái)疾病發(fā)生的趨勢(shì),將利于醫(yī)院等衛(wèi)生醫(yī)療機(jī)構(gòu)有序應(yīng)對(duì)環(huán)境變化引起的病患增加,進(jìn)而合理安排布局醫(yī)療資源,因此如何預(yù)測(cè)未來(lái)疾病的發(fā)病趨勢(shì)是仍然需要不斷研究的方向。

        猜你喜歡
        項(xiàng)集顆粒物發(fā)病率
        多曬太陽(yáng)或可降低結(jié)直腸癌發(fā)病率
        中老年保健(2021年9期)2021-08-24 03:49:34
        ARIMA模型在肺癌發(fā)病率預(yù)測(cè)中的應(yīng)用
        南平市細(xì)顆粒物潛在來(lái)源分析
        宮內(nèi)節(jié)育器與宮頸糜爛發(fā)病率的臨床研究
        錯(cuò)流旋轉(zhuǎn)填料床脫除細(xì)顆粒物研究
        多層介質(zhì)阻擋放電處理柴油機(jī)尾氣顆粒物
        關(guān)聯(lián)規(guī)則中經(jīng)典的Apriori算法研究
        卷宗(2014年5期)2014-07-15 07:47:08
        七招降低新購(gòu)仔豬發(fā)病率
        一種頻繁核心項(xiàng)集的快速挖掘算法
        發(fā)達(dá)國(guó)家顆粒物污染防治經(jīng)驗(yàn)對(duì)我國(guó)的啟示
        日本一区二区啪啪视频| 人妻少妇乱子伦无码视频专区| 国产精品一区二区久久乐下载 | 国产成人亚洲综合无码品善网| 亚洲狠狠婷婷综合久久| 国产亚洲日本人在线观看| 日本女优久久精品观看| 人妻丰满熟av无码区hd| 成人无码一区二区三区网站| 亚洲国产剧情在线精品视| 久久老熟女一区二区三区| 精品卡一卡二卡3卡高清乱码 | 亚洲av无码专区在线| 久无码久无码av无码| 国产成人久久精品亚洲小说| 深夜日韩在线观看视频| 国产精品久久久爽爽爽麻豆色哟哟 | 男女性杂交内射妇女bbwxz| 无码人妻精品一区二区三18禁| 少妇特殊按摩高潮惨叫无码| 精品人妻久久一日二个| 无码aⅴ免费中文字幕久久| 日韩久久一级毛片| 亚洲国产成人精品久久成人| 一个人看的视频在线观看| 在线亚洲欧美日韩精品专区| 国产成人精品三上悠亚久久 | 日本高清视频在线观看一区二区 | 国产私人尤物无码不卡| 欧美性猛交xxxx乱大交丰满| 亚洲AV专区一专区二专区三| 亚洲精品在线免费视频| 免费无码一区二区三区蜜桃| 国产综合自拍| 久久精品国产亚洲av沈先生| 国产成人综合日韩精品无码 | 天天躁日日躁狠狠躁欧美老妇| 亚洲无码一二专区| 午夜黄色一区二区不卡| 成午夜福利人试看120秒| 人妻少妇看a偷人无码精品|