王亦瑤 , 韋 怡 , 關軍龍 , 陳欣宇
(江西科技學院,江西 南昌 330200)
根據(jù)過去大量監(jiān)測數(shù)據(jù)報告可知,伴隨全球氣候的巨大變化,多種極端天氣出現(xiàn)的頻率及強度越來越高。聯(lián)合國政府間氣候變化專門委員會(Intergovernmental Panel on Climate Change,IPCC)曾指出,未來氣候變化的模擬結果提示人們極端天氣的出現(xiàn)會加劇傳染疾病的頻發(fā)[1],而伴隨著病例數(shù)的上升,有理由認為天氣、降水等環(huán)境氣候因素會影響新型冠狀病毒的傳播趨勢[2]。并且,世界各地區(qū)在冬季寒潮效應期間[3],因居住環(huán)境溫度低導致病毒的傳播概率增加,加上有的地區(qū)因醫(yī)療落后等各種原因導致傳染病的傳播和擴散。而作為現(xiàn)階段殺傷力最強的傳染性疾病——新型冠狀病毒肺炎,它的防控和治療是目前全球公共衛(wèi)生領域關注的焦點。但遺憾的是,由于分析方法和所得數(shù)據(jù)的限制,迄今為止仍沒有強有力的流行病學數(shù)據(jù),來證明氣候環(huán)境對新型冠狀病毒肺炎的發(fā)病和傳播有相關影響[4]。因此,本研究重點對新型冠狀病毒與氣候特征的關系及其在環(huán)境傳人下的防護措施展開探索,并基于深度學習、圖像處理和神經(jīng)網(wǎng)絡等技術[5],構建VGG模型對氣候變化導致的新冠肺炎發(fā)病和傳播風險進行分析預測,同時根據(jù)風險預測結果,結合實際情況,提出關于在環(huán)境傳人背景下新型冠狀肺炎防控的有關建議。
深度學習是目前機器學習領域的研究熱點,其中深度卷積神經(jīng)網(wǎng)絡是近年來發(fā)展最為迅速的計算機視覺技術,被廣泛應用于醫(yī)學圖像分析中[6-13]。而基于深度學習的VGG模型是Oxford的Visual Geometry Group組織提出的,該網(wǎng)絡的相關工作是在ILSVRC 2014上進行的。其主要內容是證明增加網(wǎng)絡的深度,能夠在一定程度上影響網(wǎng)絡最終的性能。如圖1所示,VGG16是由卷積層、池化層、全連接層等組成。本研究主要通過建立深度學習VGG模型,從生產的影像數(shù)據(jù)中自動分割出目標參數(shù),并提取其可能存在的影響新型冠狀病毒傳播的氣候特征。
圖1 VGG輸入輸出網(wǎng)絡結構
流行病學與計算機科學兩門學科的結合,體現(xiàn)出大數(shù)據(jù)與人工智能時代的到來以及無行業(yè)不AI的思想。同時通過結合今年新興起的深度學習方面的相關知識,建立模型對大量天氣數(shù)據(jù)進行訓練,從而得出一定的規(guī)律與預測概率,其中主要運用到的是卷積層中卷積的概念。
卷積的定義:我們稱(f*g)(n)為f、g的卷積。其具體公式如下。
其連續(xù)的定義為:
其離散的定義為:
VGG16模型中使用了卷積神經(jīng)網(wǎng)絡的方向傳播算法,如圖2所示。反向傳播算法公式:
圖2 卷積神經(jīng)網(wǎng)絡的方向傳播算法
其中,n_inn_in為上一隱藏層的輸入子矩陣個數(shù)。注意到zl和zl?1zl?1的關系為:
因此,可以得出:
反向傳播通過損失函數(shù)計算輸出層的δl,然后L通過三種不同的情況進行反向傳播算法計算,如果當前是全連接層則有:
如果當前是卷積層則有:
如果當前是池化層則有:
這里的pool指按照池化區(qū)域大小k和池化標準將輸入張量縮小的過程。如果所有W,bW,b的變化值都小于停止迭代閾值??,則跳出迭代循環(huán)輸出各隱藏層與輸出層的線性關系系數(shù)矩陣WW和偏移向量b。VGG模型的反向傳播在一定程度上提高了模型的準確率。
基于鐘南山院士所提出的環(huán)境傳人的新觀點,本文旨在研究天氣氣候特征的變化與環(huán)境傳人的關系。而研究氣象環(huán)境因素對新型冠狀病毒的影響至少要獲得三類數(shù)據(jù),即氣象數(shù)據(jù)、疾病數(shù)據(jù)及人口統(tǒng)計學數(shù)據(jù)。因相關數(shù)據(jù)來源不同導致可靠性的不統(tǒng)一,所以本文采用來自中國疾病預防控制中心、公共衛(wèi)生科學數(shù)據(jù)中心、法定報告?zhèn)魅静”O(jiān)測系統(tǒng)的疾病數(shù)據(jù)。它們均是由中國疾病預防控制中心于2004年開始成立并運行的,至今為止報告的準確性已經(jīng)接近100%。此外,氣象數(shù)據(jù)來源于中國氣象數(shù)據(jù)共享服務系統(tǒng),可獲得全國752個站點的氣象信息。人口數(shù)據(jù)來自中國公共衛(wèi)生科學數(shù)據(jù)中心。所以可以認為本研究所用的疾病數(shù)據(jù)、氣象數(shù)據(jù)、人口數(shù)據(jù)的來源均具有科學性和可信性。
本研究以江西省贛州市為例,其數(shù)據(jù)分析的時間為2019年12月至2020年12月,時間尺度為月數(shù)據(jù)。其中,從當?shù)氐男l(wèi)生行政部門獲取疾病數(shù)據(jù);從中國氣象數(shù)據(jù)網(wǎng)獲取該市的當前時間段氣象數(shù)據(jù)及未來時間段的氣象預估數(shù)據(jù);從中國疾病預防控制中心、公共衛(wèi)生科學數(shù)據(jù)中心獲取當前時間段的人口資料并基于WHO公布的中國未來的人口增長率,同時結合當前時間段的人口數(shù)來預估研究區(qū)域的暴露人口數(shù),這些數(shù)據(jù)的來源很大程度上是可信的。
通過對全國天氣分布情況圖的分析,進而獲取贛州市1年的氣溫變化、氣候分布及風向分布情況,高溫對新型冠狀病毒的傳播和活性存在明顯的抑制作用。同時對所得到的數(shù)據(jù)進行相關性分析,得知新型冠狀病毒的病例數(shù)與平均氣溫、平均相對濕度、平均氣候分布和平均風速成負相關。本研究以贛州市為例把其2020年的病例數(shù)(Y)作為因變量,將平均氣溫(X1)、平均相對濕度(X2)、平均氣候分布(X3)、平均降水量(X4)和平均風速(X5)作為自變量,選擇多元逐步回歸法進行處理來進一步得出各氣候對病毒的影響,如表1所示。結果表明:X2、X4和X5選入方程。方程為:
表1 新冠病毒病例與氣象特征的相關性表
1)贛州市的1月至4月為年氣溫最低時期,新冠病毒在該階段得到了極有利的傳播條件,普通的天氣溫度或是空調暖氣制熱無法達到高溫消除病毒的效果,且在這一階段該市平均相對濕度(X2)較高,故而當Y>10時,表明在這一階段各防疫部門應時刻保持緊急狀態(tài)并嚴格控制人流聚集,同時呼吁各家各戶保持家居環(huán)境的干燥以減少新冠病毒的傳播。而對于外地人員必須建立體溫檢測、發(fā)熱咳嗽等異常情況報告、應急處置等防控制度。市區(qū)體溫日常檢測應落實到每家每戶,有發(fā)熱癥狀者立即報告,同時送到定點醫(yī)療機構就診,并加強對公共場所定期清潔消毒。
2)在5月至9月,即贛州市氣溫開始回升時期,此時新冠病毒的傳播相對受到抑制,故而在該階段,當Y≤0時,該市進行一些正常的防護措施即可,無須過度緊張新冠病毒的傳播。對每家每戶進行日常防疫宣講,保證居住的住所每天開窗通風。同時可以通過煮沸的方法進行一些物品的消毒,保證室內溫度及濕度相對穩(wěn)定,從而降低感染新型冠狀病毒的概率。另外市民在外出時,盡量戴好口罩。
3)在贛州市空氣溫度及空氣濕度開始下降時,即在10月至12月期間,該市各部門應時刻關注并及時監(jiān)測本市的平均氣溫、平均相對濕度、平均降水量、平均風速等影響新冠病毒病例數(shù)的因素的變化,積極應對在氣溫開始下降時新冠病毒的傳播。當Y>0時,加強對市民外出的管控程度,嚴禁在雨天或低氣溫的天氣出行,從源頭降低人們感染新型冠狀病毒的概率。同時通過化學手段(如紫外線、含氯消毒劑等)對醫(yī)護所在地進行物理消毒,保證醫(yī)院等感染新冠病毒高風險地點的環(huán)境整潔及干燥。
2020年世界各國因新冠病毒大肆傳播導致的確診以及死亡人數(shù)居高不下,與此同時各國的經(jīng)濟狀況也受到了不同程度的打擊。因此,針對氣候變化與疾病的關系,尤其是傳染病方面的研究逐漸成為全球范圍內的研究熱點,而在鐘南山院士及其團隊提出新冠病毒出現(xiàn)環(huán)境傳播這一新課題后,該研究熱點已然成為目前全球共同關注的焦點。本文以贛州市一年的平均氣溫(X1)、平均相對濕度(X2)、平均氣候分布(X3)、平均降水量(X4)和平均風速(X5)作為自變量,選擇多元逐步回歸法進行處理,最后,針對預測結果提出相關防疫建議。