亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        空間數(shù)據(jù)挖掘驅(qū)動(dòng)城市疫情監(jiān)測(cè)常態(tài)化的作用研究

        2022-01-12 06:52:34郭名靜
        商業(yè)經(jīng)濟(jì) 2022年2期
        關(guān)鍵詞:數(shù)據(jù)挖掘疫情

        郭名靜,景 琳

        (1.東華理工大學(xué) 理學(xué)院; 2.江西應(yīng)用科技學(xué)院 國(guó)際商務(wù)分院, 江西 南昌 330013)

        發(fā)型傳染病在人類歷史上曾多次出現(xiàn),比如天花、鼠疫、霍亂、甲型 H7N9 流感、SARS(Severe Acute Respiratory Syndrome),以及新型冠狀病毒肺炎(Coronavirus Disease 2019,COVID-19)等,給國(guó)家和人民生命財(cái)產(chǎn)安全造成了重大損失。雖然國(guó)內(nèi)針對(duì)COVID-19已經(jīng)取得重要研究成果,形成了卓有成效的疫情防控方案,但隨著全球疫情風(fēng)險(xiǎn)級(jí)別的不斷上調(diào),城市疫情監(jiān)測(cè)在未來(lái)很長(zhǎng)一段時(shí)間將成為一種常態(tài)化工作。疫情監(jiān)測(cè)是預(yù)測(cè)預(yù)警疫情的爆發(fā)并監(jiān)測(cè)疫情的發(fā)展和結(jié)束,指在傳染病發(fā)生時(shí),在人、植物或動(dòng)物中進(jìn)行的針對(duì)傳染病疫情的監(jiān)測(cè),監(jiān)測(cè)疫情發(fā)展是獲取感染區(qū)域、規(guī)模、密度、時(shí)空分布和流動(dòng)情況,反饋疫情數(shù)據(jù)給防控部門(mén),協(xié)助部署和協(xié)調(diào)資源,幫助科研人員掌握疫情傳播模式和特點(diǎn),幫助公眾遠(yuǎn)離疫情嚴(yán)重場(chǎng)所,科學(xué)預(yù)防感染。由于疫情監(jiān)測(cè)工作既涉及患者和醫(yī)療資源的大量人流,又需要物流分布信息,還具有時(shí)間和專題屬性。因此,各種通過(guò)傳感器網(wǎng)絡(luò)、定位設(shè)備和社交網(wǎng)絡(luò)獲取的空間數(shù)據(jù)成為當(dāng)前研究疫情發(fā)展過(guò)程和輔助發(fā)現(xiàn)預(yù)測(cè)潛在疫情的重要戰(zhàn)略資源。

        一、空間數(shù)據(jù)挖掘的研究現(xiàn)狀

        空間數(shù)據(jù)是人們認(rèn)識(shí)現(xiàn)實(shí)世界的基礎(chǔ)戰(zhàn)略資源和智慧源泉。信息技術(shù)的發(fā)展使對(duì)空間數(shù)據(jù)的采集、存儲(chǔ)和處理等技術(shù)迅速發(fā)展,使得空間數(shù)據(jù)快速增長(zhǎng),遠(yuǎn)遠(yuǎn)超出了人們的理解能力。當(dāng)數(shù)據(jù)積累到一定程度,必然會(huì)反映出某些為人所感興趣的規(guī)律,而這些規(guī)律一般隱藏在數(shù)據(jù)深層。空間數(shù)據(jù)種類多樣,來(lái)源復(fù)雜,傳統(tǒng)的數(shù)據(jù)庫(kù)系統(tǒng)已經(jīng)無(wú)法發(fā)現(xiàn)隱藏在數(shù)據(jù)背后的隱性知識(shí),常規(guī)的數(shù)理統(tǒng)計(jì)模式停留在空間數(shù)據(jù)的處理階段,只完成了從數(shù)據(jù)到信息的過(guò)程,處理的數(shù)據(jù)量十分有限。現(xiàn)有的人工智能和機(jī)器學(xué)習(xí)等技術(shù)也都不能獨(dú)立的將數(shù)據(jù)最大限度利用,空間數(shù)據(jù)資源中蘊(yùn)含的最大價(jià)值也遠(yuǎn)沒(méi)有得到充分的挖掘和利用,迫切需要一種能夠?qū)⒋罅繑?shù)據(jù)轉(zhuǎn)換成有用知識(shí)的新技術(shù),以解決困擾空間數(shù)據(jù)利用面臨的瓶頸問(wèn)題。

        1989年召開(kāi)的第一屆國(guó)際聯(lián)合人工智能學(xué)術(shù)會(huì)議(IJCAI)催生了從數(shù)據(jù)庫(kù)中發(fā)現(xiàn)知識(shí) (knowledge discovery in database,KDD)的概念,通過(guò)知識(shí)發(fā)現(xiàn)可以從數(shù)據(jù)庫(kù)中獲取知識(shí)。因?yàn)榭臻g數(shù)據(jù)與空間位置密切相關(guān),所以KDD開(kāi)始影響空間數(shù)據(jù)的利用。1994年GIS國(guó)際學(xué)術(shù)會(huì)議上,李德仁院士首次提出從地理信息系統(tǒng)數(shù)據(jù)中發(fā)現(xiàn)知識(shí)的概念,并率先從GIS空間位置數(shù)據(jù)中發(fā)現(xiàn)了用于指導(dǎo)位置空間分析的知識(shí)。隨后,空間數(shù)據(jù)挖掘滲入數(shù)據(jù)挖掘、知識(shí)發(fā)現(xiàn)以及地球空間信息學(xué)等相關(guān)學(xué)科,越來(lái)越引起全球?qū)W者研究和應(yīng)用的極大興趣??臻g數(shù)據(jù)挖掘可以為基于位置的空間數(shù)據(jù)的應(yīng)用提供有價(jià)值的知識(shí),帶來(lái)巨大價(jià)值,成為提升國(guó)家綜合能力和保障國(guó)家安全的新利器,提升政府治理能力的新途徑??臻g數(shù)據(jù)挖掘是一種空間決策支持技術(shù),重在最大限度提升數(shù)據(jù)資源的有效利用能力,實(shí)現(xiàn)更為準(zhǔn)確的檢測(cè)、分析和預(yù)測(cè),特高決策的針對(duì)性、科學(xué)性和可靠性。在疫情防控工作中,空間數(shù)據(jù)挖掘已經(jīng)滲透入多個(gè)環(huán)節(jié),特別是在傳染病傳播的測(cè)量傳染病的時(shí)空分布和模擬驗(yàn)證傳染病傳播過(guò)程兩個(gè)階段是最適合空間數(shù)據(jù)挖掘的分析方法,例如,瘧疾分布特征的研究、H7N9疫情流行與環(huán)境因素的相關(guān)性研究、霍亂疫情爆發(fā)風(fēng)險(xiǎn)增加的地區(qū)以及SARS疫情監(jiān)控和位置空間信息分析研究等。

        目前,雖然空間數(shù)據(jù)挖掘取得了一定的研究和應(yīng)用成果,但海量快變和多源高維的特點(diǎn)又給空間數(shù)據(jù)挖掘應(yīng)用于疫情監(jiān)測(cè)帶來(lái)了新的挑戰(zhàn)。在此次COVID-19疫情防控期間,“健康碼”技術(shù)的應(yīng)用為政府采集了大量的居民行動(dòng)軌跡數(shù)據(jù),為常態(tài)化疫情防控工作的開(kāi)展提供了寶貴的空間數(shù)據(jù)。但是伴隨著“健康碼”的普及,采集的數(shù)據(jù)的數(shù)量、大小和復(fù)雜性都在飛速增長(zhǎng),極大超越了常規(guī)的事務(wù)型數(shù)據(jù)源,導(dǎo)致數(shù)據(jù)難理解、難整合,限制了對(duì)數(shù)據(jù)的全面分析和深度應(yīng)用的能力。鑒于空間對(duì)象種類的多樣性,“健康碼”采集的空間數(shù)據(jù)來(lái)源廣泛,每個(gè)空間對(duì)象基本由多個(gè)屬性描述,存在空間或非空間關(guān)系,增加了空間數(shù)據(jù)挖掘的維數(shù),帶來(lái)了高維數(shù)據(jù)挖掘的困難。這些難點(diǎn)可能直接影響空間數(shù)據(jù)挖掘的準(zhǔn)確性和可靠性,影響空間數(shù)據(jù)挖掘的正常發(fā)展。雖然這些問(wèn)題越來(lái)越被重視,并取得了一定的理論方法和實(shí)際應(yīng)用的成果,但是還不夠深入。如果正確解決這些難點(diǎn),就可能避免利用錯(cuò)誤信息而得到可靠性較低的、殘缺的,甚至錯(cuò)誤的知識(shí),就可能避免因?yàn)槔缅e(cuò)誤信息而導(dǎo)致的疫情防控決策失誤。

        二、空間數(shù)據(jù)的加權(quán)聚類提取研究

        李蘭娟院士曾多次公開(kāi)提出要重視大數(shù)據(jù)在疫情防控中的應(yīng)用。李德仁院士也呼吁建立一個(gè)基于位置大數(shù)據(jù)的疫情防控體系,結(jié)合多屬性特征約束挖掘空間位置數(shù)據(jù)中所蘊(yùn)含的空間模式。這種針對(duì)區(qū)域內(nèi)對(duì)象位置點(diǎn)群的聚集分布特征的發(fā)現(xiàn)屬于基于空間位置數(shù)據(jù)的城市空間分布模式研究,通過(guò)提取相似或相近密度的聚集點(diǎn),將其與邊界外點(diǎn)區(qū)別識(shí)別。一般有兩種識(shí)別方法:一類是根據(jù)區(qū)域的指標(biāo)聚集特性來(lái)標(biāo)識(shí)區(qū)域邊界,如均勻格網(wǎng)法;另一類是根據(jù)點(diǎn)群的密度值利用等值線形成邊界。經(jīng)典的基于密度聚類方法 (Density-based clustering algorithm,DBSCAN)可以利用數(shù)據(jù)點(diǎn)群的空間聚類直接提取聚集模式,在處理非規(guī)則凸型的位置數(shù)據(jù)點(diǎn)群時(shí)表現(xiàn)出了較好適用性。

        (一)傳統(tǒng)D BSCA N算法

        基于密度的DBSCAN算法可以發(fā)現(xiàn)稀疏數(shù)據(jù)點(diǎn)區(qū)域中的密集數(shù)據(jù)點(diǎn),該算法利用相似度函數(shù)判定數(shù)據(jù)點(diǎn)的歸屬類,再根據(jù)密度相連原理提取數(shù)據(jù)點(diǎn)的最大集合,也叫做聚類簇。算法中判定數(shù)據(jù)點(diǎn)歸屬的相似度函數(shù)是基于歐幾里得距離(公式1),其中,位置數(shù)據(jù)集中數(shù)據(jù)點(diǎn)的位置坐標(biāo)為(x,y),其中 i=1,…,n。

        以武漢市中心城區(qū)范圍內(nèi)地理坐標(biāo)為東經(jīng)114.15°~114.45°,北緯 30.45°~30.7°范圍內(nèi)共計(jì) 22843 條新浪微博簽到POI數(shù)據(jù)(表1)為例,每一條POI位置數(shù)據(jù)包含5個(gè)屬性,其中,經(jīng)度和緯度坐標(biāo)共同構(gòu)成了位置數(shù)據(jù)點(diǎn)的地理位置屬性特征,商戶公司名稱、類別和簽到次數(shù)均為位置數(shù)據(jù)點(diǎn)的非地理位置屬性特征。對(duì)餐飲和零售行業(yè)高熱點(diǎn)和熱點(diǎn)區(qū)塊進(jìn)行聚類提取,得到3個(gè)餐飲行業(yè)的熱點(diǎn)區(qū)塊,總共包含98個(gè)高熱簽到位置數(shù)據(jù)點(diǎn),簽到次數(shù)共計(jì)120361次(表2)。得到3個(gè)零售行業(yè)的熱點(diǎn)區(qū)塊,總共包含87個(gè)高熱簽到位置數(shù)據(jù)點(diǎn),簽到次數(shù)共計(jì)302915次(表 3)。

        表1 武漢市的新浪微博PO I數(shù)據(jù)集

        表2 餐飲業(yè)熱點(diǎn)區(qū)塊的位置數(shù)據(jù)點(diǎn)統(tǒng)計(jì)(基于密度聚類提取)

        表3 零售業(yè)熱點(diǎn)區(qū)塊的位置數(shù)據(jù)點(diǎn)統(tǒng)計(jì)(基于密度聚類提取)

        (二)加權(quán)D BSCA N算法

        DBSCAN算法提取的聚類簇只滿足地理位置的高聚集分布,而沒(méi)有考慮數(shù)據(jù)點(diǎn)的簽到次數(shù)屬性。因此,對(duì)簽到次數(shù)屬性值做變換得到一個(gè)按照公式(2)計(jì)算權(quán)重系數(shù)的 w,其中 j=1,…,n。

        可見(jiàn),w取值范圍是(0,+1),且 w取值越接近 +1 說(shuō)明數(shù)據(jù)點(diǎn)(x,y)的簽到次數(shù)越高,即該點(diǎn)簽到熱度越高,在與簇中心點(diǎn)(x,y)距離相等的條件下,則越可能被劃入簇中。因此,可得加權(quán)DBSCAN算法中相似度函數(shù)的距離計(jì)算公式(3)。其中,參數(shù)ω的取值根據(jù)權(quán)重系數(shù)w的取值范圍而定。

        仍然以表2數(shù)據(jù)集為例,動(dòng)態(tài)加權(quán)聚類算法在餐飲行業(yè)中提取了3個(gè)熱點(diǎn)區(qū)塊,總共包含100個(gè)高熱簽到位置數(shù)據(jù)點(diǎn),簽到次數(shù)共計(jì)140191次(表4)。提取了3個(gè)零售行業(yè)熱點(diǎn)區(qū)塊,總共包含94個(gè)高熱簽到位置數(shù)據(jù)點(diǎn),簽到次數(shù)共計(jì)330360次(表5)。

        表4 餐飲業(yè)熱點(diǎn)區(qū)塊的位置數(shù)據(jù)點(diǎn)統(tǒng)計(jì)(加權(quán)密度聚類提取)

        表5 零售業(yè)熱點(diǎn)區(qū)塊的位置數(shù)據(jù)點(diǎn)統(tǒng)計(jì)(加權(quán)密度聚類提取)

        (三)仿真效果對(duì)比分析

        通過(guò)對(duì)比仿真結(jié)果可以發(fā)現(xiàn),加權(quán)DBSCAN算法提取的高熱簽到點(diǎn)的數(shù)目要多于傳統(tǒng)DBSCAN算法,以簽到次數(shù)作為權(quán)重系數(shù)的加權(quán)DBSCAN算法提取的商戶網(wǎng)點(diǎn)的受歡迎熱度更高。傳統(tǒng)DBSCAN算法只是按照地理位置的距離遠(yuǎn)近判定網(wǎng)點(diǎn)是否歸屬聚類簇,無(wú)法識(shí)別出地處較為偏遠(yuǎn)的高熱簽到網(wǎng)點(diǎn),可能會(huì)導(dǎo)致某些明顯的高熱點(diǎn)因?yàn)榈乩砦恢靡囟粋鹘y(tǒng)算法忽視。而加權(quán)DBSCAN算法由于考慮了非位置屬性,可以避免高熱點(diǎn)的遺漏。例如,表5中零售行業(yè)的關(guān)鍵區(qū)塊3是沒(méi)有出現(xiàn)在傳統(tǒng)算法的提取結(jié)果表3中,但是區(qū)塊3的數(shù)據(jù)點(diǎn)平均簽到次數(shù)卻高達(dá)2688,與地處目標(biāo)城市中心的區(qū)塊1的平均簽到次數(shù)差不多。因此,加權(quán)DBSCAN算法可以提取更多的高熱度的商戶集群。

        三、加權(quán)的空間數(shù)據(jù)挖掘?qū)σ咔楸O(jiān)測(cè)的作用

        (一)熱點(diǎn)區(qū)塊探知對(duì)疫情監(jiān)測(cè)關(guān)鍵區(qū)域探知的支持

        根據(jù)武漢市衛(wèi)生健康委員會(huì)2020年5月28日發(fā)布的《武漢市新冠肺炎疫情動(dòng)態(tài)(2020年5月27日)》數(shù)據(jù),截止2020年5月27日24時(shí),全市累計(jì)報(bào)告確診病例50340例。其中武漢市中心城區(qū)內(nèi)的江岸區(qū)6563例、江漢區(qū)5242例、硚口區(qū)6854例、漢陽(yáng)區(qū)4691例、武昌區(qū)7551例、青山區(qū)2804例、洪山區(qū)4718例、東西湖區(qū)2478例。對(duì)比加權(quán)DBSCAN算法提取的熱點(diǎn)區(qū)塊空間位置分布情況,不管是在餐飲業(yè)還是零售業(yè),最密集的高熱區(qū)塊正好覆蓋了武漢市主城區(qū)內(nèi)確診病例數(shù)最多的四個(gè)行政區(qū),即江岸區(qū)、江漢區(qū)、硚口區(qū)和武昌區(qū)。因此,對(duì)空間數(shù)據(jù)挖掘來(lái)探知行業(yè)熱點(diǎn)區(qū)塊,能準(zhǔn)確發(fā)現(xiàn)疫情可能爆發(fā)或具有高傳播性的關(guān)鍵區(qū)域,支持相關(guān)部門(mén)疫情防控工作的開(kāi)展。

        (二)多屬性加權(quán)聚類分析對(duì)疫情監(jiān)測(cè)科學(xué)性的支持

        一旦感染區(qū)域分布與疫情實(shí)際傳播情況存在偏差,就有可能?chē)?yán)重影響疫情防控工作的順利開(kāi)展,甚至?xí)斐扇嗣裆?cái)產(chǎn)的重大損失。因此,要保障城市應(yīng)對(duì)重大疫情的疫情監(jiān)測(cè)工作常態(tài)化的順利開(kāi)展,全面考慮空間數(shù)據(jù)的多個(gè)維度才能最大程度準(zhǔn)確獲取疫情可能爆發(fā)的重點(diǎn)區(qū)域或感染區(qū)域的空間分布。加權(quán)DBSCAN算法提取的熱點(diǎn)區(qū)塊和高熱點(diǎn)是綜合了空間數(shù)據(jù)的地理位置坐標(biāo)屬性和簽到次數(shù),考慮了重要的非空間位置屬性可能對(duì)判定位置點(diǎn)的分類歸屬的影響,使提取的關(guān)鍵區(qū)塊的空間分布模式更科學(xué)合理,避免了對(duì)某些距離相對(duì)較為分散的關(guān)鍵高熱點(diǎn)的遺漏。

        (三)基于數(shù)據(jù)驅(qū)動(dòng)知識(shí)發(fā)現(xiàn)對(duì)疫情監(jiān)測(cè)大數(shù)據(jù)特性的支持

        疫情監(jiān)測(cè)工作需要獲取感染區(qū)域、規(guī)模、密度、時(shí)空分布和流動(dòng)情況,發(fā)現(xiàn)疫情可能爆發(fā)的區(qū)域位置。這種空間分布模式的探究需要對(duì)數(shù)據(jù)實(shí)時(shí)處理,而不是事后的問(wèn)卷調(diào)查和統(tǒng)計(jì)分析。疫情監(jiān)測(cè)的原始空間數(shù)據(jù)來(lái)源多樣、數(shù)據(jù)體積巨大、數(shù)據(jù)量增長(zhǎng)速度快速,具有典型的大數(shù)據(jù)特征。聚類分析屬于以數(shù)據(jù)驅(qū)動(dòng)知識(shí)發(fā)現(xiàn)的第四研究范式,相比較傳統(tǒng)的實(shí)證研究、統(tǒng)計(jì)分析以及問(wèn)卷調(diào)查等研究方法,直接聚類提取知識(shí)的研究方法更適合于具有大數(shù)據(jù)特征的空間數(shù)據(jù)挖掘分析。

        四、結(jié)論

        要保障城市疫情監(jiān)測(cè)的常態(tài)化,提高城市對(duì)公共衛(wèi)生突發(fā)事件的應(yīng)對(duì)能力,就必須探索對(duì)多維的、大體量的空間數(shù)據(jù)的高效處理方法,挖掘疫情傳播的空間分布模式,發(fā)現(xiàn)并預(yù)測(cè)疫情可能爆發(fā)的重點(diǎn)區(qū)域??臻g數(shù)據(jù)挖掘能夠科學(xué)探知城市疫情防控關(guān)鍵區(qū)塊或關(guān)鍵點(diǎn),能夠合理指導(dǎo)疫情防控重點(diǎn)區(qū)域的工作部署,還能夠應(yīng)對(duì)未來(lái)海量的疫情監(jiān)測(cè)大數(shù)據(jù)的處理和分析。通過(guò)對(duì)空間位置數(shù)據(jù)的直接加權(quán)聚類提取,可以發(fā)現(xiàn)空間數(shù)據(jù)的某些屬性與疫情爆發(fā)和傳播的空間分布模式的必然關(guān)系,為城市疫情監(jiān)測(cè)常態(tài)化工作實(shí)施提供重要科學(xué)依據(jù)。

        猜你喜歡
        數(shù)據(jù)挖掘疫情
        戰(zhàn)疫情
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
        抗疫情 顯擔(dān)當(dāng)
        疫情中的我
        疫情當(dāng)前 警察不退
        北極光(2020年1期)2020-07-24 09:04:04
        待疫情散去 春暖花開(kāi)
        文苑(2020年4期)2020-05-30 12:35:48
        37°女人(2020年5期)2020-05-11 05:58:52
        基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
        岳毛多又紧做起爽| 午夜无码无遮挡在线视频| 久久精品av一区二区免费| 亚洲伊人av天堂有码在线| 国内自拍愉拍免费观看| 欧美亚洲一区二区三区| 边做边流奶水的人妻| 初尝黑人嗷嗷叫中文字幕| 久久精品国产热| 蜜臀av一区二区三区精品| 丝袜美腿亚洲第一免费| 麻豆md0077饥渴少妇| 亚洲av午夜国产精品无码中文字| 又爽又黄又无遮挡的激情视频| 7878成人国产在线观看| 国产激情一区二区三区在线蜜臀| 人妻av中文字幕精品久久| 美女露出奶头扒开内裤的视频| 亚洲精品第一国产综合精品| 亚洲精品乱码久久久久久日本蜜臀| 日本午夜精品理论片A级APP发布| 人成视频在线观看免费播放| 一区二区三区国产天堂| 国内精品亚洲成av人片| 亚洲日韩精品一区二区三区无码 | 大香视频伊人精品75| 国产在亚洲线视频观看| 亚洲综合原千岁中文字幕| 国产av久久在线观看| 久久久久人妻精品一区三寸| 一本色道久久99一综合| 国产日本在线视频| 精品人妻夜夜爽一区二区| 国产18禁黄网站免费观看| 亚洲av永久无码精品网址| 欧美激情a∨在线视频播放| 高清国产日韩欧美| 韩国女主播一区二区三区在线观看 | 国产黄色一级到三级视频| 久久伊人精品中文字幕有尤物| 精品亚洲成a人片在线观看|