管會(huì)生
(蘭州大學(xué) 信息科學(xué)與工程學(xué)院,甘肅 蘭州 730000)
因?yàn)橐咔榈木壒?,今年的?guó)際護(hù)士節(jié)顯得十分特別,中國(guó)在此次的抗疫中也展示了中國(guó)廣大醫(yī)護(hù)人員救死扶傷的勇氣與擔(dān)當(dāng)。截至2019 年底,中國(guó)護(hù)士總數(shù)達(dá)到445 萬(wàn)人;在4.26 萬(wàn)名援鄂醫(yī)療隊(duì)員中,護(hù)士就有2.86 萬(wàn)人,占援鄂人員總數(shù)的70%。
弗洛倫斯·南丁格爾(Florence Nightingale,1820.5.12—1910.8.13,享 年90 歲),1853 年 任倫敦慈善醫(yī)院的護(hù)士長(zhǎng),是護(hù)理專業(yè)的創(chuàng)始人和現(xiàn)代護(hù)理教育的奠基人。南丁格爾創(chuàng)辦的護(hù)士訓(xùn)練學(xué)校開辦了30 年,共培養(yǎng)了1 005 名學(xué)生,她們活躍在歐美各國(guó),弘揚(yáng)著南丁格爾精神,國(guó)際上稱這個(gè)時(shí)期為“南丁格爾時(shí)代”(period of Nightingale)。1901 年,81 歲的南丁格爾因操勞過度,雙目失明,但仍繼續(xù)宣傳自己有關(guān)護(hù)理的思想和主張。1907 年,國(guó)際紅十字會(huì)設(shè)立南丁格爾獎(jiǎng)(Nightingale Ward)。1912 年,國(guó)際護(hù)士會(huì)將南丁格爾的生日5 月12 日定為國(guó)際護(hù)士節(jié),并首次頒發(fā)南丁格爾獎(jiǎng)。截止2019 年,南丁格爾獎(jiǎng)已頒發(fā)47 屆(兩年一屆),世界各國(guó)共有超過1 400 名卓越護(hù)理人員獲獎(jiǎng)。中國(guó)自1983 年首次參加第29 屆南丁格爾獎(jiǎng)評(píng)選以來(lái),共參加了19 屆評(píng)選,82 人獎(jiǎng)獲;福建醫(yī)科大學(xué)護(hù)理學(xué)院院長(zhǎng)李紅(2017 年當(dāng)選為美國(guó)護(hù)理科學(xué)院院士)就是中國(guó)的第82 位獲獎(jiǎng)?wù)摺?/p>
通過數(shù)據(jù)研究規(guī)律、發(fā)現(xiàn)規(guī)律,貫穿了人類社會(huì)發(fā)展的始終。人類科學(xué)發(fā)展史上的不少進(jìn)步都和數(shù)據(jù)的采集分析直接相關(guān),如現(xiàn)代醫(yī)學(xué)流行病學(xué)的開端。
數(shù)據(jù)可視化是指將大型數(shù)據(jù)集或大型數(shù)據(jù)庫(kù)中的數(shù)據(jù)以圖形圖像形式表示,并利用數(shù)據(jù)分析和開發(fā)工具發(fā)現(xiàn)(挖掘)其中未知信息的處理過程。最初,可視化技術(shù)被大量應(yīng)用于統(tǒng)計(jì)學(xué)領(lǐng)域,用來(lái)繪制統(tǒng)計(jì)圖表,如圓環(huán)圖、柱狀圖、餅圖、時(shí)間序列圖、等高線圖、散點(diǎn)圖等。20 世紀(jì)50 年代,隨著計(jì)算機(jī)的出現(xiàn)和計(jì)算機(jī)圖形學(xué)的發(fā)展,人們開始利用計(jì)算機(jī)技術(shù)在電腦屏幕上繪制各種圖形圖表,可視化技術(shù)開啟了全新的發(fā)展階段。進(jìn)入21 世紀(jì),數(shù)據(jù)可視化又被逐步應(yīng)用于地理信息系統(tǒng)(GIS)、數(shù)據(jù)挖掘與數(shù)據(jù)分析、商務(wù)智能工具等平臺(tái)中,有效促進(jìn)了人類對(duì)不同類型數(shù)據(jù)的分析與理解。隨著大數(shù)據(jù)時(shí)代的到來(lái),每時(shí)每刻都有海量數(shù)據(jù)在不斷生成,需要我們對(duì)數(shù)據(jù)進(jìn)行及時(shí)、全面、快速、準(zhǔn)確的分析,以呈現(xiàn)數(shù)據(jù)背后的價(jià)值,這就更需要可視化技術(shù)協(xié)助我們更好地理解和分析數(shù)據(jù)。數(shù)據(jù)可視化已成為大數(shù)據(jù)分析最后的一環(huán)和對(duì)用戶而言最重要的一環(huán)。
數(shù)據(jù)可視化用于疫情監(jiān)控,可追溯到1854年倫敦發(fā)生的大規(guī)?;魜y。這次霍亂長(zhǎng)時(shí)間得不到控制。后來(lái)John Snow 醫(yī)師用標(biāo)點(diǎn)地圖的方法,研究了當(dāng)?shù)厮植己突魜y患者分布之間的關(guān)系(如圖1 所示),發(fā)現(xiàn)在一口水井周圍,霍亂患病率明顯較高,借此找到了霍亂暴發(fā)的原因——被污染的水井。關(guān)閉這些水井后,霍亂發(fā)病率明顯開始下降,霍亂終于得以控制。此例成為現(xiàn)代醫(yī)學(xué)流行病學(xué)初創(chuàng)時(shí)期的首個(gè)案例,也是數(shù)據(jù)可視化這一研究方向的首個(gè)案例。
圖1 反映當(dāng)?shù)厮植己突魜y患者分布之間的關(guān)系圖
19 世紀(jì)計(jì)算機(jī)尚未出現(xiàn),因此沒有現(xiàn)在的數(shù)據(jù)可視化軟件。1857 年,為說服維多利亞女王改善英國(guó)軍隊(duì)醫(yī)院的醫(yī)療條件,南丁格爾特地設(shè)計(jì)了一張極坐標(biāo)下的圓形直方圖,也稱圓餅圖、玫瑰圖、“雞冠花圖”(Coxcomb diagram),用這張圖直觀傳達(dá)了1854 年4 月—1856 年3 月兩年間,每個(gè)月在克里米亞戰(zhàn)爭(zhēng)中死亡的士兵數(shù)量以及死亡原因,非常直觀簡(jiǎn)潔地說明了在她管理的野戰(zhàn)醫(yī)院內(nèi),死亡率在不同季節(jié)的變化以及3 類死亡原因的占比,直觀明了、一目了然,如圖2[1]所示,以此揭示克里米亞戰(zhàn)地醫(yī)院真實(shí)的醫(yī)療環(huán)境與衛(wèi)生條件[2]。
這種極坐標(biāo)下的圓形直方圖,是1801 年威廉普萊費(fèi)爾發(fā)明的,在200 多年前這是一種非常新穎的數(shù)據(jù)展示形式,但由于繪制較難而沒有流行起來(lái),直到1857 年南丁格爾繪制出這張“雞冠花圖”之后,才逐漸被人們熟知和接受。這張圖替代了原英國(guó)軍方準(zhǔn)備用幾萬(wàn)文字描述的統(tǒng)計(jì)分析報(bào)告,結(jié)論就是:由于醫(yī)療衛(wèi)生條件太差,戰(zhàn)地醫(yī)院死于可預(yù)防傳染病的人數(shù)遠(yuǎn)遠(yuǎn)高于戰(zhàn)爭(zhēng)期間戰(zhàn)場(chǎng)上的直接傷亡人數(shù)。這是“雞冠花圖”在數(shù)據(jù)可視化領(lǐng)域最經(jīng)典、最實(shí)際的應(yīng)用案例,也是護(hù)理學(xué)科與數(shù)字學(xué)科相結(jié)合在發(fā)展初期的首個(gè)案例[2]。
圖2 南丁格爾繪制的“雞冠花圖”
1854 年—1856 年,英國(guó)、法國(guó)、土耳其等國(guó)與沙皇俄國(guó)爆發(fā)了克里米亞戰(zhàn)爭(zhēng)。當(dāng)時(shí)由于沒有護(hù)士護(hù)理傷病員,且戰(zhàn)地救護(hù)條件十分惡劣,英軍負(fù)傷士兵的死亡率竟高達(dá)42%。1854 年10月21 日,南丁格爾主動(dòng)申請(qǐng)參加戰(zhàn)地救護(hù)工作,率領(lǐng)38 名優(yōu)秀護(hù)士奔赴克里米亞戰(zhàn)地醫(yī)院,并成為該院的護(hù)士長(zhǎng),由此開創(chuàng)了現(xiàn)代戰(zhàn)地護(hù)理事業(yè)。參戰(zhàn)士兵傷病員由于得到了及時(shí)認(rèn)真的醫(yī)療護(hù)理,在短短的半年時(shí)間內(nèi),傷病員的死亡率降至2.2%。南丁格爾在分析了大量傷亡資料檔案后,得出的驚人結(jié)論就是:“士兵死亡原因大多是因?yàn)楦腥炯膊∫约爸貍麊T得不到及時(shí)救護(hù)所致”[3]。這就是南丁格爾設(shè)計(jì)“雞冠花圖”的背景。
僅僅使用了一張圖,就充分展示并說明了所收集到的所有數(shù)據(jù)資料!一張圖的可視性、直觀性遠(yuǎn)遠(yuǎn)勝過了長(zhǎng)篇大論的文字報(bào)告。后來(lái)世人稱南丁格爾為“數(shù)據(jù)可視化的先驅(qū)”,她被譽(yù)為“在統(tǒng)計(jì)的圖形顯示方法上,是一個(gè)真正的先驅(qū)”。1859 年,南丁格爾被選為英國(guó)皇家統(tǒng)計(jì)學(xué)會(huì)的第一個(gè)女成員,后來(lái)她還成為美國(guó)統(tǒng)計(jì)協(xié)會(huì)的名譽(yù)會(huì)員[3]。
2020 年疫情突發(fā)以來(lái),央視新聞每天報(bào)道“多個(gè)省市區(qū)確診病例連續(xù)多日零新增”時(shí)(如圖3 所示),以及《人民日?qǐng)?bào)》新媒體每天報(bào)道“新冠肺炎全球疫情形勢(shì)”時(shí)(如圖4 所示),數(shù)據(jù)統(tǒng)計(jì)結(jié)果的展示均采用的是我們久違了的“雞冠花圖”。
圖3 央視新聞每天報(bào)道“多個(gè)省市區(qū)確診病例連續(xù)多日零新增”數(shù)據(jù)
圖4 《人民日?qǐng)?bào)》新媒體每天報(bào)道“新冠肺炎全球疫情形勢(shì)”數(shù)據(jù)
目前已有各類圖表軟件可以完成數(shù)據(jù)可視化的工作,效果很好。以2009—2019 年淘寶天貓雙十一11 年交易額對(duì)比表[1]為例,借助我們最熟悉的Excel 數(shù)字圖表功能,對(duì)同一組數(shù)據(jù)可繪制出瀑布圖、柱形圖和旭日?qǐng)D3 種不同類型的數(shù)據(jù)圖表,如圖5 所示。從圖中可看到,雖然圖表類型不同,但是它們所揭示的“交易額發(fā)展趨勢(shì)”卻是相同的,直觀清晰、一目了然。圖表的繪制工作也非常簡(jiǎn)單,從數(shù)據(jù)到圖表的展示,只需一鍵便可完成。有興趣的讀者可以試試Excel“插入”圖表的“推薦圖表”功能。
再以4 月27 日—5 月10 日兩周14 天來(lái)全球214 個(gè)國(guó)家與地區(qū)以及美國(guó)、中國(guó)疫情統(tǒng)計(jì)數(shù)據(jù)為例(見表1),采用Excel 中類型為“堆積面積圖”的數(shù)字圖表進(jìn)行數(shù)據(jù)可視化,數(shù)據(jù)分析的結(jié)果如圖6 所示。
圖5 2009—2019 年淘寶天貓雙十一交易額對(duì)比表及Excel 下的3 種數(shù)字圖表
表1 14 天全球214 個(gè)國(guó)家與地區(qū)以及美國(guó)、中國(guó)疫情數(shù)據(jù)統(tǒng)計(jì)對(duì)照表
圖6 4 月27 日—5 月10 日兩周內(nèi)全球214 個(gè)國(guó)家和地區(qū)與美國(guó)的疫情數(shù)據(jù)統(tǒng)計(jì)
從表1 可知,4 月27 日—5 月10 日兩周14天內(nèi),全球累計(jì)確診由300.28 萬(wàn)升至405.14 萬(wàn),新增105 萬(wàn)例;累計(jì)死亡新增73 575 例。美國(guó)累計(jì)確診由96.59 萬(wàn)升至130.97 萬(wàn),新增34.38 萬(wàn)例;累計(jì)死亡新增23 923 例。這14 天內(nèi),中國(guó)累計(jì)確診由84 341 例升至84 435 例,新增94 例;累計(jì)死亡新增“0”例。其實(shí),3 月10 日,武漢16 家方艙醫(yī)院就全部休艙了;3 月13 日,湖北新增疑似病例為“0”例;4 月26 日,武漢在院新冠肺炎患者清“0”。第一次感覺“關(guān)門大吉”這個(gè)詞是如此真切,第一次知道數(shù)字“0”是如此美好,歷此坎坷,記憶永存!
從圖6 中可以看出,全球214 個(gè)國(guó)家和地區(qū)的“新冠肺炎疫情形勢(shì)”與美國(guó)的疫情發(fā)展趨于一致。數(shù)據(jù)可以證明,美國(guó)作為超級(jí)大國(guó),由于防控不當(dāng),這次確實(shí)“引領(lǐng)”了世界疫情蔓延的趨勢(shì)!
關(guān)注國(guó)際疫情的讀者一定對(duì)“據(jù)美國(guó)霍普金斯大學(xué)最新統(tǒng)計(jì)數(shù)據(jù)顯示......”這句話不陌生,因?yàn)檫@個(gè)風(fēng)靡全球的疫情數(shù)據(jù)可視化平臺(tái)——霍普金斯大學(xué)新冠病毒病例數(shù)據(jù),日訪問量平均為10 億次,最高曾達(dá)20 億次,在時(shí)效性、直觀性等方面超越了美國(guó)疾控中心(CDC),已成為全球權(quán)威信源。
霍普金斯大學(xué)的全球疫情數(shù)據(jù)可視化平臺(tái)如圖7 所示,除了各類統(tǒng)計(jì)數(shù)據(jù)的實(shí)時(shí)播報(bào)之外,還有依據(jù)214 個(gè)國(guó)家/地區(qū)的行政區(qū)劃圖,按確診病例人數(shù)標(biāo)注地圖(Map)并二維平面顯示的功能。該平臺(tái)的成功,一方面在于其數(shù)據(jù)更新及時(shí),另一方面也因?yàn)槠鋬?yōu)秀的數(shù)據(jù)展示形式——交互式“儀表盤”(dashboard)。事實(shí)證明,這一數(shù)據(jù)可視化方式非常適合疫情監(jiān)控。不僅如此,目前該研究團(tuán)隊(duì)更重要的目標(biāo)是通過建立完善的數(shù)據(jù),進(jìn)而“模擬疫情動(dòng)態(tài)、科學(xué)指導(dǎo)防疫”,讓我們看到了大數(shù)據(jù)應(yīng)用于疫情防控的真正曙光!
圖7 霍普金斯大學(xué)全球疫情數(shù)據(jù)可視化平臺(tái)
圖8 所示為新冠病毒感染人數(shù)超過30 000 例的國(guó)家排名,數(shù)據(jù)來(lái)源仍為美國(guó)約翰斯霍普金斯大學(xué)。
圖8 新冠病毒感染人數(shù)超過30 000 例國(guó)家排名
全球最具影響力的霍普金斯大學(xué)全球疫情數(shù)據(jù)可視化平臺(tái)——實(shí)時(shí)追蹤C(jī)OVID-19 的交互式網(wǎng)絡(luò)儀表盤,實(shí)質(zhì)上是第三方數(shù)據(jù)整合的項(xiàng)目,最初由霍普金斯大學(xué)系統(tǒng)科學(xué)與工程中心兩名中國(guó)博士生董恩盛和杜鴻儒主導(dǎo)。從1 月22 日“儀表盤”項(xiàng)目上線開始,平臺(tái)經(jīng)過不斷升級(jí),兩個(gè)多月后成為今天的權(quán)威信源。“儀表盤”也可視為GIS 系統(tǒng)的典型應(yīng)用,其研發(fā)采用了ESRI 公司的ArcGIS 系列開發(fā)工具。ESRI 公司是業(yè)內(nèi)知名的地理信息系統(tǒng)(Geographical Information System,GIS)提供商。中國(guó)疾控中心就曾聯(lián)合ESRI 推出“新型冠狀病毒感染的肺炎疫情分布系統(tǒng)”,其功能與霍普金斯大學(xué)的“儀表盤”近似。眾所周知,GIS 可將地圖獨(dú)特的視覺效果和數(shù)據(jù)庫(kù)操作、地理分析功能集成在一起,已經(jīng)在城市規(guī)劃設(shè)計(jì)、地理水文、交通測(cè)繪、移動(dòng)通訊、公共衛(wèi)生等很多行業(yè)得到了成功應(yīng)用,特別是結(jié)合病例統(tǒng)計(jì)數(shù)、時(shí)間和地理信息形成的疫情地圖,是GIS 系統(tǒng)非常生動(dòng)的應(yīng)用。
靜態(tài)的Excel 圖表已使用近30 年了,社會(huì)現(xiàn)實(shí)中我們?cè)忈寯?shù)據(jù)的方式和數(shù)據(jù)本身之間存在著巨大的鴻溝。想像閱讀書本一樣閱讀數(shù)據(jù)流,目前還只是IT 人追求的夢(mèng)想,但使用數(shù)據(jù)可視化工具讀取識(shí)別和分析處理原始數(shù)據(jù),一定會(huì)成為未來(lái)信息技術(shù)和互聯(lián)網(wǎng)技術(shù)的發(fā)展趨勢(shì)和工具模式。數(shù)據(jù)可視化領(lǐng)域未來(lái)將會(huì)融入更多更大的信息平臺(tái),甚至完全建立在AI+VR+AR+Web3D(人工智能、虛擬現(xiàn)實(shí)、增強(qiáng)現(xiàn)實(shí)、3D 網(wǎng)頁(yè)和全息技術(shù))之上!
目前國(guó)內(nèi)外流行的大數(shù)據(jù)可視化工具和系統(tǒng)平臺(tái)很多,大多是既開源又專有的,并具有這些特征:能夠連接到其他軟件接收輸入數(shù)據(jù),能夠處理不同類型的傳入數(shù)據(jù),能夠在分析過程中與數(shù)據(jù)集進(jìn)行交互、應(yīng)用不同種類的過濾器調(diào)整結(jié)果,能夠?yàn)槠渌浖峁┹斎霐?shù)據(jù),如大數(shù)據(jù)可視化的一站式商店Jupyter、大數(shù)據(jù)和機(jī)器學(xué)習(xí)應(yīng)用可視化平臺(tái)Tableau AI 等。受篇幅所限,這里僅列舉普遍受到用戶認(rèn)可和歡迎的可視化工具軟件和系統(tǒng)平臺(tái)如下:
以上18 種可視化工具是大量在線或獨(dú)立的系統(tǒng)平臺(tái)和實(shí)用工具的一部分。使用這些工具可以幫助我們以更加優(yōu)雅的方式呈現(xiàn)數(shù)據(jù),將數(shù)據(jù)轉(zhuǎn)化為一系列清晰易懂的圖像圖表,甚至轉(zhuǎn)化為一段動(dòng)漫演繹。原始數(shù)據(jù)本身可能看不出具有什么價(jià)值,但借助可視化所做的決策,幫助這些數(shù)據(jù)實(shí)現(xiàn)了其本身蘊(yùn)含的驅(qū)動(dòng)價(jià)值!這,就是數(shù)據(jù)可視化的應(yīng)有之義。