李帆 唐杰
[摘要] “大數(shù)據(jù)”時代,數(shù)據(jù)成為決策最為重要的參考之一。要想挖掘出大數(shù)據(jù)中的有用信息,除了數(shù)據(jù)的量“大”之外,好的分析方法也是必不可少的。該研究首先通過對國內(nèi)外大數(shù)據(jù)分析與決策支持的研究成果進(jìn)行了文獻(xiàn)整理和歸納,然后提出采用時空思維對大數(shù)據(jù)進(jìn)行分析,也是發(fā)現(xiàn)大數(shù)據(jù)價值、提供優(yōu)化資源配比等決策依據(jù)的一種方法。最后表達(dá)出國內(nèi)醫(yī)療大數(shù)據(jù)進(jìn)行時空分析研究的現(xiàn)實(shí)意義。
[關(guān)鍵詞] 大數(shù)據(jù);決策;時空思維;心電檢查
[中圖分類號] R19 [文獻(xiàn)標(biāo)識碼] A [文章編號] 1672-5654(2018)12(a)-0197-02
[Abstract] Data have become one of the most important references for decision-making in the era of big data. To acquire useful information from the big data, good analysis methods are essential in addition to the scale of the data. Firstly, this paper gives a literature review and summary on the research findings of big data analysis and decision-making support at home and abroad. It then proposes to analyze big data with temporal-spatial thinking, which is also a reference for decision-making such as discovering the value of big data and providing optimal ratio of resources. Finally, it expresses the practical significance of the research on the time and space analysis of domestic medical big data.
[Key words] Big data; Decision-making; Temporal-spatial thinking; ECG examination7-02
在著作《大數(shù)據(jù)時代》中,作者深刻指出大數(shù)據(jù)是不用隨機(jī)分析法(即我們以往采用的抽樣調(diào)查),而是采用所有數(shù)據(jù)的一種新方法[1]。大數(shù)據(jù)具備4V的特點(diǎn):Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值)[2],其核心意義就是大數(shù)據(jù)驅(qū)動型的決策,作為一種新型戰(zhàn)略資源,其潛在價值和增長速度正在改變著人類的工作,生活和方式[3]。
1 大數(shù)據(jù)在國外決策支持的研究現(xiàn)狀
在20世紀(jì)90年代初,美國就提出了大數(shù)據(jù)的理念,典型案例如谷歌通過搜索引擎里面的關(guān)鍵詞檢索海量日志的時間序列數(shù)據(jù)和空間序列數(shù)據(jù)成功預(yù)測到流感爆發(fā)的時間和范圍規(guī)模,其決策結(jié)果與官方數(shù)據(jù)的相關(guān)性達(dá)到97%[1,4]。Farecast 公司開發(fā)出的一個機(jī)票價格判斷系統(tǒng),其票價判斷準(zhǔn)確度超過了75%[1]。再比如說美國有一家創(chuàng)新企業(yè)Decide.com,它可以幫助人們做購買決策,這家公司背后的驅(qū)動力就是大數(shù)據(jù)[5]。不僅大數(shù)據(jù)影響到企業(yè)的決策競爭力,大數(shù)據(jù)還能讓臨床決策支持變得更為智能,如IBMWatson,目前在哈佛大學(xué)醫(yī)學(xué)院中,已有醫(yī)生通過系統(tǒng)篩查全美乳腺癌患者病歷,并挑出和具體患者相同或相似的年齡、生活環(huán)境、突變基因等,最終挑選出一個生存期、生活質(zhì)量最高的治療方案提供給患者[6];還有在美國某個大州的公民體檢報(bào)告心電圖中,部分人會出現(xiàn)一個特殊波動,但美國一科研機(jī)構(gòu)利用大數(shù)據(jù)分析技術(shù)分析了所有心臟病猝死病人的體檢數(shù)據(jù),發(fā)現(xiàn)90%都出現(xiàn)過這樣的波動,這個現(xiàn)象大大推動了對心臟病發(fā)病的判斷率[7]。同時在美國,麻省理工學(xué)院、密歇根大學(xué)和一家婦女醫(yī)院已經(jīng)能對可利用心臟病患者的心電圖數(shù)據(jù)進(jìn)行分析,并創(chuàng)建了一個計(jì)算機(jī)模型,該模型通過對累積的數(shù)據(jù)進(jìn)行分析,以圖發(fā)現(xiàn)高風(fēng)險指標(biāo),進(jìn)而來判斷在未來一年內(nèi)患者心臟病發(fā)作的幾率大小[8]。越來越多的實(shí)例表明,當(dāng)前國外的大數(shù)據(jù)時代,更好的讓人們找到了一條新的科學(xué)決策之路。
2 大數(shù)據(jù)在國內(nèi)決策支持的研究現(xiàn)狀
目前國內(nèi)大數(shù)據(jù)的研究應(yīng)用還主要是以企業(yè)管理決策為主,如主要大型銀行引入大數(shù)據(jù)分析,用以信用風(fēng)險,市場營銷等方面[9]。再如電子商務(wù)企業(yè)阿里巴巴提出的要做中國數(shù)據(jù)分析第一平臺,通過掌握的企業(yè)交易數(shù)據(jù),借助大數(shù)據(jù)技術(shù)自動分析判定是否給予企業(yè)貸款[10]。還有我國的百度為國家打造智慧旅游 [11]??偟膩碚f,針對大數(shù)據(jù)的特征挖掘其價值并做出“質(zhì)”的變化,逐漸成為在互聯(lián)網(wǎng)時代,國家、企業(yè)核心競爭力[12]。
3 時空思維方法
時空思維主要包括時間思維和空間思維兩方面,時間思維是對客觀事物的時間存在及特征的反映,對客觀事物的認(rèn)識具有很強(qiáng)的預(yù)見性??臻g思維是指受空間因素限制的數(shù)據(jù)分布方式,利用空間理論進(jìn)行總結(jié)并做決策的一種思維方式[13]。時空思維已在各行各業(yè)得到廣泛的研究與應(yīng)用,研究結(jié)果漸漸成為管理者做決策前重要的科學(xué)理論依據(jù)[14-16]。
4 意義
我國大數(shù)據(jù)分析雖然在醫(yī)療領(lǐng)域的研究起步較晚。但國內(nèi)已有研究機(jī)構(gòu)試圖是建立中國人基因版的《本草綱目》[17]。雖然國內(nèi)醫(yī)療行業(yè)早已步入了大數(shù)據(jù)時代,但對如何優(yōu)化醫(yī)療業(yè)務(wù)過程,科學(xué)配置人員及合理設(shè)置科室等相關(guān)的大數(shù)據(jù)研究領(lǐng)域基本屬于空白。對于此,時空思維是一種有效數(shù)據(jù)分析方法。希望未來讓它們發(fā)揮更大的價值,助醫(yī)療服務(wù)一臂之力。
參考文獻(xiàn)
[1] Schonberger MV,Cukier K.盛楊燕,周濤,譯.大數(shù)據(jù)時代[M].浙江:浙江人民出版社,2013:9.
[2] Barwick H. The "four Vs" of Big Data. Implementing InformationInfrastructure Symposium [EB/OL].[2012,10,2]. http://www.computerword.com.au/article/396198/iiis four vs big data.
[3] Manyika,James.Big data:The next forntier for innovation,competion and productivity[R].technical report,McKinsey Global Institute,2011.
[4] Ginsberg J,Mohebbi MH,Patel RS,et al.Detecting influenza epidemics using search engine query data[J]. Nature,2009, 457 (7232).
[5] Schonberger MV.大數(shù)據(jù)行業(yè)的應(yīng)用之道[J].2013.
[6] Lloyd Minor.http://www.whb.cn/zhuzhan/zhangyi1/20150713/33591.html.
[7] 劉偉光.很多人能看到大數(shù)據(jù)未來,但還沒找到路[R].21世紀(jì)經(jīng)濟(jì)報(bào)道,2014.
[8] 懷進(jìn)鵬.信息技術(shù)與信息安全·十二屆全國人大常委會專題講座第十六講[R].
[9] 王月卉.淺談大數(shù)據(jù)在商業(yè)銀行經(jīng)營管理方面的應(yīng)用.統(tǒng)計(jì)與管理,2015(8).
[10] 陳憲宇.大數(shù)據(jù)的商業(yè)價值[J].企業(yè)管理,2013(3).
[11] 百度大數(shù)據(jù)助力智慧旅游[EB/OL].. http://www.dotour.cn/ article/19278.html.
[12] Mcafee,Ebrynjolfsson.Big data:the management revolution[J].Havard Business Review,2012,10.
[13] 劉大有.時空數(shù)據(jù)挖掘研究進(jìn)展[J].計(jì)算機(jī)研究與發(fā)展,2013,50(2).
[14] 陳晨春,唐咸艷.2008-2013年南寧市梅毒小尺度的時空聚集性研究[J].中國皮膚性病學(xué)雜志,2015,29(7).
[15] 徐京京,黃建武,李丹,等.安徽省耕地壓力指數(shù)時空分布特征及趨勢預(yù)測[J].華中師范大學(xué)學(xué)報(bào):自然科學(xué)版,2015,49(4).
[16] 吳孟泉,郭浩,張安定,等.2008-2012年山東半島海域滸苔時空分布特征研究[J].光譜學(xué)與光譜分析,2015(5).
[17] Ling Y,Jin Z,Su M,et al.VCGDB:a dynamic genome database of the Chinese population[J].BMC Genomics,2014.
(收稿日期:2018-09-05)