史英杰
(北京服裝學院 商學院 北京 100029)
隨著信息產(chǎn)業(yè)的不斷發(fā)展,可穿戴終端設備不僅具備了更強的計算能力,而且其收集的數(shù)據(jù)通過網(wǎng)絡將智能家居、人、物聯(lián)網(wǎng)等連接在一起,成為目前最具市場挖掘潛力的互聯(lián)網(wǎng)智能設備之一。2019年7月,國務院發(fā)布了《國務院關于實施健康中國行動的意見》[1],指出要引導群眾建立正確健康觀,加強早期干預,形成有利于健康的生活方式,我們將迎來全民健康的時代??纱┐髟O備通過傳感器監(jiān)測收集人們的數(shù)字化生活記錄,例如心電圖、腦電圖、肌電圖、血壓和運動慣性等不同細節(jié)的數(shù)據(jù),利用大數(shù)據(jù)技術對其進行分析,可以對人們展開中期甚至長期的健康監(jiān)測及預警,例如睡眠質量、心臟健康狀態(tài)監(jiān)測、慢性病預警等??纱┐饔嬎阍谌襻t(yī)療健康領域具有重要的作用和極大的市場價值。此外,智能佩飾、智能服裝等可穿戴設備不僅是市場潛力巨大的時尚消費電子產(chǎn)品,也是互聯(lián)網(wǎng)及云計算的新型終端?;谶@類可穿戴設備收集的海量數(shù)據(jù),可以采用大數(shù)據(jù)技術進行用戶行為分析、廣告追蹤優(yōu)化、產(chǎn)品分析、推薦決策等,從而在電子商務、智慧生活及社交網(wǎng)絡等方面創(chuàng)造極大的社會價值。此外,在個人應用、智慧交通、智慧安防以及社交網(wǎng)絡分析等方面,可穿戴計算的大數(shù)據(jù)分析都可大顯身手??偟膩碚f,可穿戴設備是用戶數(shù)據(jù)收集以及互動的基礎,而將云計算與大數(shù)據(jù)技術融入到可穿戴計算中,將成為未來IT行業(yè)發(fā)展的重要趨勢之一。
上世紀60年代,美國麻省理工學院媒體實驗室首次提出了可穿戴技術,利用該技術可以把多媒體、傳感器和通信等技術嵌入到人們的衣著中,從而支持手勢和眼動操作等多種不同的交互方式[2]。伴隨著互聯(lián)網(wǎng)技術及移動技術的飛速發(fā)展,手機、平板電腦等智能終端開始占據(jù)人們的生活。此時與智能終端相關聯(lián)的可穿戴設備開始進入市場,2012年,谷歌公司發(fā)布Google Glass,從而將可穿戴設備推向了一個新的高潮。根據(jù)IDC2020年發(fā)布的全球可穿戴設備報告,2019年全年可穿戴設備出貨量達到3.365億部,相比2018年的1.78億部增長了89%,目前,可穿戴計算的終端設備正朝著更微型化、個性化和人性化的方向發(fā)展,不僅具備更強的數(shù)據(jù)采集能力及計算能力,而且可以實時進行通信并接入互聯(lián)網(wǎng),從而為進一步的分析計算提供海量的基礎數(shù)據(jù)。
與其他數(shù)據(jù)相比,可穿戴計算中的數(shù)據(jù)具有鮮明的特征。在可穿戴計算環(huán)境中,數(shù)據(jù)源包括傳感器數(shù)據(jù)源和非傳感器數(shù)據(jù)源。非傳感器數(shù)據(jù)源包括用戶輸入的個人信息、通過APP上傳的文本及圖像日志等,這類數(shù)據(jù)和傳統(tǒng)互聯(lián)網(wǎng)大數(shù)據(jù)的特點基本一致。傳感器數(shù)據(jù)源包括心率和血氧等用戶生命體征數(shù)據(jù)、用戶位置與軌跡數(shù)據(jù)、溫濕度和氣壓等環(huán)境數(shù)據(jù),這類由傳感設備主動產(chǎn)生的數(shù)據(jù)規(guī)模龐大,而且具有強烈的時間和空間相關性,對該類數(shù)據(jù)的管理和分析則與互聯(lián)網(wǎng)大數(shù)據(jù)管理有很大不同。首先,可穿戴計算領域的數(shù)據(jù)往往涉及海量空間數(shù)據(jù)管理、海量時間序列數(shù)據(jù)管理,因此查詢類型也更加復雜;其次,由于可穿戴計算領域的數(shù)據(jù)在時間以及空間上都具有較大的相關性,數(shù)據(jù)分布極為不均,嚴重影響了樣本數(shù)據(jù)的平均分布和隨機性,這為查詢優(yōu)化帶來了較大的難度;此外,在云計算平臺上,可穿戴數(shù)據(jù)規(guī)模龐大而且分布存儲,但是數(shù)據(jù)的劃分技術卻不如分布式數(shù)據(jù)庫中的劃分技術成熟,很難利用數(shù)據(jù)劃分帶來的查詢優(yōu)勢。傳統(tǒng)的大數(shù)據(jù)管理及分析技術無法直接應用于可穿戴計算領域,這就需要研究者們深入挖掘可穿戴計算數(shù)據(jù)處理與分析的特質,分析已有工作在該領域的不足,探索數(shù)據(jù)分布和負載特征相關因素并建立相關理論方法體系,從而支持該領域數(shù)據(jù)的頻繁更新及快速的查詢分析。
心血管疾病是危害人類健康的主要疾病之一[3],研究發(fā)現(xiàn)適量的運動可以有效減少心血管疾病的死亡率[4]。隨著人們越來越關心身體健康,越來越多的運動檢測設備和應用開始出現(xiàn),常用的衡量運動量的指數(shù)包括運動步數(shù)、距離和時間等。然而這類衡量指標無法反映用戶身體在運動中的狀態(tài),因此無法給出運動指導建議或進行疾病風險預警。檢測心率可以對人體在運動中的身體狀態(tài)進行有效監(jiān)控,HUNT組織在2017年提出了人體運動智能指數(shù)PAI。PAI指數(shù)通過性別、年齡以及持續(xù)的心率值進行計算,而相關研究證明PAI指數(shù)可有效反映各年齡段人群罹患心血管疾病的風險。盡管PAI指數(shù)具有較高的實用價值,然而由于其計算公式比較復雜,而且連續(xù)的心率值數(shù)據(jù)量較大,其計算過程需要較長時間,這就使其疾病預警功能的時效性大打折扣。對于這類可穿戴計算的大數(shù)據(jù)分析應用來說,與其耗費大量時間等待精確的結果,短時間內(nèi)可獲得的“足夠接近”真實結果的分析反而更有價值。大數(shù)據(jù)的在線聚集技術根據(jù)樣本數(shù)據(jù)估計查詢結果,并返回真實結果所在的置信區(qū)間[5],其最大優(yōu)勢是可在較短時間內(nèi)計算出接近實際的查詢結果。將在線聚集技術應用在PAI指數(shù)的計算上,可以在較短時間內(nèi)獲得具有一定準確性保證的“估計結果”。
越來越多的便攜式可穿戴設備逐漸走進人們的生活,并通過泛在的傳感設備收集了海量的用戶數(shù)據(jù),利用大數(shù)據(jù)技術對這些海量數(shù)據(jù)進行管理和分析勢在必行。不同于互聯(lián)網(wǎng)產(chǎn)生的大數(shù)據(jù),可穿戴計算領域的大數(shù)據(jù)有其自身的特點。本文分析了可穿戴領域大數(shù)據(jù)分析的特點,并結合PAI指數(shù)分析案例闡述了該領域未來的研究方向。