梁家政
?
基于智能手表的健康數(shù)據(jù)挖掘與分析
梁家政
湖北工業(yè)大學(xué),湖北 武漢 433000
隨著老齡化人口數(shù)量與慢性疾病發(fā)病率的快速增長,越來越多的人群需要得到實(shí)時(shí)監(jiān)護(hù),傳統(tǒng)的醫(yī)療技術(shù)已經(jīng)無法滿足人們的需求。對智能手表里健康監(jiān)控護(hù)系統(tǒng)的用戶數(shù)據(jù)進(jìn)行了簡單挖掘、分析和統(tǒng)計(jì),提出的相應(yīng)的設(shè)計(jì)理念和分析方法,得出相應(yīng)結(jié)論,給可穿著戴設(shè)備的發(fā)展提供了借鑒。基于此,創(chuàng)新點(diǎn)如下:(1)將統(tǒng)計(jì)思想用于Android應(yīng)用程序的開發(fā),同時(shí)利用數(shù)據(jù)分析和統(tǒng)計(jì)方法對用戶的行為進(jìn)行了統(tǒng)計(jì)和分析。
智能穿戴設(shè)備;大數(shù)據(jù);挖掘;分析
在基于智能手表的健康監(jiān)護(hù)系統(tǒng)中,我們可以通過統(tǒng)計(jì)用戶查看手表的次數(shù)、時(shí)間的次數(shù),測量體溫、體重的次數(shù)以及對應(yīng)的時(shí)間,喜歡使用的軟件、習(xí)慣等對用戶的行為數(shù)據(jù)進(jìn)行過濾、采樣、分析,從而找到之間潛在的規(guī)律和商機(jī)。根據(jù)系統(tǒng)的結(jié)構(gòu),可構(gòu)建數(shù)據(jù)挖掘環(huán)境如圖1所示。
圖1 數(shù)據(jù)挖掘基本環(huán)境
目前,數(shù)據(jù)挖掘技術(shù)多用于后端開發(fā),將算法嵌入數(shù)據(jù)庫或是云平臺的理念,這種理念會(huì)導(dǎo)致前端采集到的數(shù)據(jù)源顯得雜亂無章,導(dǎo)致數(shù)據(jù)庫或云平臺缺乏對采集的數(shù)據(jù)進(jìn)行有效地分析和利用,降低健康監(jiān)護(hù)系統(tǒng)使用的體驗(yàn)感,從而使用品失去對用戶吸引力,導(dǎo)致產(chǎn)品難以推廣。而根據(jù)本人研究實(shí)驗(yàn)說明,若將數(shù)據(jù)挖掘、統(tǒng)計(jì)與分析同樣同時(shí)用于Android App的開發(fā),前端與后臺統(tǒng)一數(shù)據(jù)源的采集設(shè)計(jì),更能最大限度的利用和分析數(shù)據(jù)源,并產(chǎn)生良好的分析結(jié)果,對用戶的吸引力將無限增大。
2.1 關(guān)聯(lián)規(guī)則
關(guān)聯(lián)規(guī)則是描述數(shù)據(jù)庫中數(shù)據(jù)項(xiàng)之間存在的潛在關(guān)系的規(guī)則,形式為“A1^A2^…Am=>B1^B2…Bn”,At(i=1,2,…,m),Bj(j=1,2,...,n)是數(shù)據(jù)庫總的數(shù)據(jù)。A與B之間的關(guān)聯(lián)規(guī)則是一個(gè)事務(wù)中出現(xiàn),可導(dǎo)致B]出現(xiàn)在該事務(wù)中,其中關(guān)聯(lián)符號為=>,即由A導(dǎo)致B結(jié)果。關(guān)聯(lián)規(guī)則流程的如圖3所示,圖中L-S為L中減去子集S的項(xiàng)集。
(2)置信度(C):C=P(B|A)=P(AB)/P(A)C=P(BA)=P(AB)/P(A),A事件中同時(shí)發(fā)生B事件的概率,即在規(guī)則中出現(xiàn)的強(qiáng)度[1]。
例如在基于智能手表的健康監(jiān)護(hù)系統(tǒng)中,身高=>體重,如果兩者的S=51%,表明51%的客戶同時(shí)測量身高和體重,通過測量身高和體重來評估自己是否達(dá)到標(biāo)準(zhǔn)體重;另一方面C=28%,則表明測量身高的用戶會(huì)測量體重的可能性為28%[2]。
(3)強(qiáng)規(guī)則:同時(shí)滿足最小S和C閾值。
(4)頻繁k項(xiàng)集:如果事件A包含k個(gè)元素,則稱該事件A為k項(xiàng)集事件A滿足最小支持度閾值。
圖2 產(chǎn)生關(guān)聯(lián)規(guī)則流程
2.2 Apriori算法
Apriori算法主要使用迭代法思想進(jìn)行逐層搜索,利用“k-1項(xiàng)集”來搜索“k項(xiàng)集”,直到頻繁項(xiàng)集的置信度大于最小置信度4°,算法流程如圖3所示。
2.3 數(shù)據(jù)分析結(jié)果
對測量次數(shù)與用戶的關(guān)系進(jìn)行簡單分析后,再分析用戶行為與時(shí)間段的關(guān)系,方法是利用Apriori算法對用戶行為時(shí)間分片處理。具體思路如下,首先將時(shí)間進(jìn)行不均勻分片,對其大致分為上午、中午、下午、晚上、凌晨或更細(xì)的時(shí)間段,然后在這些時(shí)間段內(nèi)分別對用戶行為的進(jìn)行統(tǒng)計(jì),最后將結(jié)果整合。同時(shí),結(jié)合用戶對界面控件的點(diǎn)擊次數(shù)、界面駐留時(shí)間與時(shí)間點(diǎn),可對系統(tǒng)進(jìn)行較完整的分析,非??陀^的反映出用戶對該軟件的使用頻度。
而對于用戶體重測量與時(shí)間的關(guān)系,時(shí)間初步分為以下時(shí)間段[6:00~11:00,11:00~13:00,13:00~16:00,16:00~20:00,20:00~22:00,22:00~1:00,1:00~6:00],分別對每一區(qū)域的用戶行為進(jìn)行統(tǒng)計(jì)分析,然后對時(shí)間段進(jìn)一步提取找出頻繁項(xiàng)集,如此反復(fù)操作,直到找出最大頻繁項(xiàng)集。這種思想類似于一種基于時(shí)間序列的RFID供應(yīng)鏈數(shù)據(jù)分析方法[3]。
基于智能手表的健康監(jiān)護(hù)系統(tǒng),是隨人們對移動(dòng)健康應(yīng)用的需求迅速增加而提出的。本文對系統(tǒng)的數(shù)據(jù)進(jìn)行分析,結(jié)合數(shù)據(jù)挖掘思想,本文提出了將Apriori算法用于Android App的開發(fā),同時(shí),簡單構(gòu)思了Apriori算法在基于智能手表的健康監(jiān)護(hù)系統(tǒng)中的實(shí)現(xiàn)步驟和原理,得出相應(yīng)的統(tǒng)計(jì)結(jié)果。并為可穿戴設(shè)備的設(shè)計(jì)規(guī)劃、理念和數(shù)據(jù)采集、分析方法,提供了借鑒。
圖3 Apriori算法流程
[1]郝先臣,張德干,尹國成,趙海.用于電子商務(wù)中的數(shù)據(jù)挖掘技術(shù)研究[J].小型微型計(jì)算機(jī)系統(tǒng),2001(7):785-788.
[2]吳紹函.關(guān)聯(lián)規(guī)則挖掘算法的研究[D].鄭州:解放軍信息工程大學(xué),2008.
[3]屈正庚,唐曉琴.基于電子商務(wù)中的數(shù)據(jù)挖掘技術(shù)研究[J].電子設(shè)計(jì)工程,2009(3):37-39.
Based on the Smart Watch Health Data Mining and Analysis
Liang Jiazheng
Hubei university of technology, Hubei Wuhan 433000
With the aging of population and the rapid growth of the incidence of chronic diseases, more and more people need to be real-time monitoring, the traditional medical technology has been unable to meet the needs of people.Health monitoring protection system in this article how to smart watch simple user data mining, analysis and statistics, puts forward the corresponding design concept and analysis method, the corresponding conclusion, provides the reference to the development of equipment can be worn in.This paper innovation points are as follows:(1)use statistical thinking for Android application development, at the same time, using the method of data analysis and statistics of user behavior to carry on the statistics and analysis.
intelligent wear equipment; Big data; Mining; Analysis
F426.6
A
1009-6434(2016)10-0135-02