安徽財經(jīng)大學管理科學與工程學院 候夢如
基于醫(yī)療數(shù)據(jù)挖掘的營養(yǎng)配餐系統(tǒng)的設計與實現(xiàn)
安徽財經(jīng)大學管理科學與工程學院 候夢如
近年來,營養(yǎng)配餐成為越來越多人的飲食理念。針對人們對通過營養(yǎng)配餐來保障健康的迫切需求,設計一個基于醫(yī)療大數(shù)據(jù)的營養(yǎng)配餐系統(tǒng)。當下信息技術的飛速發(fā)展,使得醫(yī)療數(shù)據(jù)成為人們健康飲食中的一項重要參數(shù),本系統(tǒng)以對醫(yī)療數(shù)據(jù)的數(shù)據(jù)挖掘結果為數(shù)據(jù)基礎,結合系統(tǒng)數(shù)據(jù)庫以及配餐算法,實現(xiàn)針對用戶個人的個性化營養(yǎng)配餐功能,對于幫助人們預防、遠離疾病,更健康的生活有一定的現(xiàn)實意義。
營養(yǎng)配餐;數(shù)據(jù)挖掘;個性化
隨著我國慢性病患者人數(shù)的快速增長,慢性病成為人們日益擔憂的問題。我國成人超重、肥胖、血脂異常、高血壓、糖尿病等慢性病已滲入到普通群眾的日常生活中[1],據(jù)稱現(xiàn)確診患者2.6億人,也就是說將近每五人當中就有一個是慢性病患者。慢性病給人們帶來不便和威脅,成為普遍存在的公共健康問題,而專家稱其根源是人體內營養(yǎng)元素的失衡。合理的膳食可以保證人體內各種營養(yǎng)元素的均衡,使得身體機能正常運行,從而達到預防和緩解慢性病的效果,所以營養(yǎng)配餐成為越來越多人的需求。
近年來關于營養(yǎng)配餐的研究有許多,比如:劉文杰和徐堅英開發(fā)的中醫(yī)食療與營養(yǎng)配餐系統(tǒng),此系統(tǒng)能夠根據(jù)用戶的病情、療效及食物的營養(yǎng)成分等信息提供相應疾病的日常食譜,可使用戶通過飲食進行治療;學者王向紅研究的模擬退火算法實現(xiàn)了針對合并癥患者的營養(yǎng)配餐等等[2]。而隨著信息技術的飛速發(fā)展,大數(shù)據(jù)已成為社會各領域的共同特征,利用先進的數(shù)據(jù)挖掘技術對醫(yī)療領域的大數(shù)據(jù)進行處理,分析出慢性病與人體內的營養(yǎng)元素之間的關系,為設計出更符合患者個人的營養(yǎng)配餐系統(tǒng)提供了新的思路。本文擬在以數(shù)據(jù)挖掘技術中的關聯(lián)規(guī)則算法對醫(yī)療數(shù)據(jù)挖掘得出的慢性病與營養(yǎng)元素的關系為數(shù)據(jù)基礎,設計出更個性化的營養(yǎng)配餐系統(tǒng)。
(1)根據(jù)最小支持度閾值找出所有的頻繁項集。
(2)通過對頻繁項集支持度和置信度閾值的過濾找到有價值的關聯(lián)規(guī)則[3]。
其中,找出頻繁項集是整個挖掘的重點。在關聯(lián)規(guī)則算法中比較經(jīng)典的是Apriori算法,Apriori算法已經(jīng)廣泛且有效的應用于醫(yī)療領域,比如同濟大學附屬醫(yī)院的馮波等人通過對大量糖尿病患者的脂肪組織含量、肌肉組織、骨密度等數(shù)據(jù)進行分析,利用數(shù)據(jù)挖掘技術得到了若能提高糖尿病患者體內肌肉和脂肪組織含量就可以降低髓骨骨折的可能性的結論[4]。
由于頻繁項集的獲取是整個挖掘的重點和難點,而Apriori算法中針對頻繁項集提出的逐層搜索方法簡單且方便,所以本營養(yǎng)配餐系統(tǒng)也采用Apriori算法對各種慢性病和營養(yǎng)元素之間的關系進行數(shù)據(jù)挖掘。逐層搜索方法包括以下兩個步驟[5]:
(1)自連接獲取候選集。第一輪的候選集就是確定的某一數(shù)據(jù)集中的項,而其他輪次的候選集則是由前一輪次頻繁集自連接得到(頻繁集由候選集剪枝得到)。
(2)對于候選集進行剪枝。對于候選集的每一條記錄,如果它的支持度小于最小支持度,那么就會被剪掉;
2.1 克氏原螯蝦品質變化 使用液體冷卻介質急速凍結和常規(guī)冷凍克氏原螯蝦并在色澤、體表、肌肉、氣味以及湯汁方面對其進行評定,結果如圖1所示。由圖1可見,使用液體冷卻介質急速凍結的克氏原螯蝦在-18 ℃冷凍貯藏30 d后,感官品質顯著高于常規(guī)冷凍克氏原螯蝦組(P<0.05)。
此外,如果一條記錄的子集有不是頻繁集的,也會被剪掉。該算法的終止條件是,如果自連接得到的已經(jīng)不再是頻繁集,那么取最后一次得到的頻繁集作為結果。
2.1 系統(tǒng)總體結構
本系統(tǒng)主要由3個模塊構成:數(shù)據(jù)庫模塊:存儲和管理所需的各種數(shù)據(jù);系統(tǒng)配餐模塊:為用戶配出個人營養(yǎng)套餐;人機交互模塊:用于各種信息的交互。系統(tǒng)的總體結構如圖1所示。
表3 食物分配表
表4 配餐結果表
圖1 系統(tǒng)結構圖
2.2 系統(tǒng)功能模塊
本系統(tǒng)設計的根本目標是為患者提供符合個人身體狀況的營養(yǎng)餐進而達到幫助患者恢復健康、改善身體狀況的目的。為更準確、更合理的為患者配餐,本系統(tǒng)實現(xiàn)獲取用戶信息、用戶反饋、數(shù)據(jù)庫運行、以多元線性回歸數(shù)學模型為思想的算法配餐等功能。
(1)獲取用戶信息:用戶輸入個人信息,包括年齡、身高、體重、性別、疾病、工作、所在地區(qū)等資料。
(2)用戶反饋:用戶提交用戶食用后調查表。
(3)數(shù)據(jù)庫運行:在系統(tǒng)程序執(zhí)行時提供高效、準確的各種數(shù)據(jù)支持,本系統(tǒng)中主要有慢性病與人體內營養(yǎng)元素含量的關系表、營養(yǎng)素數(shù)據(jù)表、食物數(shù)據(jù)表、菜譜信息表、食物分配表、用戶個人信息表、用戶用餐記錄表、用戶食用后調查表等。
(4)算法配餐:此算法以多元線性回歸數(shù)學模型為思想,能夠準確的為患者配餐。
2.3 系統(tǒng)算法的數(shù)學模型
回歸分析是一種研究變量之間關系的方法,能夠通過易知的、可控的變量來有效的估計出未知的人們想要的隨機變量的值,現(xiàn)已廣泛應用于社會各研究領域。多元線性回歸一般用來研究兩個及兩個以上的影響因素作為自變量與因變量之間的線性關系問題[6],是相對簡單的一種回歸形式,但它很多情況下都能非常好的滿足需求。
對營養(yǎng)配餐系統(tǒng)中各種變量進行分析時,發(fā)現(xiàn)患者每日食用多種食物、多種營養(yǎng)素,通過獲取食物中的營養(yǎng)素來達到理論上要求的每一種營養(yǎng)素的日需量,所以將每種食物實際攝入的重量視為自變量,把對每一種營養(yǎng)素的總需求量作為因變量時,則兩者之間存在密切的線性關系2。
我們以糖尿病患者為例,研究此線性關系。假設有m種食物,早餐食物為(F1,F2,F3,...Fi),午餐為(Fi+1,Fi+2,Fi+3,...Fi+j),晚餐為(Fi+j+1,Fi+j+2,Fi+j+3,...Fm);假設共n中營養(yǎng)素,根據(jù)用戶個人信息,在《慢性病與人體內營養(yǎng)元素含量的關系表》中查詢到該用戶作為糖尿病患者其體內個營養(yǎng)素的含量情況,并結合《營養(yǎng)素表》進行數(shù)據(jù)分析后得到該用戶每日每種營養(yǎng)素參考攝入量分別為C1,C2,C3,...Cn;配平的結果為m種食物分別需要攝入的重量X1,X2,X3,...Xm。顯然,可以得到以下多元線性回歸方程[7]:
式中apq表示每單位樣本中第p中食物關于第q種營養(yǎng)素的含量;
由于該用戶為糖尿病患者,遵循之前數(shù)據(jù)分析得出的相關結果,其三餐熱量分配按照1:2:2進行分配[8],可得到關系式:
上式可分解為:
則本系統(tǒng)的線性回歸模型可表示為:
針對此多元線性回歸方程組,本系統(tǒng)采用生物遺傳算法來進行求解。遺傳算法是一類借鑒生物界自然選擇和進化規(guī)律演化形成的隨機、自動搜索方法,由于其具有高效的全局尋優(yōu)能力,且運算過程只需要目標函數(shù)和適應度函數(shù),所以很適應于本系統(tǒng),可以幫助求得最優(yōu)的一組食物分配結果[9]。
2.4 系統(tǒng)測試結果分析
為檢驗本系統(tǒng)的可行性,對營養(yǎng)配餐系統(tǒng)進行如下測試:
用戶首次使用時輸入個人基本信息,系統(tǒng)獲取用戶信息后,調用系統(tǒng)配餐算法和數(shù)據(jù)庫為用戶配餐,首先得到推薦給用戶的全天所需食物種類及各自用量的食物分配表,如表3所示;然后系統(tǒng)根據(jù)此食物分配表在菜譜信息表中查詢相關的菜譜,得到多種配餐結果,表4為供用戶選擇的配餐結果中的一種。
表2 用戶信息
為驗證以上配餐結果的合理性,本系統(tǒng)針對菜譜進行各營養(yǎng)素的分析[10],并與標準量進行對比,結果如表5所示,從表中可得出各營養(yǎng)素的實際含量與標準量之間差別很小,所以能夠很好的滿足用戶的身體需求,從而本系統(tǒng)的配餐符合實際營養(yǎng)標準。
表5 結果分析表
基于醫(yī)療數(shù)據(jù)挖掘的營養(yǎng)配餐系統(tǒng)根據(jù)數(shù)據(jù)挖掘技術獲取的慢性病與營養(yǎng)元素之間的關系,結合患者的病情、體質、工作、飲食習慣等數(shù)據(jù)通過高效的配餐算法為患者提供針對其個人的營養(yǎng)配餐,能夠有效地幫助患者恢復健康。但是也有很多可以改進的地方,比如增加用戶自己的配餐設置、添加多人用餐時的配餐設置,提供一些專家的建議和健康飲食的小常識等等??傊?,本系統(tǒng)通過醫(yī)療數(shù)據(jù)挖掘的方式為營養(yǎng)配餐研究提供了一個新思路,對于指導人們更健康飲食、遠離疾病有很大幫助,也有一定的經(jīng)濟效益和社會效益。
[1]張云渡.數(shù)據(jù)挖掘技術在營養(yǎng)配餐系統(tǒng)中的應用研究[D].北京工業(yè)大學,2014.
[2]寇文心.智能營養(yǎng)配餐系統(tǒng)及其核心算法的研究[D].北京工業(yè)大學,2015.
[3]Savasere A,Omiecinski E R,Navathe S B.An efficient algorithm for mining association rules in large databases[J].1995.
[4]馮波,倪亞芳,孫勤,等.糖尿病患者肌肉和脂肪組織含量與其骨密度的關系[J].中華物理醫(yī)學與康復雜志,2002,24(7):414-416.
[5]何月順.關聯(lián)規(guī)則挖掘技術的研究及應用[J].南京航航天大學,博[學位論文],2010.
[6]Wang H,Shangguan L,Wu J,et al.Multiple linear regression modeling for compositional data[J].Neurocomputing,2013,122:490-500.
[7]魏鳳梅,胡文.基于模擬退火算法營養(yǎng)膳食優(yōu)選的研究[J].哈爾濱商業(yè)大學學報:自然科學版,2006,22(6):80-83.
[8]梅正欽.糖尿病醫(yī)學營養(yǎng)管理系統(tǒng)的功能設計與實現(xiàn)[D].廣州醫(yī)科大學,2014.
[9]崔珊珊.遺傳算法的一些改進及其應用[D].合肥:中國科技大學,2010.
[10]陸遙,魏皎,陳麗果.基于 Web 的個性化營養(yǎng)評估保障系統(tǒng)設計與實現(xiàn)[J].計算機技術與發(fā)展,2010,20(3):1-4.
候夢如,大學本科,現(xiàn)就讀于安徽財經(jīng)大學。