亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        藥膳大數(shù)據(jù)的平臺(tái)構(gòu)建與實(shí)現(xiàn)

        2021-04-01 05:43:48孫慧婷
        長春大學(xué)學(xué)報(bào) 2021年2期
        關(guān)鍵詞:藥膳消費(fèi)用戶

        方 曉,孫慧婷

        (1. 安徽省中醫(yī)藥科學(xué)院 亳州中醫(yī)藥研究所,安徽 亳州 236800;2. 亳州職業(yè)技術(shù)學(xué)院 信息工程系,安徽 亳州 236800)

        1 藥膳大數(shù)據(jù)的分析

        大數(shù)據(jù)是相對(duì)傳統(tǒng)數(shù)據(jù)而言的,在獲取數(shù)據(jù)、存儲(chǔ)數(shù)據(jù)、管理數(shù)據(jù)、分析與挖掘數(shù)據(jù)、應(yīng)用數(shù)據(jù)等方面規(guī)模上超過傳統(tǒng)數(shù)據(jù)。在思維方式上也形成大數(shù)據(jù)范式,主要包括:(1)技術(shù)方面,因大數(shù)據(jù)中數(shù)據(jù)量規(guī)模是海量的、 數(shù)據(jù)結(jié)構(gòu)和類型是多模態(tài)的、數(shù)據(jù)的產(chǎn)生是實(shí)時(shí)性的,為此產(chǎn)生與之相適應(yīng)的采集數(shù)據(jù)、管理數(shù)據(jù)、分析數(shù)據(jù)。并行計(jì)算方面,從大數(shù)據(jù)產(chǎn)生角度分析,有面向批量數(shù)據(jù)計(jì)算模型、流式數(shù)據(jù)計(jì)算模型、圖式數(shù)據(jù)計(jì)算模型。(2)存儲(chǔ)方面,有HDFS、HBase、Tachyon 等分布式存儲(chǔ)開源技術(shù)。(3)分析挖掘方面,傳統(tǒng)數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí),深度學(xué)習(xí)等新技術(shù)。(4)思維方面,在現(xiàn)實(shí)生產(chǎn)生活中,把大數(shù)據(jù)作為生產(chǎn)資料,云計(jì)算作為生產(chǎn)力,人工智能算法作為生產(chǎn)關(guān)系,將結(jié)果作為傳統(tǒng)企業(yè)的內(nèi)在生產(chǎn)動(dòng)力,發(fā)揮大數(shù)據(jù)價(jià)值[1]。

        藥膳大數(shù)據(jù)涉及多領(lǐng)域多學(xué)科知識(shí),藥膳的生產(chǎn)過程主要包括:中藥材、烹飪、醫(yī)學(xué)三個(gè)方面。藥膳大數(shù)據(jù)是從藥膳生產(chǎn)、藥膳消費(fèi)活動(dòng)中產(chǎn)生的具有現(xiàn)實(shí)價(jià)值意義的數(shù)據(jù)集合。有學(xué)者從藥膳的生命周期的角度分析,認(rèn)為藥膳大數(shù)據(jù)包含從藥膳原材料生產(chǎn)、藥膳生產(chǎn)、藥膳消費(fèi)等環(huán)節(jié)采集的數(shù)據(jù);有學(xué)者從藥膳數(shù)據(jù)的組合元素上分析,藥膳大數(shù)據(jù)包括藥材數(shù)據(jù)、組合配方數(shù)據(jù)、生產(chǎn)配方數(shù)據(jù)、消費(fèi)群體等數(shù)據(jù)。本研究認(rèn)為藥膳大數(shù)據(jù)應(yīng)包括:(1)藥膳大數(shù)據(jù)指“大”的數(shù)據(jù)集合,有數(shù)據(jù)量大、結(jié)構(gòu)復(fù)雜、類型多,又具有養(yǎng)生數(shù)據(jù)醫(yī)學(xué)、時(shí)空和序列的領(lǐng)域特點(diǎn)。(2)從功能上包括:藥膳大數(shù)據(jù)計(jì)算模型、藥膳大數(shù)據(jù)存儲(chǔ)技術(shù)和藥膳大數(shù)據(jù)分析挖掘技術(shù)。(3)藥膳大數(shù)據(jù)也指利用全量的、混雜的數(shù)據(jù)發(fā)現(xiàn)相關(guān)關(guān)系和規(guī)律,并以數(shù)據(jù)驅(qū)動(dòng)的方式來助推養(yǎng)生經(jīng)濟(jì)和養(yǎng)生思維。藥膳大數(shù)據(jù)生產(chǎn)應(yīng)用,其關(guān)鍵在于藥膳大數(shù)據(jù)平臺(tái)的構(gòu)建。

        2 藥膳大數(shù)據(jù)平臺(tái)設(shè)計(jì)與構(gòu)建

        2.1 需求分析

        藥膳信息大數(shù)據(jù)平臺(tái)融合藥膳藥材、生產(chǎn)配方、消費(fèi)群體等數(shù)據(jù),并且海量存儲(chǔ)、深度挖掘這些數(shù)據(jù),為藥膳消費(fèi)、藥膳養(yǎng)生文化的推廣提供支撐,該平臺(tái)應(yīng)具備下列功能性需求:

        (1)藥膳數(shù)據(jù)采集方面,藥膳數(shù)據(jù)采集接口分為線上和線下。線上主要對(duì)第三方餐飲信息平臺(tái)數(shù)據(jù)采集,具有實(shí)時(shí)性,線下對(duì)批量數(shù)據(jù)進(jìn)行導(dǎo)入。采集接口支持結(jié)構(gòu)化數(shù)據(jù)記錄和非結(jié)構(gòu)化數(shù)據(jù)記錄。

        (2)存儲(chǔ)數(shù)據(jù)方面,支持多系統(tǒng)存儲(chǔ)方式,以MapReduce模型為基礎(chǔ),對(duì)藥膳數(shù)據(jù)的相關(guān)性進(jìn)行存儲(chǔ)優(yōu)化,對(duì)藥膳數(shù)據(jù)使用頻率進(jìn)行存儲(chǔ)優(yōu)化,均衡各數(shù)據(jù)節(jié)點(diǎn)計(jì)算復(fù)雜度。并提供高效的管理與快速查詢功能。

        (3)數(shù)據(jù)計(jì)算方面,面向海量藥膳的數(shù)據(jù),通過MapReduce并行計(jì)算引擎,對(duì)流處理大數(shù)據(jù),大圖數(shù)據(jù)以及內(nèi)存的計(jì)算,可實(shí)現(xiàn)自定義配置。

        (4)分析挖掘方面,應(yīng)提供面向藥膳領(lǐng)域的分析,利用統(tǒng)計(jì)學(xué)方法,對(duì)藥膳數(shù)據(jù)進(jìn)行計(jì)算與分析。通過深度學(xué)習(xí)算法建立學(xué)習(xí)模型,實(shí)現(xiàn)個(gè)性化數(shù)據(jù)的推送,面對(duì)數(shù)據(jù)應(yīng)用層面,靈活配置算法,可視化挖掘結(jié)果。

        2.2 平臺(tái)架構(gòu)設(shè)計(jì)

        藥膳大數(shù)據(jù)平臺(tái)融合藥膳數(shù)據(jù)采集、存儲(chǔ)、計(jì)算與分析挖掘的整個(gè)生命周期。綜合相關(guān)文獻(xiàn)分析,研究其他平臺(tái)的架構(gòu)。對(duì)藥膳大數(shù)據(jù)平臺(tái)的架構(gòu)進(jìn)行了設(shè)計(jì),如圖1所示。

        圖1 藥膳信息大數(shù)據(jù)平臺(tái)的架構(gòu)

        (1)數(shù)據(jù)源

        藥膳大數(shù)據(jù)可分以下5種,如圖2所示。

        圖2 藥膳大數(shù)據(jù)平臺(tái)數(shù)據(jù)資源體系

        ①膳材類數(shù)據(jù),包括食材數(shù)據(jù)、膳材數(shù)據(jù)、功效數(shù)據(jù)、制作和加工流程數(shù)據(jù)等,這些數(shù)據(jù)大多以文本存儲(chǔ)在系統(tǒng)中。

        ②藥膳生產(chǎn)類數(shù)據(jù):包括食療配方數(shù)據(jù)、藥膳配方數(shù)據(jù),制作的流程等數(shù)據(jù),這些數(shù)據(jù)以文本、音頻、視頻非結(jié)構(gòu)化的方式存儲(chǔ)。

        ③銷售管理類數(shù)據(jù):包括藥膳消費(fèi)數(shù)據(jù)、消費(fèi)店面數(shù)據(jù)、消費(fèi)時(shí)空域數(shù)據(jù)等,這些數(shù)據(jù)多以結(jié)構(gòu)化的形式存儲(chǔ)在關(guān)系型數(shù)據(jù)庫中。

        ④藥膳消費(fèi)者行為數(shù)據(jù),即消費(fèi)者的行為數(shù)據(jù)、基本信息數(shù)據(jù)、健康數(shù)據(jù)等。

        ⑤評(píng)價(jià)類數(shù)據(jù),包括門店服務(wù)數(shù)據(jù)、消費(fèi)感知數(shù)據(jù)、藥膳評(píng)價(jià)數(shù)據(jù),是以文本為主的數(shù)據(jù)。

        (2)采集層

        藥膳數(shù)據(jù)的采集可以采用線上實(shí)時(shí)和線下批量兩種方式進(jìn)行。實(shí)時(shí)采集主要利用接口對(duì)第三方平臺(tái)進(jìn)行實(shí)時(shí)采集、爬蟲技術(shù)采集網(wǎng)絡(luò)隱藏的藥膳相關(guān)數(shù)據(jù)。批量采集通過用戶的導(dǎo)入、復(fù)制、錄入等行為對(duì)系統(tǒng)操作的日志、其他后臺(tái)記錄、相關(guān)資源文件等數(shù)據(jù)進(jìn)行采集;而對(duì)于線下傳統(tǒng)消費(fèi)環(huán)境中的數(shù)據(jù)可以利用藥膳協(xié)會(huì)資源實(shí)現(xiàn)平臺(tái)接口對(duì)接采集技術(shù)進(jìn)行獲取。

        (3)存儲(chǔ)層

        不同的數(shù)據(jù)源采集的數(shù)據(jù)在結(jié)構(gòu)、類別、規(guī)模上是不相同的。因此,在數(shù)據(jù)存儲(chǔ)上采用不同的數(shù)據(jù)存儲(chǔ)系統(tǒng)。對(duì)文本數(shù)據(jù)采用文件存儲(chǔ)系統(tǒng)、結(jié)構(gòu)化數(shù)據(jù)采用相關(guān)的數(shù)據(jù)庫、數(shù)據(jù)倉庫進(jìn)行存儲(chǔ)。對(duì)于零散、結(jié)構(gòu)復(fù)雜的可以通過內(nèi)存進(jìn)行存儲(chǔ)。為存儲(chǔ)龐大的藥膳數(shù)據(jù),存儲(chǔ)系統(tǒng)采用分布式架構(gòu)。為后續(xù)的數(shù)據(jù)處理、數(shù)據(jù)挖掘提供支持。

        (4)數(shù)據(jù)處理層

        大數(shù)據(jù)管理平臺(tái)的核心在于分析和挖掘價(jià)值高的相關(guān)關(guān)系,而實(shí)現(xiàn)這一目的的關(guān)鍵在于數(shù)據(jù)處理層的計(jì)算模型。本平臺(tái)運(yùn)用MapReduce計(jì)算架構(gòu),對(duì)于不同數(shù)據(jù)類別有相對(duì)應(yīng)計(jì)算模型,對(duì)大規(guī)模歷史數(shù)據(jù)采用批處理計(jì)算模型進(jìn)行并行運(yùn)算;對(duì)實(shí)時(shí)產(chǎn)生的流式數(shù)據(jù)采用流計(jì)算模型進(jìn)行處理;對(duì)平臺(tái)的計(jì)算結(jié)果以知識(shí)圖譜形式可視化。對(duì)知識(shí)圖譜的管理采用圖計(jì)算模型。為提高平臺(tái)響應(yīng)實(shí)時(shí)性、提高數(shù)據(jù)計(jì)算的速度,利用內(nèi)存計(jì)算模型進(jìn)行內(nèi)存管理。

        (5)分析挖掘?qū)?/p>

        藥膳大數(shù)據(jù)應(yīng)用主要方面:①藥膳經(jīng)營統(tǒng)計(jì),通過藥膳消費(fèi)和生產(chǎn)產(chǎn)生的數(shù)據(jù),運(yùn)用數(shù)據(jù)統(tǒng)計(jì)分析方法對(duì)藥膳類別銷售排名、藥膳門店銷售排名、用戶消費(fèi)排名、食材和藥材消費(fèi)排名,以及用戶健康狀況與藥膳藥用功能相關(guān)關(guān)系統(tǒng)計(jì);②藥膳消費(fèi)行為分析,通過第三方餐飲平臺(tái)的藥膳消費(fèi)數(shù)據(jù)、實(shí)體店獨(dú)立點(diǎn)餐平臺(tái)的數(shù)據(jù)庫記錄數(shù)據(jù)、在藥膳網(wǎng)站網(wǎng)絡(luò)爬取的日志數(shù)據(jù),運(yùn)用機(jī)器學(xué)習(xí)的深度學(xué)習(xí)算法,以及傳統(tǒng)的挖掘算法如規(guī)則挖掘、聚類分析等算法進(jìn)行挖掘分析,建立用戶畫像,主要包括口感、偏好、習(xí)慣、需求等方面,為藥膳的營銷、藥膳文化傳播與文化繼承進(jìn)行個(gè)性化推送奠定算法計(jì)算基礎(chǔ)。

        (6)應(yīng)用層

        大數(shù)據(jù)的價(jià)值在于應(yīng)用。基于藥膳經(jīng)營數(shù)據(jù)統(tǒng)計(jì)分析可以對(duì)藥膳產(chǎn)品進(jìn)行數(shù)字畫像,包括消費(fèi)用戶健康類別、體驗(yàn)度、評(píng)價(jià)情況、產(chǎn)品生產(chǎn)門店,發(fā)現(xiàn)藥膳產(chǎn)品的消費(fèi)群體、預(yù)測未來藥膳市場需求;然后進(jìn)行個(gè)性化推薦,并對(duì)藥膳的生產(chǎn)藥材、食材進(jìn)消存情況進(jìn)行干預(yù)管理。在藥膳消費(fèi)者方面,可對(duì)消費(fèi)者行為進(jìn)行指導(dǎo),以便消費(fèi)者調(diào)整消費(fèi)行為、養(yǎng)生計(jì)劃等。對(duì)藥膳生產(chǎn)資源的挖掘,構(gòu)建藥材、藥膳、養(yǎng)生的知識(shí)圖譜。

        3 藥膳信息大數(shù)據(jù)平臺(tái)的關(guān)鍵實(shí)現(xiàn)技術(shù)

        3.1 藥膳大數(shù)據(jù)EXL技術(shù)

        因大數(shù)據(jù)平臺(tái)數(shù)據(jù)的多樣性特征,在數(shù)據(jù)采集模塊上,針對(duì)類型不同的數(shù)據(jù)采取與之對(duì)應(yīng)的采集技術(shù)。對(duì)半結(jié)構(gòu)數(shù)據(jù),采用xmL、Flume、Kafka等組件技術(shù),但上述技術(shù)框架需要對(duì)數(shù)據(jù)的抽取、轉(zhuǎn)換、加載。而EXL技術(shù)是實(shí)現(xiàn)這些處理的最佳選擇。

        對(duì)于藥膳大數(shù)據(jù)平臺(tái)而言,數(shù)據(jù)量大,傳統(tǒng)的方案清洗數(shù)據(jù)導(dǎo)致性能下降,為應(yīng)對(duì)此問題, 本系統(tǒng)利用 Hadoop 平臺(tái)中的 Hive工具清洗數(shù)據(jù)。Hive工具的優(yōu)點(diǎn)是對(duì)大量結(jié)構(gòu)化數(shù)據(jù)進(jìn)行存儲(chǔ)和處理, 數(shù)據(jù)處理模塊如圖3所示。

        圖3 藥膳信息大數(shù)據(jù)平臺(tái)的數(shù)據(jù)處理模塊

        數(shù)據(jù)源主要包括數(shù)據(jù)庫 、數(shù)據(jù)倉庫 、數(shù)據(jù)表和其他類型的數(shù)據(jù)集合。數(shù)據(jù)源服務(wù)器通過用戶的請求對(duì)數(shù)據(jù)源提取相關(guān)的數(shù)據(jù)。按照預(yù)定義的數(shù)據(jù)結(jié)構(gòu)進(jìn)行抽取、通過數(shù)據(jù)清洗引擎并對(duì)數(shù)據(jù)進(jìn)行分析、識(shí)別噪音、合成。用戶可以定義知識(shí)庫編輯和定義數(shù)據(jù)清洗規(guī)則。

        3.2 藥膳大數(shù)據(jù)存儲(chǔ)設(shè)計(jì)技術(shù)

        藥膳數(shù)據(jù)的集中存儲(chǔ)平臺(tái)的關(guān)鍵性問題隨著數(shù)據(jù)結(jié)構(gòu)的復(fù)雜化,數(shù)據(jù)存儲(chǔ)由關(guān)系型數(shù)據(jù)庫轉(zhuǎn)到可擴(kuò)展的 NoSQL 型分布式數(shù)據(jù)庫。構(gòu)建在 HDFS 之上的分布式數(shù)據(jù)庫HBase具有可伸縮性動(dòng)態(tài)模式特點(diǎn),對(duì)于實(shí)時(shí)讀寫大規(guī)模的數(shù)據(jù)是最優(yōu)選擇[2]。

        3.2.1 數(shù)據(jù)庫部署設(shè)計(jì)

        本平臺(tái)數(shù)據(jù)存儲(chǔ)設(shè)計(jì)由ZooKeeper 獨(dú)立部署到兩臺(tái)機(jī)器上,負(fù)責(zé)協(xié)調(diào) RegionServer服務(wù)器集群和Hmaster服務(wù)器集群、meta 表信息的存儲(chǔ)和感知 RegionServer 的狀態(tài),這樣部署有以下優(yōu)點(diǎn):第一,HBase 和 ZooKeeper 的強(qiáng)耦合,方便后期對(duì) HBase 集群的升級(jí)、管理以及大數(shù)據(jù)平臺(tái)的擴(kuò)展。第二,ZooKeeper 作為配置中心,一旦配置信息發(fā)生改變或突發(fā)崩潰,能提供自動(dòng)容錯(cuò)的時(shí)間,重新選取候選者執(zhí)行未處理完的作業(yè)。第三,ZooKeeper通過上層的索引支持,實(shí)現(xiàn)自動(dòng)負(fù)載均衡。

        3.2.2 藥膳數(shù)據(jù) rowkey 的設(shè)計(jì)

        為了避免“熱點(diǎn)”問題。我們將HBase 與 Solr 相結(jié)合進(jìn)行解決。HBase 解決方法將風(fēng)格口味數(shù)據(jù)進(jìn)行隨機(jī)散列,并提前為藥膳產(chǎn)品信息數(shù)據(jù)表建立預(yù)分區(qū),隨機(jī)散列化風(fēng)格口味數(shù)據(jù)采用MD5 算法[3]。風(fēng)格口味數(shù)據(jù)由風(fēng)格口味FID和類別CID兩部分組成, 數(shù)據(jù)缺失情況下有正常ID進(jìn)行補(bǔ)充。由于藥膳產(chǎn)品查詢模塊會(huì)根據(jù)藥膳類別號(hào)直接索引,因此行鍵末位風(fēng)格口味FID,將藥膳產(chǎn)品類別CID數(shù)據(jù)轉(zhuǎn)換為哈希值再轉(zhuǎn)換為Bytes 類型,加上風(fēng)格口味FID轉(zhuǎn)為 Bytes 類型的值,即組成行鍵。最后生成 rowkey 的函數(shù)如(1) 所示:

        rowkey = MD5Hash. getMD5AsHex(CID) +CID + FID,

        (1)

        3.2.3 藥膳產(chǎn)品數(shù)據(jù)列簇的設(shè)計(jì)

        藥膳產(chǎn)品數(shù)據(jù)主要字段包括: 生產(chǎn)門店、產(chǎn)品類別號(hào)、產(chǎn)品號(hào)、風(fēng)格口味類別、生產(chǎn)時(shí)間、消費(fèi)時(shí)間、制作主廚ID、食材1、食材2、藥材1、藥材2等最少20個(gè)字段,至多42字段。生產(chǎn)時(shí)間與消費(fèi)時(shí)間采用 4 位時(shí)間占位符進(jìn)行存儲(chǔ),精確到分鐘級(jí)別。其他字段統(tǒng)一解析成字符串類型存儲(chǔ)。因?yàn)榱写匾?guī)模與 region 刷新I/O開銷是成正比的,且藥膳產(chǎn)品數(shù)據(jù)各字段應(yīng)用較統(tǒng)一,所有字段共同構(gòu)成藥膳產(chǎn)品數(shù)據(jù)唯一列簇 FProperties。藥膳產(chǎn)品數(shù)據(jù)列簇設(shè)計(jì)如表 1 所示。

        表1 藥膳產(chǎn)品信息數(shù)據(jù)表結(jié)構(gòu)

        3.2.4 文本藥膳數(shù)據(jù)存儲(chǔ)技術(shù)

        藥膳大數(shù)據(jù)平臺(tái)的思路是將若干個(gè)小規(guī)模文本文件組合成大規(guī)模文本文件,減少小規(guī)模文件的數(shù)量,從而減小內(nèi)存占用率提高文件的讀取速度。運(yùn)用HAR、Sequence File 和 Map File技術(shù)方法把藥膳配方數(shù)據(jù)文件、藥膳功效數(shù)據(jù)文件、藥膳藥材功效數(shù)據(jù)文件合并成規(guī)模大的文件,在完成對(duì)小規(guī)模數(shù)據(jù)文件的冗余壓縮后,將處理后的文件存儲(chǔ)在HDFS中,同時(shí)進(jìn)一步降低Name Node節(jié)點(diǎn)的數(shù)據(jù)規(guī)模,降低Name Node的內(nèi)存使用率。

        3.3 藥膳大數(shù)據(jù)的分析挖掘技術(shù)

        藥膳大數(shù)據(jù)的核心是綜合運(yùn)用數(shù)據(jù)挖掘技術(shù)對(duì)藥膳數(shù)據(jù)進(jìn)行預(yù)處理、精準(zhǔn)分析,通過分析與挖掘手段,把數(shù)據(jù)變成有價(jià)值的信息,以此促進(jìn)藥膳生產(chǎn)管理的優(yōu)化、藥膳文化傳承與推廣、促進(jìn)藥膳消費(fèi)。本平臺(tái)對(duì)目前可用的藥膳大數(shù)據(jù)分析和挖掘,所用到的算法與應(yīng)用總結(jié)如表 2 所示。

        表2 藥膳大數(shù)據(jù)平臺(tái)的相關(guān)數(shù)據(jù)分析技術(shù)一覽表

        對(duì)藥膳大數(shù)據(jù)分析挖掘有兩個(gè)方面的研究工作:(1)對(duì)挖掘算法的研究;通過海量、高速、多樣藥膳大數(shù)據(jù)處理需求,解決藥膳養(yǎng)生信息化問題;(2)充分挖掘藥膳數(shù)據(jù)的領(lǐng)域特征,以深度學(xué)習(xí)算法結(jié)合消費(fèi)認(rèn)知、消費(fèi)習(xí)慣構(gòu)建精準(zhǔn)度高、適應(yīng)性強(qiáng)的個(gè)性化推送系統(tǒng)。

        4 平臺(tái)的實(shí)現(xiàn)

        藥膳大數(shù)據(jù)平臺(tái)開發(fā)運(yùn)用當(dāng)前Java的主流技術(shù),Hadoop技術(shù)是該平臺(tái)核心技術(shù),主要以半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)為主存儲(chǔ)大量數(shù)據(jù),批量處理海量數(shù)據(jù),建立數(shù)據(jù)處理系統(tǒng)。平臺(tái)支持Windows和Linux(CentOS Linux 6.3 x86_64版本)操作系統(tǒng)。

        該平臺(tái)分為藥膳配方數(shù)據(jù)分析、消費(fèi)用戶社交網(wǎng)絡(luò)分析、藥膳數(shù)據(jù)挖掘、用戶畫像、個(gè)性化推送五個(gè)模塊。藥膳配方數(shù)據(jù)分析包括食材配方數(shù)據(jù)、功效數(shù)據(jù)、制作和加工流程數(shù)據(jù)等,這類數(shù)據(jù)多以文本、音視頻等非結(jié)構(gòu)化的形式存儲(chǔ)在文件系統(tǒng)中,主要采用Text Categorization、Concept Extraction等算法,結(jié)果如圖4所示。

        圖4 藥膳配方數(shù)據(jù)分析

        藥膳消費(fèi)后,帶來用戶健康指數(shù)的變化,用戶對(duì)藥膳的效用產(chǎn)生評(píng)價(jià)。效用評(píng)價(jià)數(shù)據(jù)與藥膳配方以及生產(chǎn)流程數(shù)據(jù)、食材數(shù)據(jù),四者間關(guān)聯(lián)關(guān)系挖掘和分析如圖5所示。消費(fèi)用戶社交網(wǎng)絡(luò)分析,該模塊主要采用Community Discovery、Page Rank等算法計(jì)算消費(fèi)用戶社群關(guān)系,對(duì)消費(fèi)用戶社群網(wǎng)絡(luò)中關(guān)系進(jìn)行分析。

        圖5 消費(fèi)用戶社交網(wǎng)絡(luò)分析

        數(shù)據(jù)挖掘模塊即從數(shù)據(jù)庫中大量的數(shù)據(jù)揭示出隱含的、潛在的信息的過程。通過自動(dòng)化地分析數(shù)據(jù),作出相關(guān)的歸納性的推理,并進(jìn)行可視化展現(xiàn),如圖6所示,如通過Association Rule Minin算法分析藥膳功效與疾病關(guān)聯(lián)挖掘、藥膳功效與養(yǎng)生部位關(guān)聯(lián)挖掘、構(gòu)建藥膳、疾病、部位關(guān)系圖。

        圖6 藥膳數(shù)據(jù)挖掘

        利用聚類、分類等相關(guān)數(shù)據(jù)挖掘方法分析每種藥膳消費(fèi)用戶群特征,以主成分分析方法挖掘消費(fèi)用戶群的主從屬性特征(年齡、職業(yè)、收入等)。再以關(guān)聯(lián)規(guī)則挖掘消費(fèi)用戶群與藥膳種類、效用、價(jià)格之間的關(guān)系,最后構(gòu)建每個(gè)品種藥膳的用戶畫像并可視化,如圖7所示。該模塊包含內(nèi)容有:(1)消費(fèi)用戶分類,根據(jù)用戶畫像推薦藥膳產(chǎn)品;(2)根據(jù)用戶消費(fèi)記錄和信息閱讀記錄,利用樸素貝葉斯判斷用戶的消費(fèi)習(xí)慣;(3)采用人工神經(jīng)網(wǎng)絡(luò)算法,為高緯度特征數(shù)據(jù)相關(guān)學(xué)習(xí)。

        圖7 藥膳數(shù)據(jù)挖掘

        5 結(jié)語

        構(gòu)建藥膳大數(shù)據(jù)平臺(tái)是消費(fèi)者個(gè)性化推送、藥膳門店精準(zhǔn)化管理的要求,是量化藥膳生產(chǎn)企業(yè)管理、深入研究藥膳文化傳承與推廣的需求。藥膳產(chǎn)業(yè)的發(fā)展應(yīng)以藥膳大數(shù)據(jù)平臺(tái)為依托,以破解當(dāng)前旅游養(yǎng)生產(chǎn)業(yè)信息化孤島問題,通過海量藥膳數(shù)據(jù)的采集、存儲(chǔ)與計(jì)算、分析挖掘,驅(qū)動(dòng)藥膳在個(gè)性化消費(fèi)、精準(zhǔn)生產(chǎn)、科學(xué)管理、藥膳研究、養(yǎng)生文化等多方面的變革與創(chuàng)新,促進(jìn)大數(shù)據(jù)與養(yǎng)生旅游的深度融合。本研究按照軟件工程的思路,從解決藥膳養(yǎng)生信息化問題出發(fā)設(shè)計(jì)并構(gòu)建了藥膳大數(shù)據(jù)平臺(tái),并對(duì)涉及的關(guān)鍵實(shí)現(xiàn)技術(shù)進(jìn)行了詳細(xì)闡述。后續(xù)研究將基于該平臺(tái)完善個(gè)性化推送模式、精準(zhǔn)生產(chǎn)與管理模式的實(shí)踐應(yīng)用,以期為藥膳生產(chǎn)者、消費(fèi)者、文化傳承者提供更精準(zhǔn)性的個(gè)性化支持。

        猜你喜歡
        藥膳消費(fèi)用戶
        可緩解干咳的兩款藥膳
        能讓你越喝越瘦的藥膳方
        國內(nèi)消費(fèi)
        新的一年,準(zhǔn)備消費(fèi)!
        小康(2021年1期)2021-01-13 04:56:24
        濕氣不可怕,藥膳起居健康行
        40年消費(fèi)流變
        商周刊(2018年23期)2018-11-26 01:22:20
        改善消化不良的兩款藥膳
        關(guān)注用戶
        商用汽車(2016年11期)2016-12-19 01:20:16
        關(guān)注用戶
        商用汽車(2016年6期)2016-06-29 09:18:54
        關(guān)注用戶
        商用汽車(2016年4期)2016-05-09 01:23:12
        日本一区二区三区看片| 国产情侣久久久久aⅴ免费| 欧美在线视频免费观看 | 人妻无码AⅤ中文系列久久免费| 日本频道一区二区三区| 伊人久久大香线蕉av色婷婷色| 四川老熟女下面又黑又肥| 无码毛片高潮一级一免费| 一区二区三区日本久久| 人妻少妇精品中文字幕专区| 亚洲av无码一区二区三区观看| 久久国产精品国产精品日韩区| 国产一区二区三区资源在线观看| 亚洲天堂av在线网站| 99久久免费国产精品| 国产精品理人伦国色天香一区二区 | 97久久国产精品成人观看| 亚洲精品久久国产精品| 丰满多毛的大隂户视频| 偷拍网日本一区二区三区| 精品熟女av中文字幕| 免费无码不卡视频在线观看 | 亚洲国产麻豆综合一区| 亚洲天堂一区二区三区视频| 日本xxxx色视频在线观看| 少妇无码一区二区三区| www.亚洲天堂.com| 曰日本一级二级三级人人| 国产一区内射最近更新| 欧美在线综合| 久久精品国产亚洲av蜜臀久久| 日本xxxx色视频在线观看免费 | 国产精品欧美日韩在线一区| 国产精品高清亚洲精品| 天天做天天爱夜夜夜爽毛片| 国自产偷精品不卡在线| 无码一区二区三区在| 国产精品人伦一区二区三| 成人区人妻精品一区二区不卡网站| 午夜短视频日韩免费| 久久中文字幕国产精品|