亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于數(shù)據(jù)挖掘的食品零售價格分類研究

        2017-11-13 04:23:54韓天鵬白玲玲
        韶關(guān)學(xué)院學(xué)報 2017年9期
        關(guān)鍵詞:零售價格阜陽數(shù)據(jù)挖掘

        韓天鵬,白玲玲

        (1.阜陽師范學(xué)院計算機(jī)與信息工程學(xué)院,安徽阜陽236037;2.中共阜陽市委黨校教務(wù)處,安徽阜陽236034)

        基于數(shù)據(jù)挖掘的食品零售價格分類研究

        韓天鵬1,白玲玲2

        (1.阜陽師范學(xué)院計算機(jī)與信息工程學(xué)院,安徽阜陽236037;2.中共阜陽市委黨校教務(wù)處,安徽阜陽236034)

        應(yīng)用數(shù)據(jù)挖掘技術(shù)可以使食品零售價格分析更加準(zhǔn)確.本文首先分析了食品零售價格的實(shí)際情況;其次對數(shù)據(jù)挖掘的基本理論進(jìn)行了深入的研究;然后設(shè)計了基于FP-tree算法程序?qū)?shù)據(jù)進(jìn)分類挖掘;最后以基于FP-tree樹挖掘算法設(shè)置的時間序列所計算的趨勢距離為依據(jù),得出食品零售價格波動和分類規(guī)則.結(jié)果表明,食物可分為六種類別,說明數(shù)據(jù)挖掘技術(shù)是分析食品零售價格分類的有效手段之一.

        數(shù)據(jù)挖掘;分類;食品零售價格

        隨著經(jīng)濟(jì)的增長,人們對經(jīng)濟(jì)發(fā)展的關(guān)注度不斷提高.商品價格隨著人們生活水平的提高而不斷提高,但人民生活水平隨著商品價格的不斷上漲卻不斷下降.食品是人們生活的主要商品,而食品內(nèi)在特點(diǎn)是通過供給和市場的需求價格波動體現(xiàn)的,食品常見的內(nèi)在特征是從價格波動中發(fā)現(xiàn)的.應(yīng)建立一種先進(jìn)的技術(shù),以食品零售價格為研究對象,對消費(fèi)價格指數(shù)的相關(guān)信息進(jìn)行分析[1].以及用適當(dāng)?shù)姆椒▽κ澄镞M(jìn)行分類,以提高食品零售價格分類的有效性.

        數(shù)據(jù)挖掘技術(shù)可以從不完備、噪聲、模糊、隨機(jī)的應(yīng)用數(shù)據(jù)中提取潛在的、有價值的信息和知識,通過深入分析數(shù)據(jù)來解決復(fù)雜的問題.在數(shù)據(jù)挖掘過程中,可自動搜索存儲在計算機(jī)內(nèi)電子表格中的數(shù)據(jù),然后進(jìn)一步通過關(guān)聯(lián)規(guī)則、分類回歸、聚類分析、數(shù)據(jù)結(jié)構(gòu)等方法將數(shù)據(jù)處理,最后可以發(fā)掘出隱藏在信息中有價值的數(shù)據(jù).數(shù)據(jù)挖掘技術(shù)是食品零售價格分類的一種較好的方法[2].筆者旨在為數(shù)據(jù)挖掘技術(shù)進(jìn)行食品零售價格分類的研究提供參考.

        1 零售價格分析

        消費(fèi)物價指數(shù)是一個有效的物價變動指數(shù),它能反映生產(chǎn)和勞務(wù)價格與人民生活的統(tǒng)計結(jié)果,是觀察通貨膨脹加劇的重要指標(biāo).若食品價格進(jìn)一步增加,CPI也會相應(yīng)增加,這表明,通脹壓力正在增加.城市居民食品零售價格是消費(fèi)品價格指數(shù)的重要組成部分,糧食生產(chǎn)和流通成本的增加會導(dǎo)致農(nóng)產(chǎn)品價格的提高,尤其是特殊天氣情況,生產(chǎn)成本將大大增加,國際糧食價格會影響到國內(nèi)供應(yīng)和需求,食品價格將進(jìn)一步增加[3].在有些年份,若CPI有較大的上升幅度,那么通貨膨脹將增加.城市居民食品零售價格是消費(fèi)品價格指數(shù)的重要組成部分,對食品零售價格變動趨勢的研究是研究CPI變化的一種有效工具,分類研究不同類型食品價格是研究食品零售指數(shù)更好的方法,最后也可以得到好的變化趨勢.

        城市居民的食物可分為5類,第一類是新鮮豬肉、新鮮牛肉和新鮮羊肉.第二類食品包括花生油、雞肉和魚.第三類食物包括豆類、芹菜、白糖、紅糖.第四類食品包括菜籽油、大豆油、大豆混合油、雞蛋、草魚、鯉魚、油菜、黃瓜、茄子、西紅柿、青椒、韭菜、蘋果、西瓜、醬油、醋、草原鮮奶.第五類食物包括卷心菜、蘿卜、土豆、胡蘿卜、卷心菜、香蕉、豆腐、食用鹽[5].

        食品零售價格的變化會影響到中國市場經(jīng)濟(jì)的穩(wěn)定,也會影響到歐盟等其他國家的穩(wěn)定.為了有效的控制食品零售價格的增加,可對農(nóng)業(yè)采取相應(yīng)的補(bǔ)貼措施.例如,增加農(nóng)民的補(bǔ)貼,大力推廣新技術(shù)和新農(nóng)業(yè)生產(chǎn)的應(yīng)用,這樣就會能夠迅速提高農(nóng)場農(nóng)民種糧的熱情,糧食生產(chǎn)供應(yīng)就可以得到保證.另外嚴(yán)格控制化肥和農(nóng)用化學(xué)品價格,降低農(nóng)業(yè)生產(chǎn)成本.農(nóng)民還應(yīng)該掌握整個市場的信息,并能縮短分銷鏈,降低分配成本.有效地開展市場價格和成本調(diào)查監(jiān)測,供給和需求的監(jiān)測分析.加強(qiáng)監(jiān)測糧食、食用植物油、肉類、蛋類、蔬菜、牛奶及其食品價格變化,及早定位、標(biāo)志問題.以上方法可以保證糧食供應(yīng),保持糧食市場秩序,及食品零售價格長期平穩(wěn)[5].

        2 數(shù)據(jù)挖掘的基本理論

        利用記錄食品零售價格歷史變化,對食品價格數(shù)據(jù)進(jìn)行分類,找出食品零售價格特征與數(shù)據(jù)之間的關(guān)系,最后對食品零售價格進(jìn)行分類.基于數(shù)據(jù)挖掘的食品零售價格分類程序包括:數(shù)據(jù)準(zhǔn)備與分類、對象確認(rèn)、數(shù)據(jù)清理、數(shù)據(jù)標(biāo)準(zhǔn)化、數(shù)據(jù)離散化、數(shù)據(jù)的簡約化,最終得到食品零售價格的分類.

        (1)數(shù)據(jù)清理.這一步是刪除采集到的異常數(shù)據(jù),主要包括加入空缺值,刪除傳感器錯誤產(chǎn)生的無效數(shù)據(jù),或者在數(shù)據(jù)傳輸過程中隨時收集的數(shù)據(jù).

        (2)數(shù)據(jù)標(biāo)準(zhǔn)化.這一步是比較基于統(tǒng)一標(biāo)準(zhǔn)的傳感器采集的數(shù)據(jù).當(dāng)食品零售價格變化異常,異常數(shù)據(jù)無法證實(shí),同時最大、最小和實(shí)時采集數(shù)據(jù)的平均值對食品零售價格分類效果又不明顯時,為了提高食品零售價格的分類效果,可以用下面的數(shù)據(jù)標(biāo)準(zhǔn)化方法:

        其中,Zi,k指的是收集到的數(shù)據(jù)的異常因素,當(dāng)-1<Zi,k<1時收集到的數(shù)據(jù)處于正常狀態(tài),fk表示屬性k的平均值,Sk表示屬性 k 的平均絕對偏差,xmax,k和 xmin,k表示屬性 k 的最大值和最小值[6].

        (3)數(shù)據(jù)離散化.這一步可以和不同區(qū)間元素決策價值類似將符合不同條件的元素進(jìn)行間隔,不同區(qū)間的元素可以分為幾個有限的間隔.數(shù)據(jù)離散化處理的過程中應(yīng)該考慮收集數(shù)據(jù)的特點(diǎn),在收集的數(shù)據(jù)變化不大,而對食品零售價格分類影響較大,小的離散區(qū)間可以選擇,從而可以得到正確的食品零售價格分類.否則,大離散區(qū)間可選擇.

        (4)模糊粗糙集的數(shù)據(jù)挖掘方法.模糊粗糙集是粗糙集理論的擴(kuò)展,已知的話語域U,模糊集合F(U)定義為弱模糊劃分,定義如下[7]:

        (b)Ai是U上的正則模糊集;

        A,Bi∈F(U)兩個模糊集合是已知的,兩個模糊集合之間的關(guān)系可以用包含度表示,包含度的表達(dá)式如下:

        模糊集合X到ε的上近似集和下近似集定義如下:

        其中,A一σ(X)表示上近似集,A一τ(X)表示下近似集.

        決策系統(tǒng)的條件屬性和決策屬性屬于模糊集合,隸屬度可以根據(jù)屬性集合中不同屬性值反映模糊集合的隸屬度,從而為簡約規(guī)則提供依據(jù).

        知識推理是決策系統(tǒng)的重要組成部分,決策能夠有效地表達(dá)知識.決策表的對象和決策規(guī)則映射一一對應(yīng),決策可以定義如下[8]:

        信息系統(tǒng)的S=(U,A)是已知的,C是條件,D是決策屬性,屬于兩個子集合A,C∩D=A,C∩D=Φ,S是決策表.

        在決策過程中,基于決策表約簡的條件屬性較少,決策表一致性具有以下約簡過程:首先,在決策表中刪除列;其次,冗余行被刪除;最后,在決策規(guī)則中刪除冗余屬性數(shù).

        3 數(shù)據(jù)挖掘算法設(shè)計

        3.1 算法思路

        由于歷史原因,許多存儲零售食品價格數(shù)據(jù)的數(shù)據(jù)庫數(shù)據(jù)格式都不盡相同,其傳統(tǒng)的關(guān)系測量算法的正確性和效果也不能保證.造成這種情況的主要原因是處理器在處理大量的數(shù)據(jù)時處理效率低下,數(shù)據(jù)不是一次性處理的.解決上述問題可通過云計算資源交互概念,利用FP-Tree樹算法,建立對海量數(shù)據(jù)的有效挖掘算法,根據(jù)結(jié)果收斂的特點(diǎn)構(gòu)造快速有效的關(guān)系度量算法.關(guān)系表達(dá)式如下:

        上述表達(dá)式是對稱的組合.根據(jù)樣本容量和綜合信息內(nèi)容的客觀事實(shí),重要信息添加到公式(7),全面考慮關(guān)聯(lián)系數(shù)的尺度,因此連接功能的設(shè)計表示如下:

        其中 ni是第 i個數(shù)據(jù)樣本,N*=n1+n2+...+nk-1;N=N*+nk,-1≤u,v≤1,0<a<1,1≤ck≤1;a 是設(shè)置參數(shù).

        將小樣本集合si轉(zhuǎn)換成待處理的海量數(shù)據(jù),根據(jù)數(shù)據(jù)的特殊性確定關(guān)系系數(shù)的有效計算方法,并用以下公式對x到y(tǒng)的關(guān)系效應(yīng)水平ri進(jìn)行了評價:

        其中,xj和 yj表示 si和y一中的觀測值,ni是 si的樣本容量.

        si+1其他海量數(shù)據(jù)采集的獨(dú)立樣本,然后計算出效應(yīng)水平

        將采樣后兩個小樣本集合并確認(rèn),公式如下:

        樣本容量計算如下所示:

        通過建立連接函數(shù)將兩個小樣本之間的關(guān)聯(lián)程度聯(lián)系起來,下式定義了復(fù)合樣本合并的關(guān)聯(lián)度.

        對ρ⌒d評估后,si+2最后評估x中y和的關(guān)聯(lián)程度r一i+2和ni+1的樣本容量,sd和si+2合并集合樣品集sd+1被證實(shí),樣本容量可以定義為:

        關(guān)聯(lián)程度變量,集合中元素和值的確定是根據(jù)連接作用,其定義如下:

        算法的結(jié)束條件如下:

        其中ε<0.

        3.2 算法描述

        if((freq==0)then nextISetP=p;

        if(ChildCountFlag==false)then

        {ChildCount=Get Child-Count of p;

        if(ChildCount>1)then

        {ChildCountFlag=true;

        nextISetP=p;} }

        freq=Get頻率 from p;}

        until(p==root);//直到根節(jié)點(diǎn)

        p=nextISetP;

        Add N to V;}

        until(ChildCount>1)or(p=root)}

        Return V.

        以上描述了本地數(shù)據(jù)集在整個空間數(shù)據(jù)中構(gòu)建分布式FP-tree的算法Cl_FP-Growth[10].為從 FP-tree 中讀取項(xiàng)集,Cl_FP-Growth 被調(diào)用兩次,一次用于兩個周期性數(shù)據(jù)庫中的FPT1,第二次用于FPT2.若FP-tree樹的高度為H,算法的時間復(fù)雜度為O(KH+N).構(gòu)建FP-tree僅需掃描兩遍空間數(shù)據(jù)集D[11].算法Cl_FP-Growth有著較高的運(yùn)行效率.

        表1 食品零售價格增長率幅度的分類

        表2 花生油趨勢表示

        4 算法分析驗(yàn)證

        近年來,食品零售波動呈現(xiàn)出一定的規(guī)律性,但在某些年內(nèi)食品零售價格會發(fā)生突變,這種現(xiàn)象表明食品零售價格受市場力量的影響,對隨機(jī)因素會產(chǎn)生沖擊[6].根據(jù)食品零售價格季度數(shù)據(jù),食品零售價格增長率見表1.

        在數(shù)據(jù)挖掘基本理論的基礎(chǔ)上,利用MATLAB軟件編制相應(yīng)的程序,以花生油為例,周期時間為2015年5月至2016年5月為例,趨勢表示見表2[13].

        基于程序進(jìn)行時序模式的相互比較,得到趨勢距離矩陣,使用趨勢距離去衡量這兩個序列模式之間的相似程度,其距離越接近于0,表示待匹配的兩個序列趨勢越接近[14];反之趨勢距離越大表示待匹配序列趨勢可能會有較大差異,最終無法歸為同一類.

        根據(jù)趨勢距離去度量各種食品的相似性,開始時將每一樣商品都作為一類,根據(jù)趨勢距離的大小將距離最近的逐步合并,直到所有樣品合并為一類為止.根據(jù)該算法對食品零售價格最終分類,結(jié)果見表3.

        食物可分為6種,即油、高蛋白肉類、單季蔬菜、多季蔬菜、非季節(jié)性蔬菜和輔料類(見表3).食品零售價格分類具有重要的經(jīng)濟(jì)意義,從表3可以看出分類結(jié)果與實(shí)際情況一致.食品的內(nèi)在性和不可估量性可以有效地反映出來,如供求變化情況、價格彈性等,分類結(jié)果具有較強(qiáng)的指導(dǎo)意義.

        4 結(jié)語

        表3 基于數(shù)據(jù)挖掘的食品零售價格分類結(jié)果

        食品零售價格是居民關(guān)心的重要經(jīng)濟(jì)指標(biāo),在各種因素的影響下會發(fā)生波動.食品零售價格與人民生活密切相關(guān),其波動很大程度上影響人民的生活,因此應(yīng)有效控制物價波動,使人民在穩(wěn)定的經(jīng)濟(jì)環(huán)境中消費(fèi).在本文中將數(shù)據(jù)挖掘技術(shù)應(yīng)用于食品零售價格分類中,數(shù)值模擬結(jié)果表明,它是分析食品零售價格的有效手段.

        [1]Tres A,Van D V,Perez-Marin M D,et al.Authentication of organic feed by near-infrared spectroscopy combined with chemo metrics:A feasibility study[J].Journal of Agricultural and Food Chemistry,2016,60(33):8129-8133.

        [2]Li T,Zhang Z G,Liu G L.Sensitivity analysis model of food prices on SVR[J].Journal of Convergence Information Technology,2012,7(21):205-211.

        [3]Seck G S,Guerassimoff G,Mai¨zi N.Heat recovery with heat pumps in non-energy intensive industry:A detailed bottom-up model analysis in the French food&drink industry[J].Applied Energy,2013,111:489-504.

        [4]Suchomel J,Gejdo?M,Ambru?ová L,et al.Analysis of price changes of selected round wood assortments in some Central Europe countries[J].Journal of Forest Science,2012,58(11):483-491.

        [5]Kato T,Pham D T X,Hoang H,et al.Food residue recycling by swine breeders in a developing economy:A case study in Da Nang[J].Waste Management,2012,32(12):2431-2438.

        [6]Lone T A,Khan R A.Data mining:Competitive tool to digital library[J].DESIDOC Journal of Library&Information Technology,2014,34(5):401-406.

        [7]Nishimura K,Maehata Y,Sunayama W.Improved Inspection of Facilities for High-Voltage Class Using Data Mining[J].Electrical Engineering in Japan,2015,191(2):47-54.

        [8]Wang X F,Wang Y,Bi H B,et al.Heat-Supply Network State Prediction Based on Optimum Combination Model of Data Mining Journal of Applied Sciences,2014,13(13):2443-2449.

        [9]Kyunglag K,Daehyun K,Yeochang Y,et al.A real time process management system using RFID data mining[J].Computers in Industry,2014,65(4):721-32.

        [10]張明衛(wèi),朱志良,劉瑩,等.一種大數(shù)據(jù)環(huán)境分布式輔導(dǎo)關(guān)聯(lián)分類算法[J].軟件學(xué)報,2015,26(11):2795-2810.

        [11]袁景凌,鐘珞,楊光,等.綠色數(shù)據(jù)中心不完備能耗大數(shù)據(jù)填補(bǔ)及分類算法研究[J].計算機(jī)學(xué)報,2015,38(12):2499-2516.

        [12]Yang X Q,Zou C F,Yue L,et al.Research on food complains document classification based-on topic[J].Journal of Software,2012,7(8):1687-1693.

        [13]呂艷霞,王翠榮,王聰,等.大數(shù)據(jù)環(huán)境下的不確定數(shù)據(jù)流在線分類算法[J].東北大學(xué)學(xué)報(自然科學(xué)版),2016,37(9):1245-1249.

        [14]馬彪,周瑜,賀建軍.面向大規(guī)模類不平衡數(shù)據(jù)的變分高斯過程分類算法[J].大連理工大學(xué)學(xué)報,2016,56(3):279-284.

        Research on Food Retail Price Classification Based on Data Mining

        HAN Tian-peng1,BAI Ling-ling2
        (1.School of Computer and Information Engineering,Fuyang Teachers College,Fuyang 236037;2.Information Management Center,Fuyang Party Institute of CCP,Fuyang 236034,Anhui,China)

        The application of data mining technology can make food retail price analysis more accurate.In the paper,firstly,the real situation of Chinese food retail price is analyzed.Secondly,the basic theory of data mining is studied and then designed based on FP-tree algorithm program for data classification mining,from which finally,the calculated time series trend distance results in food retail price fluctuation and classification rules.The result shows that the food can be divided into six categories and the data mining technology is an effective means for analyzing the food retail price classification.

        data mining;classification;food retail price

        TP274+.2

        A

        1007-5348(2017)09-0031-06

        2017-08-22

        國家自然科學(xué)基金項(xiàng)目(61673117);阜陽師范學(xué)院自然科學(xué)研究項(xiàng)目(2016FSKJ03).

        韓天鵬(1982-),男,安徽阜陽人,阜陽師范學(xué)院計算機(jī)與信息工程學(xué)院講師,碩士;研究方向:數(shù)據(jù)挖掘、大數(shù)據(jù)應(yīng)用、云計算.

        (責(zé)任編輯:歐 愷)

        猜你喜歡
        零售價格阜陽數(shù)據(jù)挖掘
        2022年7月復(fù)合肥零售價格
        2022年8月復(fù)合肥零售價格
        2022年3月復(fù)合肥零售價格
        2022年1月復(fù)合肥零售價格
        第二屆淮河文化論壇在阜陽舉行
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
        合肥至霍邱至阜陽高速公路今年開建
        安徽阜陽潁上:“產(chǎn)業(yè)花”結(jié)出“脫貧果”
        基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
        777米奇色狠狠俺去啦| 极品少妇一区二区三区四区| 国产精品髙潮呻吟久久av| 国产免费又色又爽粗视频| 中国国语毛片免费观看视频| 亚洲日韩图片专区小说专区| 国产一区二区黑丝美女| 国产精品国产三级国产av18| 成人性生交大片免费看96| 视频一区二区在线播放| 风流少妇一区二区三区| 精品人妻av一区二区三区麻豆| 亚洲熟妇自偷自拍另欧美| 最新69国产成人精品视频免费| 亚洲成a人片77777kkkkk| 久久综合国产精品一区二区| 人妻 日韩 欧美 综合 制服| 男女男在线精品网站免费观看| 蜜桃在线观看免费高清完整版| 亚洲国产系列一区二区| 国产精品久久人妻无码| 成人a在线观看| 加勒比特在线视频播放| 红桃av一区二区三区在线无码av| a级毛片100部免费看| av资源在线看免费观看| 亚洲天码一区二区三区| 亚洲精品久久久av无码专区 | 国产在线丝袜精品一区免费| 日韩精品人妻少妇一区二区| 日韩精品专区在线观看| 国产在线一区二区三区av | 熟女丝袜美腿亚洲一区二区三区| 在线观看日本一区二区三区四区| 无码人妻av一二区二区三区 | 美腿丝袜日韩在线观看| 欧美人与禽zozzo性伦交| 日韩免费一区二区三区在线| 国产99久久久国产精品免费| 日本伊人精品一区二区三区| 国产成人久久777777|