亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于EMD與SVM的中藥材三七價格預(yù)測方法

        2018-03-30 02:29:16張喜紅王玉香
        常州工學(xué)院學(xué)報 2018年6期
        關(guān)鍵詞:模態(tài)信號模型

        張喜紅,王玉香

        (亳州職業(yè)技術(shù)學(xué)院,安徽亳州236800)

        0 引言

        三七號稱“金不換”,是名貴中藥材之一,具有活血化瘀、消腫止痛之功效,主產(chǎn)于我國云南地區(qū)。近年來,我國三七價格漲跌頻繁,波動劇烈。以亳州藥市為例,40頭規(guī)格的三七月均價從2012年800元/kg,到2015年下降為不足200元/kg,在2017年又漲回400元/kg。生產(chǎn)經(jīng)營者迫切需要一套能夠精準(zhǔn)預(yù)測三七價格的模型,以規(guī)避價格波動帶來的不利影響。

        當(dāng)前用于商品價格預(yù)測的建模方法,大致可分為兩大類,即因素分析法與基于價格時間序列的技術(shù)分析法。由于因素分析法存在影響因素數(shù)據(jù)難以全面收集,各因素因子的權(quán)重較難確定的問題,實際應(yīng)用案例相對較少?;趦r格時間序列的建模方法,其基本思想是認為歷史價格數(shù)據(jù)與當(dāng)前價格數(shù)據(jù)存在關(guān)聯(lián),在得到完整的歷史價格時間序列樣本的基礎(chǔ)上,可通過特定的數(shù)據(jù)分析技術(shù)探究歷史價格時間序列的變化規(guī)律,進而外推預(yù)測后期的價格數(shù)據(jù)?;跉v史價格時間序列分析建模的主要方法有:ARIMA算法、神經(jīng)網(wǎng)絡(luò)算法、多種算法組合使用等方法。如:王諾等[1]提出了一種基于自回歸積分滑動平均模型的三七價格預(yù)測方法。該方法雖然具有一定的參考性,但在具體應(yīng)用中對三七歷史價格數(shù)據(jù)的準(zhǔn)確度、連續(xù)性提出了更為苛刻的要求,且ARIMA模型普遍存在無法應(yīng)對價格突變的情況。馬廣慧等[2]以三七歷史售價時間序列為樣本數(shù)據(jù),將遺傳算法用于BP神經(jīng)網(wǎng)絡(luò)初始權(quán)值、閾值的優(yōu)化,提出一種基于改進BP神經(jīng)網(wǎng)絡(luò)的三七價格預(yù)測方法,收到了較好的實驗效果,但該方法不適用于樣本量較少的情況,在此情況下很難訓(xùn)練出具有較高預(yù)測精度的模型。

        基于上述背景,鑒于SVM(支持向量機)算法在小樣本學(xué)習(xí)方面具有較好的泛化能力,同時EMD(經(jīng)驗?zāi)B(tài)分解)理論可將時間序列分解為不同尺度特征的模態(tài)分量進行深層次分析,本文提出了一種EMD與SVM相結(jié)合的三七價格預(yù)測方法。以40頭規(guī)格三七的歷史價格時間序列數(shù)據(jù)為例,對算法的可行性與優(yōu)越性進行實例驗證。

        1 基本理論方法

        1.1 EMD理論

        EMD理論是黃鍔等人在1998年提出的一種對非平穩(wěn)、非線性信號的自適應(yīng)時頻域分析方法[3]。其核心思想是,任意非線性、非平穩(wěn)信號均可依據(jù)自身的時間尺度特征將其分解成若干個本征模態(tài)分量與一個殘余分量的疊加,如式(1)所示:

        (1)

        式中:X(t)代表原始數(shù)據(jù)序列;imfi(t)代表各階本征模態(tài)分量;rm(t)代表殘余分量。每個本征模態(tài)分量反映了原始信號不同時間尺度的局部特征,殘余分量反映了原始信號的全局趨勢。

        本征模態(tài)分量imfi(t)具有如下特征:

        1)在信號的全部時長內(nèi),局部極值點的個數(shù)與過零點個數(shù)相差不超過1個;

        2)在各時間點,上包絡(luò)值與下包絡(luò)值的均值為零,即信號波形局部對稱。

        時間序列信號X(t)的EMD分解過程可按如下步驟實現(xiàn):

        1)尋找輸入信號的所有極值點,通過三次樣條插值方法擬合得到分別與極大值、極小值點對應(yīng)的上包絡(luò)線e+(t)與下包絡(luò)線e-(t)。

        2)原始時間序列數(shù)據(jù)X(t)與上、下包絡(luò)線的均值求差得到新的時間序列數(shù)據(jù)

        (2)

        3)判斷H(t)時間序列是否滿足在信號的全部時長內(nèi)局部極值點的個數(shù)與過零點個數(shù)相差不超過1個,在各時間點上包絡(luò)值與下包絡(luò)值的均值為零。若不滿足,則循環(huán)執(zhí)行1—2步,直到H(t)滿足本征模態(tài)分量的條件,得到原始信號的一階本征模態(tài)分量imf1(t)。

        4)用原始信號減去一階本征模態(tài)分量imf1,求得去除高頻成分的新序列r1(t);對r1(t)序列重復(fù)1—4步,便可得到下一階次的本征模態(tài)分量及殘余分量。

        1.2 SVM回歸理論

        SVM回歸理論是Vapnik等人于1995年基于統(tǒng)計學(xué)理論提出的一種適用于小樣本、非線性、高維度數(shù)據(jù)分類及回歸分析的模式識別方法。其與神經(jīng)網(wǎng)絡(luò)算法相比克服了局部最優(yōu)、泛化能力較弱的缺點,用較少的樣本便可得到精度較高的模型[4]。其算法的核心思想是:對于低維不可分的原始數(shù)據(jù),在避免維數(shù)災(zāi)難的前提下,通過核函數(shù)把原始數(shù)據(jù)映射至高維空間,實現(xiàn)數(shù)據(jù)的高維線性可分。采用SVM回歸算法進行數(shù)據(jù)分析的過程,實質(zhì)上是求解輸入、輸出變量回歸面的過程,其詳細原理參見文獻[5—8]。在采用SVM算法進行回歸訓(xùn)練時,核函數(shù)選擇得當(dāng)與否,對于所建模型的性能至關(guān)重要。常見的核函數(shù)有RBF核函數(shù)、多項式核函數(shù)、線性核函數(shù),分別如式(3)—(5)所示。

        (3)

        K(xi,yi)=((xi·yi)+1)d

        (4)

        K(xi,yi)=(xi·yi)

        (5)

        式中:xi為樣本輸入量;yi為時應(yīng)的輸出量;σ為高斯核帶寬,σ>0;d取自然數(shù)。

        RBF核函數(shù)通常用于高頻多變信號的映射;多項式函數(shù)一般用于緩慢變化的具有一定規(guī)律性的信號的映射;線性核函數(shù)常用于線性變化信號的映射。

        1.3 EMD與SVM組合建模步驟

        實踐證明,價格時間序列大多是非線性、非平穩(wěn)時間序列,原始信號序列中既有高頻多變成分、又有緩慢變化的規(guī)律性成分、同時也包含線性變化的成分。若直接將原始信號采用單一核函數(shù)進行SVM回歸訓(xùn)練,將使所創(chuàng)建的模型容易出現(xiàn)誤差較大的情況。正如1.2小節(jié)所述,要想建立較高精度的預(yù)測模型,需對原始信號中不同性質(zhì)的分量分類選取核函數(shù)進行SVM回歸訓(xùn)練。因此,本文提出了一種基于EMD與SVM組合建模的方法,其具體實現(xiàn)過程如下。

        1)首先對原始價格時間序列信號進行n階經(jīng)驗?zāi)B(tài)分解,將其分解為n個本征模態(tài)分量與1個殘余分量。

        2)對原始價格序列進行相關(guān)分析,依據(jù)當(dāng)前期與各滯后期的相關(guān)度,確立各本征模態(tài)分量SVM訓(xùn)練樣本的維數(shù),即以d個滯后期作為輸入,當(dāng)前期作為輸出。

        3)依據(jù)各階本征模態(tài)分量與殘余分量的信號特點選取核函數(shù),分別對各階本征模態(tài)分量及殘余分量進行SVM回歸分析。

        4)將各本征模態(tài)序列與殘余序列的預(yù)測進行疊加合成,得到最終預(yù)測結(jié)果。

        2 40頭規(guī)格三七價格預(yù)測建模實例

        2.1 原始數(shù)據(jù)的獲取

        基于歷史價格時間序列的價格預(yù)測模型要求原始數(shù)據(jù)長期不間斷。中藥材天地網(wǎng)自2012年6月以來,按天公布了數(shù)百種藥材在亳州等地藥市的價格。經(jīng)前期實地考證,數(shù)據(jù)真實無誤。因此,在研究中以此作為信息來源。由于手工整理數(shù)據(jù)效率低下,基于Scrapy網(wǎng)絡(luò)爬蟲框架構(gòu)建了專用爬蟲工具[9],實現(xiàn)了歷史價格數(shù)據(jù)的快速采集與規(guī)范整理。三七規(guī)格較多難于統(tǒng)籌研究,本實驗以40頭規(guī)格的三七為代表開展研究,按月爬取2012年6月至2018年5月的亳州藥市歷史價格數(shù)據(jù)共72條,以此作為算法驗證的原始數(shù)據(jù),其時間序列如圖1所示。

        圖1 40頭規(guī)格三七的歷史價格數(shù)據(jù)

        2.2 40頭規(guī)格三七價格預(yù)測模型的構(gòu)建

        由圖1可知,40頭規(guī)格三七的歷史價格時間序列具有非平穩(wěn)、非線性的特點。借助Matlab 2014平臺的EMD工具箱,編寫分解程序,將原始序列分解為4個本征模態(tài)分量和1個殘余分量,分解結(jié)果如圖2所示。

        同樣借助Matlab 2014平臺對原始序列各期進行相關(guān)性分析。各滯后期與當(dāng)期的相關(guān)性程度如圖3所示,分析可知當(dāng)期值與各期滯后期的值長期相關(guān),且隨著滯后階數(shù)的增加相關(guān)度呈下降趨勢,綜合考慮選取相關(guān)系數(shù)大于0.7的1—5期滯后期作輸入量來預(yù)測當(dāng)期的值。

        經(jīng)上述分析,最終確定40頭規(guī)格三七價格預(yù)測模型的構(gòu)建方案為:各階EMD分量均以當(dāng)期序列值為期望輸出,滯后1—5期對應(yīng)的序列值作為輸入量,分別進行SVM回歸分析,最后將各EMD分量的預(yù)測結(jié)果疊加得到最終預(yù)測值。結(jié)合各階本征模態(tài)分量的變化規(guī)律,對于高頻多變的imf1與imf2分量選取RBF核函數(shù);對于按一定規(guī)律緩慢變化的imf3與imf4分量選用多項式核函數(shù);對于有明顯線性特征的殘余分量res采用線性核函數(shù)。

        (a) imf1分量

        (b) imf2分量

        (c) imf3分量

        (d) imf4分量

        (e) res分量圖2 imf分量及res分量示意圖

        圖3 原始序列自相關(guān)分析圖

        2.3 模型的評價與比較

        為了驗證EMD與SVM組合模型的可行性,將40頭規(guī)格三七價原始數(shù)據(jù)按一定比例劃分成訓(xùn)練集與驗證集,即以2012年6月至2017年8月的價格作為訓(xùn)練集,以2017年9月到2018年5月的價格作為驗證集,按2.2小節(jié)的建模方案,在Matlab 2014平臺下,進行EMD與SVM組合建模仿真實驗,并采用均方根誤差RMSE與平均百分比誤差MAPE2項評價指標(biāo)進行評價。

        (6)

        (7)

        具體的建模過程包括數(shù)據(jù)的預(yù)處理、交叉驗證參數(shù)優(yōu)化、利用最優(yōu)參數(shù)訓(xùn)練SVM、擬合預(yù)測等步驟。最終得到此模型的預(yù)測結(jié)果評價表(表1)。由表1可知,各本征模態(tài)分量的誤差較大且均高于殘余分量誤差,本征模態(tài)分量預(yù)測結(jié)果不理想,但總體誤差并沒有因此出現(xiàn)明顯增大。結(jié)合圖2可知,與殘余分量相比,各本征模態(tài)分量幅度較低,故殘余分量對總體預(yù)測結(jié)果起決定作用。

        為了進一步驗證EMD與SVM組合模型的優(yōu)越性,將其與BP神經(jīng)網(wǎng)絡(luò)模型、單純SVM模型及ARIMA模型進行比較。經(jīng)前期的自相關(guān)、偏相關(guān)分析以及BIC信息量統(tǒng)計,得到ARIMA算法的最佳模型為ARIMA(3,1,1)。采用相同的訓(xùn)練數(shù)據(jù)集與驗證數(shù)據(jù)集,經(jīng)多次試湊實驗,最終確立的BP神經(jīng)網(wǎng)絡(luò)算法的較優(yōu)預(yù)測模型為輸入層3個神經(jīng)元、隱含層6個神經(jīng)元、輸出層1個神經(jīng)元。輸入層與隱層之間選用sigmoid函數(shù)f(x)=1/(1+e-x)作為傳遞函數(shù),學(xué)習(xí)率為0.3。各種方法對2017年9月到2018年5月間40頭規(guī)格三七的價格推算結(jié)果如圖4所示,各種方法的預(yù)測評價指標(biāo)見表2??芍珽MD與SVM組合模型的2項預(yù)測誤差指標(biāo)均低于其他單一模型,BP神經(jīng)網(wǎng)絡(luò)模型、EMD與SVM組合模型均能對價格突變拐點做出響應(yīng),但BP神經(jīng)網(wǎng)絡(luò)模型精度較差,單純SVM模型與ARIMA模型在穩(wěn)定期的預(yù)測相對較好,但對價格突變拐點無法及時響應(yīng)。

        表1 EMD與SVM組合模型預(yù)測結(jié)果評價表

        圖4 各種方法預(yù)測對比折線圖

        評價指標(biāo)EMD與SVM組合模型單純SVM模型BP神經(jīng)網(wǎng)絡(luò)模型ARIMA模型RMSE/(元·kg-1)0.0330.0700.0690.088MAPE/%1.2312.6222.5942.902

        3 結(jié)論與展望

        文中以中藥材天地網(wǎng)40頭規(guī)格三七的歷史價格時間序列為原始實驗數(shù)據(jù),針對傳統(tǒng)單一算法模型預(yù)測精度不高以及對價格突變點不能及時響應(yīng)的情況,提出了一種EMD與SVM組合模型的預(yù)測方法。先對原始時間序列做4階EMD分解,依據(jù)各階EMD分量的變化規(guī)律,分別選擇相應(yīng)的核函數(shù)并進行SVM回歸分析,并將各EMD分量的預(yù)測結(jié)果疊加得到最終預(yù)測值。通過對比實驗證實組合算法模型比單一模型具有明顯的優(yōu)勢,EMD與SVM組合模型提高了預(yù)測精度,特別是可以較精確地預(yù)測到價格突變點。當(dāng)然本文算法仍需進一步改進,如在SVM最優(yōu)參數(shù)估計的方法上、EMD分解階數(shù)的確定方面均需進一步研究。

        猜你喜歡
        模態(tài)信號模型
        一半模型
        信號
        鴨綠江(2021年35期)2021-04-19 12:24:18
        重要模型『一線三等角』
        完形填空二則
        重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
        基于FPGA的多功能信號發(fā)生器的設(shè)計
        電子制作(2018年11期)2018-08-04 03:25:42
        3D打印中的模型分割與打包
        基于LabVIEW的力加載信號采集與PID控制
        國內(nèi)多模態(tài)教學(xué)研究回顧與展望
        基于HHT和Prony算法的電力系統(tǒng)低頻振蕩模態(tài)識別
        又爽又黄又无遮挡的视频| 天堂av在线播放观看| 日本一区二区三区综合视频| 无码一区二区三区| 蜜桃视频一区二区三区在线观看| 亚洲产在线精品亚洲第一站一| 国产成人夜色在线视频观看 | 国产成人av大片大片在线播放| 久草视频国产| 农村国产毛片一区二区三区女| 精品在线视频在线视频在线视频| 真实国产老熟女无套中出| 久久精品国产精品青草色艺| 亚洲一区二区三区中文视频| 亚洲成年国产一区二区| 亚洲综合在线一区二区三区| 伊人久久大香线蕉免费视频| 亚洲高清国产拍精品熟女| 亚洲一区二区三区,日本| 日本无码人妻波多野结衣| 亚洲区日韩精品中文字幕| 国产av午夜精品一区二区入口| 新婚人妻不戴套国产精品| 国产又色又爽无遮挡免费| 亚洲国产剧情在线精品视| 不卡视频在线观看网站| 国产免费一区二区三区免费视频| 国际无码精品| 亚洲国产精品一区亚洲国产| 婷婷久久国产综合精品| 国产精品久久久久久影视| 亚洲中文字幕av天堂| 男女上床免费视频网站| 国产农村熟妇videos| 亚洲一区二区综合色精品| 国产自拍伦理在线观看| 亚洲自偷精品视频自拍| 国产亚洲视频在线观看网址| 国产黄色精品高潮播放| 丝袜美腿av在线观看| 国产精品无码a∨精品影院|