王雪蓉,萬年紅
浙江東方職業(yè)技術(shù)學(xué)院 信息傳媒與自動(dòng)化學(xué)院,浙江 溫州 325011)(*通信作者電子郵箱wnhhong@126.com)
基于跨境電商可控關(guān)聯(lián)性大數(shù)據(jù)的出口產(chǎn)品銷量動(dòng)態(tài)預(yù)測模型
王雪蓉,萬年紅*
浙江東方職業(yè)技術(shù)學(xué)院 信息傳媒與自動(dòng)化學(xué)院,浙江 溫州 325011)(*通信作者電子郵箱wnhhong@126.com)
目前流行的外貿(mào)產(chǎn)品銷量預(yù)測方法單純地分別從第三方平臺或大數(shù)據(jù)角度研究預(yù)測問題,對互聯(lián)網(wǎng)平臺、跨境電商、大數(shù)據(jù)融合應(yīng)用于產(chǎn)品銷量動(dòng)態(tài)演化預(yù)測的考慮不足。為提高出口產(chǎn)品銷量預(yù)測效果,實(shí)現(xiàn)預(yù)測系統(tǒng)的伸縮性和動(dòng)態(tài)演化性,基于研究“互聯(lián)網(wǎng)+外貿(mào)”環(huán)境下跨境電商出口產(chǎn)品銷量可控關(guān)聯(lián)性大數(shù)據(jù)挖掘、個(gè)性化預(yù)測機(jī)制、智慧預(yù)測算法,改進(jìn)分布式定量、集中式定性計(jì)算等相應(yīng)算法,提出一個(gè)“互聯(lián)網(wǎng)+外貿(mào)”驅(qū)動(dòng)下基于跨境電商可控關(guān)聯(lián)性大數(shù)據(jù)的出口產(chǎn)品銷量動(dòng)態(tài)預(yù)測模型,并進(jìn)行了應(yīng)用實(shí)驗(yàn),對各種模型的實(shí)驗(yàn)結(jié)果進(jìn)行對比分析。實(shí)驗(yàn)結(jié)果表明,該模型充分融合了“互聯(lián)網(wǎng)+”的開放性、可延伸性和大數(shù)據(jù)動(dòng)態(tài)預(yù)測優(yōu)勢,實(shí)現(xiàn)了“互聯(lián)網(wǎng)+外貿(mào)”環(huán)境下基于跨境電商可控關(guān)聯(lián)性大數(shù)據(jù)的出口產(chǎn)品銷量動(dòng)態(tài)、智慧、定量定性預(yù)測。該模型綜合預(yù)測效果明顯優(yōu)于傳統(tǒng)模型,具有較強(qiáng)的動(dòng)態(tài)演化性和較高的實(shí)用價(jià)值。
互聯(lián)網(wǎng)+外貿(mào);跨境電商;可控關(guān)聯(lián)性大數(shù)據(jù);出口產(chǎn)品銷量;動(dòng)態(tài)預(yù)測
“互聯(lián)網(wǎng)+外貿(mào)”環(huán)境下跨境電商活動(dòng)比較復(fù)雜,出口產(chǎn)品銷量預(yù)測受到需求、關(guān)稅、物流、風(fēng)險(xiǎn)等多種因素的影響[1],但“互聯(lián)網(wǎng)+外貿(mào)”跨境電商的核心是具有預(yù)測優(yōu)勢的大數(shù)據(jù),這使得其出口產(chǎn)品銷量預(yù)測相對容易,因此,設(shè)計(jì)一種“互聯(lián)網(wǎng)+外貿(mào)”驅(qū)動(dòng)下準(zhǔn)確、安全、高效的基于跨境電商可控關(guān)聯(lián)性大數(shù)據(jù)的出口產(chǎn)品銷量預(yù)測模型已經(jīng)成為備受矚目的熱門課題。目前,對產(chǎn)品銷量預(yù)測的研究,文獻(xiàn)[2-5]分別基于大數(shù)據(jù)分類方法、相關(guān)性分組規(guī)則、在線聚類方法以及互聯(lián)網(wǎng)大數(shù)據(jù)匹配原則、語義分析、行為分析方法挖掘第三方平臺中海量的跨境電商數(shù)據(jù)并建立了產(chǎn)品需求回歸預(yù)測模型;文獻(xiàn)[6-10]分別利用跨境電商歷史銷量數(shù)據(jù)建立產(chǎn)品銷量預(yù)測模型;文獻(xiàn)[11-15]通過定量和定性分析方法根據(jù)歷史數(shù)據(jù)、流行度、新產(chǎn)品客戶價(jià)值提出了基于大數(shù)據(jù)的預(yù)測模型。以上研究具有借鑒作用,但由于“互聯(lián)網(wǎng)+”戰(zhàn)略提出時(shí)間較短,“互聯(lián)網(wǎng)+”強(qiáng)大的大數(shù)據(jù)在線預(yù)測優(yōu)勢沒有顯現(xiàn),以上研究對于如何在“互聯(lián)網(wǎng)+外貿(mào)”環(huán)境下融合運(yùn)用大數(shù)據(jù)到跨境電商出口產(chǎn)品銷量動(dòng)態(tài)智慧的預(yù)測中目前并沒有一個(gè)比較深入、有效的研究。
本文針對目前研究現(xiàn)狀,從“互聯(lián)網(wǎng)+外貿(mào)”環(huán)境下跨境電商出口產(chǎn)品銷量可控關(guān)聯(lián)性大數(shù)據(jù)挖掘、個(gè)性化預(yù)測機(jī)制、智慧預(yù)測算法等角度,嘗試設(shè)計(jì)一個(gè)可量化、動(dòng)態(tài)、智慧的“互聯(lián)網(wǎng)+外貿(mào)”驅(qū)動(dòng)下基于跨境電商可控關(guān)聯(lián)性大數(shù)據(jù)的出口產(chǎn)品銷量動(dòng)態(tài)預(yù)測模型(Dynamic Prediction Model on Export Sales based on controllable relevance big data of cross-border e-commerce, DPMES),著重實(shí)現(xiàn)出口產(chǎn)品銷量的動(dòng)態(tài)預(yù)測目標(biāo),以便更好地指導(dǎo)外貿(mào)企業(yè)營銷和優(yōu)化庫存策略,同時(shí)也促進(jìn)互聯(lián)網(wǎng)+、大數(shù)據(jù)、跨境電商技術(shù)的創(chuàng)新研究與應(yīng)用發(fā)展。
圖1 “互聯(lián)網(wǎng)+外貿(mào)”環(huán)境下跨境電商出口產(chǎn)品銷量可控關(guān)聯(lián)性大數(shù)據(jù)挖掘模型
1.1 可控關(guān)聯(lián)性銷量大數(shù)據(jù)定義
定義1 可控關(guān)聯(lián)性。
可控關(guān)聯(lián)性是指影響研究結(jié)果的多個(gè)現(xiàn)象之間的可以控制的相互關(guān)聯(lián)的性質(zhì)[16]。算法如下:假設(shè)u、v分別為兩類產(chǎn)品,論域Iuv=Iu∪Iv是“互聯(lián)網(wǎng)+外貿(mào)”定量空間,作為現(xiàn)象的集合;空間中的數(shù)據(jù)源矢量D=(Iuv,Iu,Iv);I={I1,I2,…,In}是對象項(xiàng)目集合;ui和vi∈Iuv是定性概念ui和vi的一次定量信任約束;m×n階矩陣R是基本用戶的評分矩陣;ui和vi的確定度μ(ui)和μ(vi)∈[0,1]是有穩(wěn)定傾向的隨機(jī)數(shù);給定目標(biāo)用戶ai及其評分向量A(1,n);μ:Iuv→[0,n],?ui∈Iuv,ui→μ(ui);對于?i∈Iuv,假設(shè)定量信任約束ui和vi之間的屬性信任為S(ui,vi),將S(ui,vi)最大的n個(gè)基本數(shù)據(jù)組成集合。輸入兩個(gè)對象消息對m1和m2,對非False公鑰,若m1∧m2返回值為False,則m1和m2可控關(guān)聯(lián)無效;若返回值為非True,則m1和m2存在可控關(guān)聯(lián)。
定義2 可控關(guān)聯(lián)性銷量大數(shù)據(jù)。
可控關(guān)聯(lián)性銷量大數(shù)據(jù)指滿足以上算法的大數(shù)據(jù),其算法如下:假設(shè)產(chǎn)品u和目標(biāo)產(chǎn)品v的評分大數(shù)據(jù)項(xiàng)集合分別為Iu={ui|i∈N+}和Iv={vi|i∈N},若Iv≤Iu,即對于?i∈Iv,都有i∈Iu成立,定量值ui,vi∈Iuv是定性概念的一次隨機(jī)實(shí)現(xiàn),則產(chǎn)品v的所有評分大數(shù)據(jù)項(xiàng)都已被產(chǎn)品u評價(jià)過,因此v不可能向u推薦可控關(guān)聯(lián);若Iv>Iu,即對于?i∈Iu,都有i∈Iv成立,且當(dāng)μ:Iuv→[0,1],有?ui∈Iuv,ui→μ(ui),則產(chǎn)品u的所有評分大數(shù)據(jù)項(xiàng)都已被產(chǎn)品v評價(jià)過,因此產(chǎn)品v的大數(shù)據(jù)必定與u可控關(guān)聯(lián)。
1.2 跨境電商出口產(chǎn)品銷量可控關(guān)聯(lián)性大數(shù)據(jù)挖掘
“互聯(lián)網(wǎng)+外貿(mào)”環(huán)境下基于跨境電商的出口產(chǎn)品大數(shù)據(jù)挖掘首先基于“互聯(lián)網(wǎng)+外貿(mào)”環(huán)境平臺(本平臺由對外貿(mào)易經(jīng)濟(jì)合作部牽頭,集中部署在國家互聯(lián)網(wǎng)中心),挖掘政策、產(chǎn)品種類、客戶總產(chǎn)品需求、交易群體、客戶購買心理、支付、報(bào)價(jià)、關(guān)稅、庫存、物流、訂單、合同以及信譽(yù)、商品質(zhì)量風(fēng)險(xiǎn)、退貨或換貨率、假冒偽劣產(chǎn)品、虛假宣傳等數(shù)據(jù)。需要挖掘影響出口產(chǎn)品銷量預(yù)測的關(guān)鍵因素和可控關(guān)聯(lián)性大數(shù)據(jù)。挖掘模型如圖1所示。
具體挖掘流程和方法如下:
步驟1 設(shè)計(jì)基于預(yù)測行為的大數(shù)據(jù)在線分類與估計(jì)函數(shù),對影響預(yù)測的可控關(guān)聯(lián)性指標(biāo)大數(shù)據(jù)進(jìn)行在線估計(jì)和歸類,確定大數(shù)據(jù)挖掘方向。文獻(xiàn)[2]已有大數(shù)據(jù)分類相關(guān)方法的運(yùn)用,但沒有明確刻畫數(shù)據(jù)的模糊現(xiàn)象,且沒有融入互聯(lián)網(wǎng)思維,不能實(shí)現(xiàn)互聯(lián)網(wǎng)大數(shù)據(jù)在線分類功能,在此需要進(jìn)行改進(jìn),提出基于預(yù)測行為的大數(shù)據(jù)在線分類與估計(jì)方法。
假設(shè):在1.1節(jié)算法基礎(chǔ)上,給定數(shù)據(jù)挖掘論域C及其非空子集A,(C,A)={(Ci,Ai)|i∈N+}定義為可信性測度集合,S={Si=(Si1,Si2,Si3)|i∈N+}表示“互聯(lián)網(wǎng)+外貿(mào)”環(huán)境下第三方平臺上文檔和日志的集合,包括n個(gè)元素;SAM={SAMi|i∈N+}和SAB={SABi|i∈N+}分別表示數(shù)據(jù)模糊現(xiàn)象和不確定性現(xiàn)象集合;分類主體與客體映射函數(shù)為F1=(FSi→FCi)。若彐Ci∈C∧(Ci,Ai)∧(Si1,Si2,Si3)∧SAM∧SAB≠False,則基于預(yù)測行為的大數(shù)據(jù)在線分類與估計(jì)方法可用如式(1)所示的函數(shù)CF(i)表示:
(1)
改進(jìn)后的CF(i)將模糊現(xiàn)象和不確定性現(xiàn)象各自映射到不同的(Ci,Ai)中。這比改進(jìn)前的方法更能刻畫互聯(lián)網(wǎng)大數(shù)據(jù)在線分類的模糊和不確定性。
步驟2 設(shè)計(jì)關(guān)聯(lián)規(guī)則函數(shù),找出這些可控關(guān)聯(lián)性大數(shù)據(jù)之間的關(guān)聯(lián)規(guī)律性進(jìn)而整理可利用數(shù)據(jù)源。文獻(xiàn)[3]提出了一個(gè)相關(guān)性分組規(guī)則,但該規(guī)則僅僅是對數(shù)據(jù)初步的相關(guān),關(guān)聯(lián)精度低,因此需要改進(jìn),提出更精確的關(guān)聯(lián)規(guī)則函數(shù)。
(2)
改進(jìn)后式(2)的作用就在于準(zhǔn)確實(shí)現(xiàn)了可控關(guān)聯(lián)性出口產(chǎn)品銷量大數(shù)據(jù)之間的關(guān)聯(lián)規(guī)律性。
步驟3 設(shè)計(jì)聚類功能更強(qiáng)的在線k-Means聚類與描述函數(shù),使已歸類可控關(guān)聯(lián)性大數(shù)據(jù)相似性盡可能大,劃分?jǐn)?shù)據(jù)塊。文獻(xiàn)[4]提出了一種在線聚類方法,然而該方法劃分的數(shù)據(jù)塊明顯存在越界現(xiàn)象。由于k-Means聚類方法具有關(guān)聯(lián)聚類的功能,因此本文結(jié)合這兩種方法進(jìn)行改進(jìn),設(shè)計(jì)一個(gè)在線k-Means聚類與描述方法。
在式(2)定義基礎(chǔ)上,假設(shè)預(yù)測主體、客體推薦的權(quán)重分別為ω1,ω2;聚類推薦集合為TJ={tj1,tj2,…,tjn},相關(guān)聯(lián)描述的期望值Qx(tji,tjj)=TS(SAMii,SABi)·e(Si,Sj),熵值Qn(tji,tjj)=TS(SAMii,SABi)+e(Si,Sj),超熵值Qe(tji,tjj)=TS(SAMii,SABi)/e(Si,Sj),則改進(jìn)的在線k-Means聚類與描述方法可用式(3)所示的函數(shù)動(dòng)態(tài)表示:
(3)
改進(jìn)式(3)的作用就在于可以盡可能有效地劃分相似性“互聯(lián)網(wǎng)+外貿(mào)”跨境電商產(chǎn)品銷量數(shù)據(jù)塊。
步驟4 運(yùn)用文獻(xiàn)[5]提出的互聯(lián)網(wǎng)大數(shù)據(jù)匹配原則、語義分析、行為分析方法,針對主要用戶合理匹配保留可控關(guān)聯(lián)性銷量大數(shù)據(jù)的高度演化特征,通過線上或線下方式將影響預(yù)測的關(guān)鍵的可控關(guān)聯(lián)性大數(shù)據(jù)導(dǎo)入,集成到互聯(lián)網(wǎng)大數(shù)據(jù)倉庫、跨境電商平臺管理后臺和外部應(yīng)用程序接口,實(shí)現(xiàn)關(guān)鍵因子的集成,較好地解決了主體客體屬性混淆、語義控制矩陣體現(xiàn)預(yù)測行為域間映射的問題。
1.3 個(gè)性化預(yù)測機(jī)制
根據(jù)圖1所示模型,構(gòu)建如下個(gè)性化預(yù)測機(jī)制:
1)“增量演化-集成”式預(yù)測機(jī)制。
2)“隨機(jī)分布-關(guān)聯(lián)”式預(yù)測機(jī)制。
為定量定性實(shí)現(xiàn)個(gè)性化預(yù)測,需以數(shù)學(xué)形式來表達(dá)這兩種機(jī)制。C&M-CVPDSS(Case-based and Multiplicative analytic hierarchy process-based Customer Value Prediction Decision Support System)[11]較好表達(dá)了這種機(jī)制,但其對新產(chǎn)品關(guān)鍵數(shù)據(jù)在隨機(jī)分布、關(guān)聯(lián)、演化、集成的指標(biāo)化和相似度評估方面表現(xiàn)不足,因此,下面在1.1節(jié)可控關(guān)聯(lián)性大數(shù)據(jù)定義和式(1)~(3)的基礎(chǔ)上,對C&M-CVPDSS進(jìn)行改進(jìn)。
假設(shè)個(gè)性化的機(jī)器學(xué)習(xí)、神經(jīng)網(wǎng)絡(luò)的參照樣本庫并集為mint={CER(C1C1),CER(C2C2),…,CER(CiCj)},某一個(gè)由市場需求、交易對象、市場運(yùn)作、交易內(nèi)容集成問題組成的隨機(jī)分布、關(guān)聯(lián)、演化問題集為AAT={AAi|i∈N+},數(shù)據(jù)分配函數(shù)[12]為G(Ci,Cj)=(CER(CiCj)/n,m),根據(jù)增量演化因子屬性和隨機(jī)分布因子屬性元組,則“增量演化-集成”式預(yù)測機(jī)制和“隨機(jī)分布-關(guān)聯(lián)”式預(yù)測機(jī)制可分別用式(4)、(5)所示的數(shù)學(xué)函數(shù)來表達(dá):
(4)
(5)
其中:DT表示自動(dòng)實(shí)現(xiàn)從復(fù)雜的增量演化、集成指標(biāo)到具體的機(jī)制轉(zhuǎn)換;DTT表示自動(dòng)實(shí)現(xiàn)從抽象的隨機(jī)分布、關(guān)聯(lián)指標(biāo)和相似度評估到具體的模式轉(zhuǎn)換。式(4)、(5)自動(dòng)實(shí)現(xiàn)從抽象的隨機(jī)分布、關(guān)聯(lián)、演化、集成指標(biāo)和相似度評估到具體的機(jī)制、模式轉(zhuǎn)換。
1.4DPMES的智慧預(yù)測算法
步驟1 按式(1)對CF(i)求解,按預(yù)測方向進(jìn)行操作,當(dāng)CF(i)值域不為空集時(shí),則“互聯(lián)網(wǎng)+外貿(mào)”環(huán)境下可控關(guān)聯(lián)性出口產(chǎn)品銷量大數(shù)據(jù)預(yù)測資源規(guī)劃設(shè)計(jì)與集成策略如式(6)所示:
(6)
利用式(6)提取可控關(guān)聯(lián)性預(yù)測影響因素,在線智慧分類,使預(yù)測實(shí)體間具有嚴(yán)格的物理映射關(guān)系。
步驟2 設(shè)計(jì)動(dòng)態(tài)預(yù)測智慧集成策略,對預(yù)測構(gòu)件進(jìn)行動(dòng)態(tài)地加入或刪除操作。按式(2)計(jì)算模糊變量的定義域,抽取出DT的最大值DTmax和DTT的最小值DTTmin,選取若干個(gè)滿足取值范圍為[DTTmin,DTmax]的預(yù)測構(gòu)件。集成策略可用如式(7)所示的約束系數(shù)λ表示:
(7)
步驟3 按照式(7),抽取K1和K2中所有屬于(C,A)的任意滿足閾值ω0的ξ,尋找最佳搜索時(shí)間Ti。通過式(2)~(3)發(fā)現(xiàn)數(shù)據(jù)可控關(guān)聯(lián)性和規(guī)律性?;诋a(chǎn)品標(biāo)識失效預(yù)測方法[14],設(shè)計(jì)可控關(guān)聯(lián)性出口產(chǎn)品銷量大數(shù)據(jù)動(dòng)態(tài)預(yù)測評估集成策略,其函數(shù)如式(8)所示,即計(jì)算CVV(Si,Sj)對Qn(tji,tjj)的動(dòng)態(tài)優(yōu)化集成的隸屬度M(Si,Sj):
M(Si,Sj)=CVV(Si,Sj)·λ·DT·DTT
(8)
步驟4 根據(jù)式(4)~(5)增量演化因子屬性和隨機(jī)分布因子屬性劃分預(yù)測行為類屬BT,目標(biāo)預(yù)測評分與實(shí)際評分之間的偏差為MAE,并使得簇之間的相似度達(dá)到最小值,而μ(x)和μ(y)之間的相似度達(dá)到最大值,將具備不同評分特征的若干目標(biāo)預(yù)測行為劃入隸屬度不同的行為子集中,實(shí)現(xiàn)協(xié)同過濾推薦。
步驟5 設(shè)計(jì)作為本文算法最關(guān)鍵算法的分布式定量、集中式定性等動(dòng)態(tài)優(yōu)化預(yù)測方法。文獻(xiàn)[11-15]運(yùn)用定量定性方法來解決動(dòng)態(tài)優(yōu)化問題,但沒有較好解決分布式和集中式優(yōu)化計(jì)算問題。而多元線性回歸方法[2-5,12]根據(jù)關(guān)鍵因子采用二維表,能較好地解決數(shù)據(jù)的分布式、集中式、相關(guān)性預(yù)測問題,因此本文基于此方法對定量和定性方法進(jìn)行如下改進(jìn):根據(jù)Qe(tji,tjj)計(jì)算所有的M(Si,Sj),各節(jié)點(diǎn)根據(jù)其所有鄰居節(jié)點(diǎn)當(dāng)前位置,動(dòng)態(tài)地選擇下一個(gè)簇頭節(jié)點(diǎn)。
為此按順序分別令集群、分割、孤立點(diǎn)為:
(9)
則分布式定量計(jì)算、集中式定性計(jì)算函數(shù)分別如式(10)、(11)所示,定量、定性預(yù)測出口產(chǎn)品銷量。
(10)
(11)
步驟6 設(shè)(CiCj)max和(CiCj)min分別表示CiCj的最大值和最小值。重復(fù)步驟1~5,將Ci的代碼特征CiCj固定在閾值區(qū)間[ωi,ωj],判斷(CiCj)max>ωi∧(CiCj)min<ωj是否成立,若成立采用式(10)從海量大數(shù)據(jù)中查找產(chǎn)品正常的可控關(guān)聯(lián)性大數(shù)據(jù),構(gòu)建分布式定量計(jì)算系統(tǒng),得出定量預(yù)測結(jié)果;若不成立,采用式(11)從時(shí)空上將被求解的問題集群,建立集中式定性智慧預(yù)測模型。
步驟7 設(shè)計(jì)如式(12)所示的并行式綜合預(yù)測函數(shù)公式:
TCZ(Si)=TCX(Si)λ·TCL(Si)Ti
(12)
至此,算法結(jié)束。
通過上述個(gè)性化預(yù)測機(jī)制和智慧預(yù)測算法,運(yùn)用決策樹構(gòu)建DPMES動(dòng)態(tài)預(yù)測模型,如圖2所示。
構(gòu)建路徑如下:
首先,根據(jù)智慧預(yù)測算法步驟1,確定預(yù)測目標(biāo)及選擇用于建模的數(shù)據(jù)樣本范圍,并篩選、過濾得到具有預(yù)測特征和能力的若干因子。
其次,根據(jù)智慧預(yù)測算法步驟2~3,歸納可控關(guān)聯(lián)性關(guān)鍵因子,利用“增量演化-集成”和“隨機(jī)分布-關(guān)聯(lián)”式預(yù)測機(jī)制驗(yàn)證關(guān)鍵特征數(shù)據(jù)序列一致性、可控關(guān)聯(lián)性和規(guī)律性,量化各種隨機(jī)分布的出口產(chǎn)品銷量關(guān)鍵影響因素間的增量演化、集成關(guān)系,并利用λ動(dòng)態(tài)地加入或刪除預(yù)測構(gòu)件。整合關(guān)鍵因子,預(yù)備、估算、清洗、非線性變換和校驗(yàn)數(shù)據(jù)。
然后,根據(jù)算法步驟4實(shí)現(xiàn)協(xié)同過濾推薦,劃分預(yù)測行為子集。
再次,根據(jù)式(10)~(12)集中實(shí)時(shí)跟蹤可控關(guān)聯(lián)性大數(shù)據(jù)流,合成、錯(cuò)位對齊互聯(lián)網(wǎng)大數(shù)據(jù)搜索指數(shù),選出具有最大搜索指數(shù)的關(guān)鍵數(shù)據(jù)作為基準(zhǔn)指數(shù),構(gòu)建模型,在線重配、賦予并行式大數(shù)據(jù)權(quán)重和相關(guān)系數(shù),集中式定性預(yù)測哪些潛在客戶最可能成為消費(fèi)者和交易者,并對可能的交易線索進(jìn)行顯著性檢驗(yàn),分布式定量預(yù)測下一周期的銷售量,實(shí)時(shí)預(yù)測出口產(chǎn)品未來銷量結(jié)構(gòu)走勢。
最后,模型評價(jià)與應(yīng)用。對每種預(yù)測方法的預(yù)測結(jié)果進(jìn)行誤差分析,如果方法綜合時(shí)對前幾期預(yù)測結(jié)果的平均誤差越大,那么綜合預(yù)測時(shí)應(yīng)該使該方法對綜合預(yù)測結(jié)果的影響程度越小。決策樹根據(jù)篩選過濾出的權(quán)重和相關(guān)系數(shù)進(jìn)一步劃分出葉節(jié)點(diǎn),待模型穩(wěn)定后即可得到銷量的綜合預(yù)測值,并據(jù)此實(shí)現(xiàn)庫存策略的優(yōu)化,實(shí)現(xiàn)模型應(yīng)用。
圖2 DPMES動(dòng)態(tài)預(yù)測模型
根據(jù)圖1~2,前端采用Java語言(或C#/C+),后臺采用開源PHP和SQLServer構(gòu)建動(dòng)態(tài)預(yù)測系統(tǒng)。
3.1 實(shí)驗(yàn)數(shù)據(jù)收集
本文所采用的數(shù)據(jù)均來自2015年1月至2016年7月阿里巴巴全球速賣通平臺、對外貿(mào)易經(jīng)濟(jì)合作部“互聯(lián)網(wǎng)+外貿(mào)”平臺、中國跨境電商綜合服務(wù)平臺、國家統(tǒng)計(jì)局固定產(chǎn)品銷量指標(biāo)統(tǒng)計(jì)平臺、浙江省跨境電商公共服務(wù)平臺這5個(gè)平臺內(nèi)關(guān)于皮鞋、機(jī)械、電器等制造業(yè)出口產(chǎn)品的10 000條固定數(shù)據(jù)以及平臺外的若干實(shí)際動(dòng)態(tài)數(shù)據(jù)。根據(jù)1.2節(jié)大數(shù)據(jù)挖掘模型,采用關(guān)鍵詞挖掘工具從“銷量關(guān)注度”和“因子關(guān)注度”兩個(gè)維度去描述關(guān)鍵詞,并以一周為一個(gè)更新周期。數(shù)據(jù)分析如表1所示。
表1 實(shí)驗(yàn)數(shù)據(jù)分析
3.2 實(shí)驗(yàn)結(jié)果對比分析
實(shí)驗(yàn)1 用以上10 000條固定數(shù)據(jù),驗(yàn)證改進(jìn)方法及基于改進(jìn)方法的個(gè)性化預(yù)測機(jī)制和智慧預(yù)測算法的合理性。過程如下:
1)驗(yàn)證產(chǎn)品v的大數(shù)據(jù)必與產(chǎn)品u可控關(guān)聯(lián),E(x)=b按CF(i)進(jìn)行約束,計(jì)算隸屬度、關(guān)鍵數(shù)據(jù)隨機(jī)分布、關(guān)聯(lián)、演化、集成的指標(biāo)化和相似度評估,驗(yàn)證式(1)~(9)有效性。
2)驗(yàn)證式(10)~(12)分布式定量、集中式定性預(yù)測、并行式綜合預(yù)測函數(shù)。
驗(yàn)證指標(biāo)包括重配誤差(出口產(chǎn)品銷量大數(shù)據(jù)間存在的重新匹配差異)、特征點(diǎn)誤差(出口產(chǎn)品銷量可控關(guān)聯(lián)性特征匹配的差異)、誤配率(出口產(chǎn)品銷量可控關(guān)聯(lián)性大數(shù)據(jù)發(fā)生錯(cuò)誤匹配的比率),計(jì)算公式參見文獻(xiàn)[13-15]的互聯(lián)網(wǎng)搜索誤差均方。為更好地表達(dá)誤差關(guān)系,對該誤差均方添加ω0線性參數(shù)為(b1,b2,…,bn),則重配誤差、特征點(diǎn)誤差、誤配率公式分別用如式(13)所示的CPW(v,u)、APW(v,u)、WPR(v,u)函數(shù)表示:
(13)
驗(yàn)證結(jié)果分析如圖3所示。從圖3可以看出:重配誤差散點(diǎn)圖、特征點(diǎn)誤差散點(diǎn)圖、誤配率散點(diǎn)圖均為單調(diào)、并行遞增形式,當(dāng)散點(diǎn)圖平滑趨近時(shí)則說明個(gè)性化預(yù)測機(jī)制更靠近實(shí)際預(yù)測結(jié)果;當(dāng)分析先行的歸一化擬合數(shù)據(jù)指標(biāo)對出口產(chǎn)品銷量波動(dòng)的預(yù)測效率時(shí),以改進(jìn)算法作為引導(dǎo)方法的預(yù)測效率最高。這說明對改進(jìn)方法以及基于此的個(gè)性化預(yù)測機(jī)制和智慧預(yù)測算法的設(shè)計(jì)是科學(xué)合理的。
圖3 改進(jìn)算法驗(yàn)證結(jié)果直觀散點(diǎn)圖
實(shí)驗(yàn)2 基于實(shí)驗(yàn)1,仍然使用以上10 000條固定數(shù)據(jù)進(jìn)行10 000次實(shí)驗(yàn),實(shí)驗(yàn)獲得的平均值作為結(jié)果數(shù)據(jù),將DPMES與文獻(xiàn)[2-5]所建模型及C&M-CVPDSS模型[11]、產(chǎn)品標(biāo)識失效預(yù)測模型[14]的性能進(jìn)行對比。
評價(jià)本實(shí)驗(yàn)結(jié)果的指標(biāo)[1-15]如下:可信性測度,即表示預(yù)測結(jié)果的可信程度,參考值為16~22;不確定性區(qū)分度,即區(qū)分預(yù)測結(jié)果的多種可能狀態(tài)的程度,參考值為10~15;最佳搜索時(shí)間,即衡量動(dòng)態(tài)預(yù)測整體耗費(fèi)的時(shí)間,參考值為10~15 s;誤差系數(shù),由重配誤差、特征點(diǎn)誤差、誤配率公式綜合得出,參考值為5~7;可控關(guān)聯(lián)度,該指標(biāo)和以上4個(gè)指標(biāo)相聯(lián)系,參考值為10~14。具體計(jì)算過程見文獻(xiàn)[1-15],其公式按順序分別用式(14)~(18)所示的函數(shù)表示:
(14)
(15)
(16)
(17)
(18)
實(shí)驗(yàn)結(jié)果如表2所示。
表2 各種模型的性能對比
從表2可以發(fā)現(xiàn),當(dāng)固定銷量指標(biāo)大于期望值時(shí),即產(chǎn)品銷售趨熱時(shí),對增量指標(biāo)的預(yù)測更接近平穩(wěn)、準(zhǔn)確的實(shí)際預(yù)測值;反之則銷量同比減少率在風(fēng)險(xiǎn)線附近徘徊。無論是產(chǎn)品銷量期望預(yù)測指標(biāo)還是實(shí)際預(yù)測指標(biāo),DPMES的綜合預(yù)測效果明顯優(yōu)于其他模型。
實(shí)驗(yàn)3 分別通過以上5個(gè)平臺的樣本外預(yù)測和波動(dòng)預(yù)測考察DPMES的未來預(yù)測效率。
1)樣本外分布式定量、集中式定性預(yù)測效率。
固定指標(biāo)樣本外預(yù)測的均方誤差為:
(19)
根據(jù)MSE(Si)計(jì)算樣本外預(yù)測的分布式定量、集中式定性誤差百分比,可以采用以下方法對比預(yù)測結(jié)果:使用CV(Si,Sj)的多維分解方法和可聯(lián)性等級,考慮CVV(Si,Sj)對誤差關(guān)系的影響,在同比增長率偏低時(shí)下一周期預(yù)測誤差達(dá)到最大;考慮TCZ(Si)對隨機(jī)預(yù)測信任關(guān)系的影響,預(yù)測誤差具有可比性。
2)并行式綜合波動(dòng)預(yù)測效率。
基于前期的平臺內(nèi)固定和平臺外若干實(shí)際動(dòng)態(tài)樣本數(shù)據(jù),同樣利用式(10)~(19),對預(yù)測時(shí)間段進(jìn)行波動(dòng)預(yù)測以并行式綜合考察DPMES預(yù)測效果對出口產(chǎn)品銷量未來一年(分四個(gè)季度)波動(dòng)的預(yù)測效率。評價(jià)指標(biāo)有預(yù)測誤差比率(總體預(yù)測結(jié)果的誤差比)、置信度(表示為近期的出口產(chǎn)品銷量波動(dòng)預(yù)測精度的置信程度)、庫存優(yōu)化效率(根據(jù)綜合預(yù)測結(jié)果的庫存優(yōu)化性價(jià)比)等,具體計(jì)算過程見文獻(xiàn)[13-15],其計(jì)算公式按順序分別用式(20)~(22)所示的函數(shù)表示:
(20)
(21)
(22)
預(yù)測結(jié)果如表3所示。從表3可看出,各季度銷量預(yù)測值呈增長趨勢,而預(yù)測誤差比率、置信度、庫存優(yōu)化效率基本上在可接受的范圍內(nèi)?;诟骷径鹊牟⑿惺骄C合預(yù)測結(jié)果,可以計(jì)算出各季度的累積增長率,這與實(shí)際的結(jié)果非常接近,因此基于平臺內(nèi)和平臺外樣本數(shù)據(jù)的DPMES預(yù)測結(jié)果對出口產(chǎn)品銷量波動(dòng)有較髙的預(yù)測精度和庫存效率。
表3 基于平臺內(nèi)和平臺外樣本數(shù)據(jù)的DPMES預(yù)測結(jié)果
基于預(yù)測行為的大數(shù)據(jù)在線分類與估計(jì)方法、關(guān)聯(lián)規(guī)則函數(shù)、在線k-Means聚類與描述函數(shù)以及個(gè)性化預(yù)測機(jī)制、分布式定量、集中式定性、并行式綜合預(yù)測方法建立起來的DPMES預(yù)測算法和模型具有科學(xué)性、合理性,解決了一些理論和實(shí)際問題,充分融合了“互聯(lián)網(wǎng)+”的開放性、可延伸性、在線化和大數(shù)據(jù)動(dòng)態(tài)演化性及預(yù)測優(yōu)勢,實(shí)現(xiàn)了“互聯(lián)網(wǎng)+外貿(mào)”驅(qū)動(dòng)環(huán)境下基于跨境電商可控關(guān)聯(lián)性大數(shù)據(jù)的出口產(chǎn)品銷量動(dòng)態(tài)、智慧、定量化、定性化預(yù)測,對外貿(mào)企業(yè)高效營銷、制訂高效的庫存規(guī)劃具有參考價(jià)值。
但是,鑒于“互聯(lián)網(wǎng)+”、大數(shù)據(jù)都是高度復(fù)雜的技術(shù),本文的研究僅僅對互聯(lián)網(wǎng)+和大數(shù)據(jù)技術(shù)進(jìn)行應(yīng)用,雖然實(shí)際過程中也對這些計(jì)算機(jī)科學(xué)技術(shù)進(jìn)行了創(chuàng)新,但是并不容易實(shí)現(xiàn),從而一定程度上降低了系統(tǒng)的性能,因此今后本文作者將繼續(xù)對互聯(lián)網(wǎng)+、跨境電商、大數(shù)據(jù)技術(shù)及融合算法繼續(xù)展開研究。
References)
[1] 王翀.跨境電商是有出有進(jìn)的“互聯(lián)網(wǎng)+外貿(mào)”[J]. 杭州(周刊), 2015(14):20-21.(WANG C. Cross-border e-commerce is the “Internet+foreign trade” with import and export [J]. Hangzhou (Weekly), 2015(14): 20-21.)
[2] KULKARNI G, KANNAN P K, MOE W. Using online search data to forecast new product sales [J]. Decision Support Systems, 2012, 52(3): 604-611.
[3] KAWA A, ZDRENKA W. Conception of integrator in cross-border e-commerce [J]. Scientific Journal of Logistics, 2016, 12(1): 63-73.
[4] ASOSHEH A, SHAHIDI-NEJAD H, KHODKARI H. A model of a localized cross-border e-commerce [J]. I-Business, 2012, 4(2): 136-145.
[5] OKSANEN T. Use of demand forecast in operational purchasing [EB/OL]. [2016- 02- 03]. http://www.theseus.fi/bitstream/handle/10024/97344/Tuomas_Oksanen.pdf?sequence=1.
[6] 崔東佳. 大數(shù)據(jù)時(shí)代背景下的品牌汽車銷量預(yù)測的實(shí)證研究——以網(wǎng)絡(luò)搜索數(shù)據(jù)為例[D]. 開封:河南大學(xué), 2014:5-44.(CUI D J. An empirical study of automobile sale forecast under the background of big data — based on Web search data [D]. Kaifeng: Henan University, 2014: 5-44.)
[7] 孔令頂.基于互聯(lián)網(wǎng)搜索量的大眾途觀汽車銷量預(yù)測研究[J]. 時(shí)代金融, 2015(30):222,226.(KONG L D. Prediction research on the Tiguan sales based on Internet searches[J]. Times Finance, 2015(30):222,226.)
[8] 李鋮瀚.基于海量數(shù)據(jù)的銷售預(yù)測研究與實(shí)現(xiàn)[D]. 杭州:浙江理工大學(xué), 2015:2-57.(LI C H. Research and implementation of sales forecast based on massive data [D]. Hangzhou: Zhejiang Sci-Tech University, 2015: 2-57.)
[9] 周昊明.銷量數(shù)據(jù)挖掘技術(shù)及電子商務(wù)應(yīng)用研究[D]. 廣州:廣東工業(yè)大學(xué), 2014:3-67.(ZHOU H M. Research on sales data mining technology and e-commerce application [D]. Guangzhou: Guangdong University of Technology, 2014: 3-67.)
[10] HE Z Z, ZHANG Z F, CHEN C M, et al. E-commerce business model mining and prediction [J]. Frontiers of Information Technology and Electronic Engineering, 2015, 16(9): 707-719.
[11] 羅新星, 鄧麗, 趙玉潔.基于CBR和MAHP的新產(chǎn)品客戶價(jià)值預(yù)測決策支持系統(tǒng)[J]. 計(jì)算機(jī)集成制造系統(tǒng), 2014, 20(10):2403-2410.(LUO X X, DENG L, ZHAO Y J. Decision support system for customer value prediction of new product based on CBR and MAHP [J]. Computer Integrated Manufacturing Systems, 2014, 20(10): 2403-2410.)[12] 楊波, 劉勇, 牟少敏, 等.大數(shù)據(jù)背景下山東省二代玉米螟發(fā)生程度預(yù)測模型的構(gòu)建[J]. 計(jì)算機(jī)研究與發(fā)展, 2014, 51(增刊2):160-165.(YANG B, LIU Y, MU S M, et al. Based on big data: the establishment of meteorological forecast model for the occurrence degree of the second generation of corn borer in Shandong [J]. Journal of Computer Research and Development, 2014, 51(Suppl2):160-165.)
[13] 孔慶超, 毛文吉.基于動(dòng)態(tài)演化的討論帖流行度預(yù)測[J]. 軟件學(xué)報(bào), 2014, 25(12):2767-2776.(KONG Q C, MAO W J. Predicting popularity of forum threads based on dynamic evolution [J]. Journal of Software, 2014, 25(12): 2767-2776.)
[14] 王健, 何衛(wèi)平, 李夏霜, 等.基于制造歷史數(shù)據(jù)的產(chǎn)品標(biāo)識失效預(yù)測與補(bǔ)救方法[J]. 計(jì)算機(jī)集成制造系統(tǒng), 2015, 21(9):2494-2503.(WANG J, HE W P, LI X S, et al. Prediction and remediation of failed product identification based on manufacturing history data [J]. Computer Integrated Manufacturing Systems, 2015, 21(9): 2494-2503.)
[15] 王煉, 賈建民.基于網(wǎng)絡(luò)搜索的票房預(yù)測模型——來自中國電影市場的證據(jù)[J]. 系統(tǒng)工程理論與實(shí)踐, 2014, 34(12):3079-3090.(WANG L, JIA J M. Forecasting box office performance based on online search:evidence from Chinese movie industry [J]. Systems Engineering — Theory and Practice, 2014, 34(12): 3079-3090.)
[16] 岳笑含, 周福才, 林慕清, 等.面向可信移動(dòng)平臺具有用戶可控關(guān)聯(lián)性的匿名證明方案[J]. 計(jì)算機(jī)學(xué)報(bào), 2013, 36(7):1434-1447.(YUE X H, ZHOU F C, LIN M Q, et al. Anonymous attestation scheme with user-controlled-linkability for trusted mobile platform [J]. Chinese Journal of Computers, 2013, 36(7): 1434-1447.)
This paper is supported by Research Projects of Zhejiang Federation of Humanities and Social Sciences Circles (2017Z03).
WANG Xuerong, born in 1981, M. S., associate professor. Her research interests include cross-border e-commerce, big data.
WAN Nianhong, born in 1977, M. S., associate professor. His research interests include Internet+, big data, cross-border e-commerce.
Dynamic prediction model on export sales based on controllable relevance big data of cross-border e-commerce
WANG Xuerong, WAN Nianhong*
(School of Information Media and Automation, Zhejiang Dongfang Vocational and Technical College, Wenzhou Zhejiang 325011, China)
Current popular prediction methods of foreign trade product sales only respectively study prediction problems from angles of the third party platform or big data, lacking consideration of dynamic evolution prediction on product sales based on Internet platform, big data and cross-border e-commerce. To improve the efficiency of export sales prediction, to achieve scalability and dynamic evolution of prediction systems, with mining controllable relevance big data of cross-border e-commerce export sale based on “Internet+foreign trade” surroundings, personalized prediction mechanism and smart prediction algorithms, improving corresponding algorithms such as distributed quantitative calculation and centralized qualitative calculation, a dynamic prediction model on export sales based on “Internet+foreign trade”-driven controllable relevance big data of cross-border e-commerce was proposed. Finally, this model was verified and analyzed. The performance analysis results show that the model integrates fully openness and extensibility of “Internet+” and dynamic prediction advantages of big data, achieving dynamic, smart, quantitative, and qualitative prediction on export sales based on “Internet+foreign trade”-driven controllable relevance big data of cross-border e-commerce. The comprehensive prediction efficiency of the proposed model is obviously better than those of traditional models, and it has stronger dynamic evolution and higher utility.
Internet+foreign trade;cross-border e-commerce;controllable relevance big data; export sale number; dynamic prediction
2016- 07- 29;
2016- 10- 20。 基金項(xiàng)目:浙江省社會(huì)科學(xué)界聯(lián)合會(huì)研究課題成果(2017Z03)。
王雪蓉(1981—),女,浙江平陽人,副教授,碩士,主要研究方向:跨境電商、大數(shù)據(jù); 萬年紅(1977—),男,江西南昌人,副教授,碩士,主要研究方向:互聯(lián)網(wǎng)+、大數(shù)據(jù)、跨境電商。
1001- 9081(2017)04- 1038- 06
10.11772/j.issn.1001- 9081.2017.04.1038
TP311.7; TP391
A