謝 鑫
(漳州職業(yè)技術(shù)學院)
隨著互聯(lián)網(wǎng)技術(shù)的不斷進步和發(fā)展,電子商務(wù)系統(tǒng)為商戶和客戶帶來了大量的信息,各種基于電子商務(wù)的個性化服務(wù)也開始由此形成,線上電商用戶潛在購買力挖掘成為研究的熱點話題,相關(guān)專家也相繼展開了研究.從線上電商用戶自身角度出發(fā),用戶更加關(guān)心如何以更低的價格獲取最滿意的商品[1-2].從企業(yè)角度出發(fā),企業(yè)更加關(guān)注如何增加收益,制定用戶滿意的銷售方案,同時對企業(yè)的潛在客戶進行優(yōu)化.國內(nèi)相關(guān)專家也針對該方面的內(nèi)容進行了大量的研究,例如屠守中等將矩陣分解和標簽傳播算法兩者進行結(jié)合,同時將用戶劃分為兩種類型,對用戶的興趣進行提取和計算,最終實現(xiàn)用戶興趣挖掘[3].秦永彬等通過二次single-pass不完全聚類算法進行將用戶微博劃分為多個不同的簇,同時將簇進行合并,并且采用LDA模型進行建模,引入時間因子,最終獲取用戶興趣,實現(xiàn)興趣挖掘[4].但是上述方法無法獲取準確的挖掘結(jié)果,所以提出一種基于數(shù)據(jù)特征提取的線上電商用戶潛在購買力挖掘方法.仿真實驗結(jié)果表明,所提方法可以獲取高精度高效率的線上電商用戶潛在購買力挖掘結(jié)果.
1.1.1 線上電商用戶訪問數(shù)據(jù)融合
為了更好實現(xiàn)線上電商用戶購買力挖掘[5-6],需要優(yōu)先組建信息訪問融合模型,由于類內(nèi)數(shù)據(jù)一直處于分布不均勻的狀態(tài),所以還需要進一步組建多元數(shù)據(jù)融合跟蹤識別模型,進而獲取電商用戶的模糊決策函數(shù),如公式(1)所示:
μ(n)=β[1-exp(α|e(n))],|e(n)|2>K
(1)
式中,μ(n)代表模糊決策函數(shù);K代表數(shù)據(jù)庫的檢測閾值;β代表數(shù)據(jù)庫的關(guān)聯(lián)度水平;e(n)代表數(shù)據(jù)庫的融合函數(shù);α代表數(shù)據(jù)庫的分布式融合系數(shù).
1.1.2 電商用戶潛在購買力分組檢測
構(gòu)建線上電商用戶潛在購買力挖掘的量化分析模型,同時還進一步構(gòu)建分布式融合模型[7-8],最終得到以下形式的統(tǒng)計函數(shù)F,如公式(2)所示:
(2)
式中,φ(xi)代表數(shù)據(jù)庫的約束指標參量集;ξ(i)代表用戶訪問數(shù)據(jù)集.粗糙向量機對應(yīng)的關(guān)聯(lián)規(guī)則分布G可以表示為公式(3)的形式:
(3)
式中,ω代表電商用戶訪問數(shù)據(jù)庫的有限特征項集合;xi代表訪問數(shù)據(jù)的類數(shù)據(jù)集;r代表類節(jié)點數(shù)量.
1.1.3關(guān)聯(lián)特征提取
將全新形成的樣本加入到原始訓練集中,為了后期獲取更加準確的挖掘結(jié)果,結(jié)合粗糙集匹配方法[9-10],獲取數(shù)據(jù)挖掘?qū)?yōu)需要滿足的約束條件:
(4)
分析合成樣本和相鄰父節(jié)點之間的關(guān)系,以此為依據(jù),獲取訪問數(shù)據(jù)集對應(yīng)的模糊聚類函數(shù).同時根據(jù)模糊聚類函數(shù),可以獲取最優(yōu)解向量融合方式,同時計算線上電商用戶潛在購買力挖掘的平均值H,如公式(5)所示:
(5)
式中,σ代表數(shù)據(jù)挖掘結(jié)果的方差.
通過以上分析,對線上電商用戶的潛在購買力進行關(guān)聯(lián)特征提取[11-12](如圖1所示),具體的計算式為:
圖1 線上電商用戶潛在購買力關(guān)聯(lián)特征提取流程圖
(6)
式中,J代表線上電商用戶潛在購買力的關(guān)聯(lián)特征提取結(jié)果.
設(shè)定共對N個線上電商用戶進行潛在購買力挖掘,每個用戶的潛在購買能力并不是固定的,所以可以通過以下矩陣Ft對用戶的行為特征進行描述:
(7)
式中,hi,j代表線上電商用戶的潛在購買特征.
對于觀測的線上電商用戶而言,可以獲取線上電商用戶潛在購買力,具體計算式如下:
(8)
式中,HDii代表線上電商用戶潛在購買力計算結(jié)果;ωij代表用戶在t時間段的購買能力;hij代表用戶在t時間段的權(quán)重取值.
選取合適的閾值,可以對線上用戶的線上電商用戶潛在購買力進行等級劃分,具體的計算式為:
(9)
式中,HSij代表線上電商用戶潛在購買力劃分結(jié)果.
在對線上電商用戶潛在購買力挖掘過程中,需要設(shè)定多個參數(shù),不同參數(shù)的取值是完全不同的.需要借助熵權(quán)決策法對提取到的特征進行計算,進而選取合適的權(quán)重取值,詳細的操作步驟如下所示:
(1)在實際問題中,需要優(yōu)先組建m個樣本n個評價指標的判斷矩陣R,具體如公式(10)所示.
(10)
(2)將判斷矩陣進行歸一化處理,進而獲取以下形式的歸一化矩陣B,如公式(11)所示:
(11)
(3)通過熵的定義,可以確定特征向量對應(yīng)的熵值為:
(12)
式中,hx、hy和hz分別代表不同的參數(shù).
針對自然對數(shù)而言,需要設(shè)定熵的定義,假設(shè)不符合實際情況,則需要借助以下公式進行計算:
(13)
式中,fij代表第i個特征值對應(yīng)的熵值.
(4)計算不同線上電商用戶潛在購買力關(guān)聯(lián)特征對應(yīng)的權(quán)重值,如公式(14)所示:
(14)
式中,ωi代表綜合熵值.
通過熵值計算結(jié)果選擇合適的權(quán)值,同時計算不同線上電商用戶的潛在購買力[14-15],通過購買能力進行等級劃分,最終實現(xiàn)電商用戶潛在購買力挖掘.
為了驗證所提基于數(shù)據(jù)特征提取的線上電商用戶潛在購買力挖掘方法的應(yīng)用性能,需要進行仿真實驗測試分析.通過相關(guān)參數(shù)設(shè)定,獲取線上電商用戶數(shù)據(jù)分布情況,如圖2所示.
圖2 線上電商用戶數(shù)據(jù)分布情況
采用圖3對所提方法的收斂性能進行測試:
分析圖3中的實驗數(shù)據(jù)可知,所提方法具有較好的收斂性能.
圖3 線上電商用戶潛在購買力挖掘的收斂性能測試結(jié)果
為了進一步驗證所提方法的性能,以下實驗測試將召回率作為測試指標.其中,當召回率的取值在95%以上,則說明其具有比較好的挖掘能力.詳細的實驗測試結(jié)果如圖4所示.
分析圖4中的實驗數(shù)據(jù)可知,所提方法具有較高的召回率,充分說明所提方法可以獲取比較滿意的線上電商用戶潛在購買力挖掘結(jié)果.
圖4 召回率測試結(jié)果分析
以下對線上電商用戶潛在購買力挖掘精度進行測試,重點對使用所提方法前后的挖掘精度進行測試分析,測試結(jié)果見表1.
表1 使用所提方法前后的線上電商用戶潛在購買力挖掘精度測試結(jié)果分析
分析表1中的實驗數(shù)據(jù)可知,在使用所提方法進行線上電商用戶潛在購買力挖掘后,挖掘精度相比之前得到有效提升,全面驗證了所提方法的優(yōu)越性.
以下對實驗測試進一步分析所提方法的挖掘效率變化情況,選取傳統(tǒng)方法作為對比方法,詳細的實驗測試結(jié)果如圖5所示.
分析圖5中的實驗數(shù)據(jù)可知,隨著測試樣本數(shù)量的持續(xù)增加,傳統(tǒng)方法的挖掘效率呈直線下降趨勢.而所提方法的挖掘效率則處于比較穩(wěn)定的狀態(tài),充分說明所提方法可以以更快的速度完成線上電商用戶潛在購買力挖掘.
圖5 不同方法的線上電商用戶潛在購買力挖掘效率對比
利用表2給出使用所提方法前后的挖掘成本變化情況.
表2 使用所提方法前后的線上電商用戶潛在購買力挖掘成本測試結(jié)果分析
分析表2中的實驗數(shù)據(jù)可知,在使用所提方法進行線上電商用戶潛在購買力挖掘后,挖掘成本相比之前得到有效降低,有效驗證了所提方法的優(yōu)越性.
網(wǎng)絡(luò)技術(shù)以及互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,線上電子商務(wù)中的線上電商用戶潛在購買力數(shù)據(jù)必將得到更好的挖掘處理,同時數(shù)據(jù)中隱藏的價值也將得到更加充分的利用.從數(shù)據(jù)特征挖掘的角度出發(fā),提出一種基于數(shù)據(jù)特征提取的線上電商用戶潛在購買力挖掘方法.所提方法可以準確挖掘用戶的潛在購買能力,還能夠有效提升挖掘效率,以更低的成本完成挖掘,同時可以為商務(wù)決策提供有效的數(shù)據(jù)支持,全面推進電子商務(wù)的發(fā)展.