亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        數據挖掘在零售電商交易風險預測中的應用

        2019-03-07 05:22:18常春燕劉廣成
        電腦知識與技術 2019年35期
        關鍵詞:風險預測數據挖掘

        常春燕 劉廣成

        摘要:現(xiàn)在的電子商務交易中,網絡漏洞層出不窮,導致電子商務交易風險加大。為了提高網絡交易的安全,推動電子商務的健康發(fā)展,對數據挖掘在零售電商交易風險預測中的應用進行研究。公開選取數據集,在此基礎上對數據進行預處理,完成面向大數據的交易進行中風險值計算。提出方法進行了分類因子的判別,克服了傳統(tǒng)方法的弊端,在運算時間、預測結果精度均有較好的優(yōu)勢,最終結果優(yōu)于傳統(tǒng)方法,有效避免了傳統(tǒng)方法收斂速度較慢的缺點。

        關鍵詞:數據挖掘;零售電商;電商交易;風險預測

        中圖分類號:F272.1 文獻標識碼:A

        文章編號:1009-3044(2019)35-0001-02

        隨著互聯(lián)網技術的快速發(fā)展以及社會智能化水平的提高,傳統(tǒng)的商業(yè)貿易正在經歷一次重大改革,電子商務顯示出巨大的市場價值與潛力[1]。電子商務作為商業(yè)領域的一種新興貿易方式,它主要是以計算機網絡為應用平臺、現(xiàn)代信息技術為媒介、經濟利潤為核心的現(xiàn)代化商業(yè)運營模式,最終目的是為了實現(xiàn)商業(yè)活動的低成本、高效率和便捷化。

        數據庫技術的迅猛發(fā)展以及數據庫管理系統(tǒng)的廣泛推廣和使用,使得數據積累得越來越多。爆炸式增長的數據背后隱藏著眾多關鍵數據,為了更好地利用這些數據,就必須對其進行合理科學的分析[2]。數據庫系統(tǒng)雖然能夠實現(xiàn)數據的組織、存儲、管理、維護等功能,但卻挖掘不了數據中隱藏的規(guī)律,也就無法根據現(xiàn)有的數據對市場的運行規(guī)律和未來發(fā)展趨勢進行合理預測。數據庫系統(tǒng)對挖掘數據背后隱藏的信息無能為力,最終造成現(xiàn)在“數據爆炸但有效信息匱乏”的狀況,因此需要我們對現(xiàn)行的零售電商交易風險預測進行合理創(chuàng)新、優(yōu)化。

        1 數據挖掘在零售電商交易中的風險預測

        1.1公開數據集選取

        有關交易數據的選擇,我們主要采取公開的不平衡數據集即可,使用Data Hackathon 5.X AV上保存的數據檢驗改進的xg-boost算法的性能[3]。一般狀況下,在不平衡數據集內,樣本數相對較多的被稱之為正樣本,而樣本數相對較少的稱之為負樣本。數據集規(guī)模統(tǒng)一規(guī)定為19335*35。其中,正負樣本數量之間的比例大致是60:1,因而正負樣本比例嚴重失衡。如果應用的數據挖掘改進的SMOTE上采樣算法可以在這個不平衡樣本集上發(fā)揮很好的分類效果,那么就表明SMOTE上采樣算法適合用于不平衡數據集的分類問題。所以,這個數據集就比較符合平衡數據的相關要求。

        1.2數據預處理

        有關對零售電商交易數據的預處理環(huán)節(jié)一共包括缺失值處理、特征One-hot編碼、數據過采樣三部分。

        缺失值處理部分,輸入數據比如客戶歷史購買信息、退款信息等一般都會出現(xiàn)遺漏或缺失的狀況,如將這些記錄直接放入回收站,將會在一定程度上影響交易風險預測的最終結果,造成結果精度誤差較大,為了實現(xiàn)更好的預測效果,需要對缺失值進行預先處理。而有關訓練集數據缺失狀況詳情見下表所示:

        對于表1中所列的類別型字段,比方說區(qū)域分類、費控標志等字段均采取默認值-1進行補充;對于大量缺失的字段,比方說負荷特性、市場化屬性、退款消費分類,就需要直接刪除該特征,以免耗費過多時間成本;重要性等級字段雖然缺失較大,可考慮到其特征的重要性,需要單獨保留該特征,采用-1補充;對于異常值極少的(<0.01%)字段數,直接刪除即可;至于有些毫無關聯(lián)(基本為0)的信息,直接刪除即可[4]。

        特征One-hot編碼部分,特征字段主要是以One-hot分散編碼,One-hot編碼,也可稱之為獨屬編碼。其手段是利用N位狀態(tài)寄存器去對N個數據狀態(tài)進行單獨編碼,每一個數據狀態(tài)均有其獨立的寄存器位,且在任意段位,只存在一位有效。假如我們有四個樣本(行),每一個樣本包含著三個具體特征(列),如表2所示,借助one-hot編碼能夠獲得具體的數據特征。而特征分散編碼,一方面處理了以往分類器解決不好離散數據的問題,另一方面在一定意義上對填充特征也有積極的作用。

        數據過采樣部分,當正樣本所占總體樣本比重較低時,數據分類算法就會呈現(xiàn)出極為不穩(wěn)定,其對交易風險的預測精度也會隨之降低。從原理上來講,預測的精準程度在很大程度上取決于正負樣本能否可以利用某項程序規(guī)則進行完全區(qū)分[5]。當訓練數據集的正負樣本容量明顯較多且所占比例相差不大時,獲得這種程序的規(guī)則就有其普適性,預測的結果相對而言也會較為樂觀。然而,如果數據集的正樣本數量和負樣本數量之間相差懸殊,同時雙方樣本數量都較少時,計算機對這種規(guī)則的總結就會缺乏一定的普適性,如過度考慮樣本數量較少的一方,造成模預測失真??紤]到本方法中正樣本(危險用戶)占比較少,所以就需要通過上采樣處理辦法,來調改正負樣本的數量,提高交易風險預測的效果。數據挖掘的SMOTE上采樣算法具體描述:首先對正樣本采用無放回式抽樣,增加實際購買行為的樣本數量,直到正負樣本數量基本保持一致,為了不損壞數據原有的分布狀況,對特征加以隨機干擾;其次對于負樣本保持不變;最后合并正負樣本數據集,整合成預測所用的整體數據集。正是因為Web數據量較為龐大,界面復雜,結構缺乏統(tǒng)一標準。利用數據預處理那個最大限度地確保數據的精確性,能夠正確的反映出客戶的購買意圖,更好的支持零售電商的銷售決策。

        1.3面向大數據的交易進行中風險值計算

        在數據挖掘的基礎上,對電商交易進行中風險預測過程中的資產、威脅性以及脆弱性三個基本因素進行精準識別和賦值;分別通過網絡脆弱性的難易程度來評安全事件發(fā)生的基本概率以及交易風險威脅造成的損失分別進行計算,獲得風險值[6]。假定T代表面向大數據的交易進行中隱性風險出現(xiàn)的基本概率(即可信度);A代表面向大數據的交易進行中隱性風險資產的基本識別;V代表面向大數據的交易進行中的不穩(wěn)定性以及不穩(wěn)定性的嚴重程度。根據面向大數據的交易進行中風險以及隱性風險出現(xiàn)概率,利用網絡脆弱性的難易程度預測安全事件發(fā)生的基本概率,其計算公式如下:

        式中,L表示面向大數據的交易進行過程中安全事件產生概率的計算函數。按照面向大數據的交易進行中不穩(wěn)定性程度以及隱性風險威脅事件所產生的資產價值來計算隱性風險威脅造成的經濟損失,詳細計算公式如下:

        式中,F(xiàn)表示面向大數據的交易進行中隱性風險威脅發(fā)生后導致的經濟損失計算函數;La表示面向大數據的交易進行中隱性風險威脅所產生的資產價值;Va表示面向大數據的交易進行中計算機網絡的脆弱性嚴重程度;按照以上分析,計算面向大數據的交易進行中隱性風險威脅事件的發(fā)生概率以及對交易和電商所產生的影響,即面向大數據的交易進行中的隱性風險值,具體計算公式如下:

        式中,R表示面向大數據的交易進行中的隱性風險計算函數。同時在本文設計的零售電商交易風險預測中用二十分鐘這個闕值作為時間窗口劃分的默認值[7]。一旦在電商頁面中客戶的請求時間超過了這個闕值,就會被認為此會話結束。而在緩存頁面中客戶訪問的頁面存在兩種情況。第一種是顧客點擊“BACK”按鈕,調取緩存中所在的瀏覽器頁面;第二種是顧客多次訪問該頁面,這些頁面均列為相同會話中。通過這兩種情況,電商能夠迅速判斷出此客戶的潛在價值,降低交易過程中的風險度。

        2 實驗與效果分析

        為了更加清晰的確定本文提出的基于數據挖掘的零售電商交易風險預測的實際應用效果,特與傳統(tǒng)的零售電商交易風險預測進行對比,對其預測率的大小進行比較。

        2.1實驗準備

        為保證實驗的準確性,選擇100個零售電商交易樣本,在保證其他條件不變的情況下,將兩種零售電商交易風險預測方法置于相同的實驗環(huán)境之中,進行風險預測能力的實驗。

        2.2實驗結果分析

        實驗過程中,通過兩種不同的零售電商交易風險預測設計同時在相同環(huán)境中進行工作,分析其預測率能力的變化。實驗效果對比圖如下所示。

        通過對實驗結果的對比能夠得出結論:本文提出的方法不管是在運算時間上,還是在預測的結果精度上均有著較好的優(yōu)勢,最終的結果也優(yōu)于傳統(tǒng)方法,這主要是由于本文方法進行了分類因子的判別,克服了傳統(tǒng)方法的弊端,有效避免了以往算法收斂速度較慢的缺點。實驗表明本文方法是一種預測快速、預測精度高、結果可信的預測方法。

        3 結束語

        本文對數據挖掘在零售電商交易風險預測中的應用進行分析,依托數據挖掘技術,根據零售電商交易過程中的技術難題,對交易風險預測方法進行優(yōu)化,實現(xiàn)本文設計。實驗論證表明,本文設計的方法具備極高的有效性。希望本文的研究能夠為數據挖掘在零售電商交易風險預測中的應用方法提供理論依據。

        參考文獻:

        [1]劉冠男,張亮,馬寶軍.基于隨機游走的電子商務退貨風險預測研究[J].管理科學,2018,23(1):3-14.

        [2]王穎,阮夢黎.基于大數據的電商異常交易風險評估仿真[J].計算機仿真,2018,11(3):369-372.

        [3]陳梅森,劉文彬,王良緣,等.掛牌交易模式下考慮合約和日前收益的風電商靈活合約制定策略[J].現(xiàn)代電力,2019,19(1):1-7.

        [4]賴俊明.電子商務平臺售假現(xiàn)象及打假策略[J].企業(yè)經濟,2018,16(5):101-108.

        [5]彭曉咖,周發(fā)明.農村電商經營效率研究一基于消費品下行的模型分析[J].農業(yè)技術經濟,2018,12(12):111-118.

        [6]李澤凡.電商經濟發(fā)展中存在的法律問題及對策——以北京出臺雙11規(guī)定為例[J].成功營銷,2018,12(12):93-94.

        [7]易紹華.跨境電商企業(yè)”走出去”面臨的挑戰(zhàn)與建議——以阿里巴巴進入澳洲市場為例[J].中國發(fā)展觀察,2019,29(8):61-62.

        【通聯(lián)編輯:張薇】

        收稿日期:2019-09-05

        作者簡介:常春燕(1985-),女,河南泌陽人,碩士研究生,講師,研究方向為電子商務。

        猜你喜歡
        風險預測數據挖掘
        探討人工智能與數據挖掘發(fā)展趨勢
        基于并行計算的大數據挖掘在電網中的應用
        電力與能源(2017年6期)2017-05-14 06:19:37
        電費回收風險預測及規(guī)避策略
        數據挖掘技術在中醫(yī)診療數據分析中的應用
        新舊高校會計制度比較實施建議
        統(tǒng)計學在證券投資中的應用研究
        商(2016年6期)2016-04-20 17:54:08
        一種基于Hadoop的大數據挖掘云服務及應用
        我國企業(yè)資金管理存在的問題及對策分析
        大學生電子商務創(chuàng)業(yè)策略研究
        探究建筑房地產開發(fā)經營過程中的風險管理思路構建
        欧美怡红院免费全部视频| 91福利精品老师国产自产在线| 91精品国产免费久久久久久青草 | 亚洲精品92内射| 精品久久久久久无码不卡| 人妻少妇无乱码中文字幕| 亚洲高清一区二区三区在线播放| 手机福利视频| 國产一二三内射在线看片| 久久久9色精品国产一区二区三区| 国模一区二区三区白浆| 久久精品国产亚洲av性瑜伽| 激情综合色综合啪啪开心| 波多野结衣久久精品99e| 全球中文成人在线| 人妻av一区二区三区精品| 亚洲精品亚洲人成在线下载| 日本在线一区二区三区四区| 人妻中文字幕一区二区视频| 国产精品videossex国产高清| 中文字幕久久精品一二三区| 永久无码在线观看| 亚洲av中文aⅴ无码av不卡| 日本高清人妻一区二区| 日日碰日日摸日日澡视频播放 | 亚洲日产无码中文字幕| 国产av一区二区制服丝袜美腿| 国色天香社区视频在线| 国产又色又爽无遮挡免费| 精品国产1区2区3区AV| 日本不卡一区二区三区久久精品| 国产区女主播在线观看| 国产伦精品一区二区三区免费| 亚洲 暴爽 AV人人爽日日碰| 久久精品人妻嫩草av蜜桃| 一区二区精品国产亚洲| 成人精品视频一区二区| 国产人成精品综合欧美成人| 久久中文字幕av第二页| 精品一区二区三区芒果| 亚洲av无码不卡|