馬 健
(亳州職業(yè)技術(shù)學(xué)院信息工程系,安徽 亳州 236800)
決策樹算法對(duì)電子商務(wù)交易信任機(jī)制的應(yīng)用研究
馬 健
(亳州職業(yè)技術(shù)學(xué)院信息工程系,安徽 亳州 236800)
為了解決B2C模式的電子商務(wù)交易的信任問(wèn)題,提出一種基于決策樹算法的電子商務(wù)交易信任研究,對(duì)算法進(jìn)行分析和選擇,建立決策樹模型,使用Swarm工具進(jìn)行可視化仿真實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果表明,該方法可以快速收斂到均衡,能夠準(zhǔn)確識(shí)別出不良的交易者,為今后信任機(jī)制平臺(tái)的建設(shè)提供了幫助。
B2C;電子商務(wù);交易;信任機(jī)制
當(dāng)今世界網(wǎng)絡(luò)已經(jīng)處于成熟階段,電子商務(wù)行業(yè)未來(lái)發(fā)展具有廣泛空間。B2C(business-to-consumer)電子商務(wù)出現(xiàn)了前所未有的發(fā)展趨勢(shì),電子商務(wù)是一個(gè)蓬勃發(fā)展的行業(yè)。第三方支付和網(wǎng)上銀行交易額不斷上升。從電子商務(wù)的全球發(fā)展趨勢(shì),我們可以看到,網(wǎng)民的數(shù)量在不斷增加,公眾已經(jīng)接受了電子商務(wù)的模式,從而導(dǎo)致電子商務(wù)交易的數(shù)量提高[1]。
根據(jù)中國(guó)電子商務(wù)研究中心的數(shù)據(jù)顯示,到2013年12月底國(guó)內(nèi)B2C、C2C與其它電商模式企業(yè)數(shù)已達(dá)29303家,較去年20750家增幅達(dá)17.8%,預(yù)計(jì)2013年達(dá)到34314家。隨著網(wǎng)絡(luò)零售市場(chǎng)的不斷規(guī)范與整合,相當(dāng)數(shù)量的B2C企業(yè)還會(huì)在這個(gè)過(guò)程中被淘汰[2]。隨著B2C模式的電子商務(wù)的發(fā)展的同時(shí),信任也成為阻礙電子商務(wù)發(fā)展的一個(gè)主要原因之一,有些消費(fèi)者不愿意在線購(gòu)買。B2C電子商務(wù)信任成為電子商務(wù)在中國(guó)發(fā)展的瓶頸,為了能夠在互聯(lián)網(wǎng)時(shí)代在促進(jìn)電子商務(wù)的發(fā)展,本文提出了決策樹算法對(duì)電子商務(wù)交易信任中的應(yīng)用研究。為了解決電子商務(wù)交易的信任問(wèn)題,本文結(jié)合決策樹算法利用工具軟件建立了決策樹模型,通過(guò)對(duì)樹的拆分得到二叉樹的數(shù)據(jù)挖掘模型,根據(jù)樹的生長(zhǎng)方式和節(jié)點(diǎn)來(lái)決定用戶的好評(píng)率,從而可以得到對(duì)信任機(jī)制的分析。
1.1 信任機(jī)制設(shè)計(jì)的重要性
目前電子商務(wù)的發(fā)展給傳統(tǒng)購(gòu)物模式帶來(lái)了沖擊,人們?cè)谟谢ヂ?lián)網(wǎng)的地方可以通過(guò)手機(jī)或者計(jì)算機(jī)就可以實(shí)現(xiàn)網(wǎng)上購(gòu)物,減少了去大型商場(chǎng)去挑選的時(shí)間以及價(jià)格的優(yōu)惠,但在方便購(gòu)物的同時(shí),存在著一定的信任危機(jī),在一定程度上影響網(wǎng)上交易,信任機(jī)制突顯其重要,在不同的交易平臺(tái)均有不同的信任機(jī)制,設(shè)計(jì)合理的信任機(jī)制可以使交易雙方成功交易,并且可以建立長(zhǎng)期的信任關(guān)系。
1.2 電子商務(wù)信任
現(xiàn)在的電子商務(wù)信任是在早期電子商務(wù)交易是否成功因素的基礎(chǔ)上,在信任值的計(jì)算上增加了能力、風(fēng)險(xiǎn)、品牌、質(zhì)量等因素。構(gòu)建的信任模型能夠分析出惡意欺騙、虛假信息等行為進(jìn)行界定,給予提供相應(yīng)的防范措施。通過(guò)研究國(guó)內(nèi)外的文獻(xiàn),對(duì)電子商務(wù)信任概念歸結(jié)如表1所示。
表1 電子商務(wù)信任相關(guān)的概念
電子商務(wù)信任最核心的問(wèn)題就是安全問(wèn)題,如何解決交易的安全問(wèn)題,必須建立一套完善的適合電子商務(wù)交易的衡量標(biāo)準(zhǔn)[3]。目前,國(guó)內(nèi)電子商務(wù)行業(yè)較為成熟,普遍采用的是信用評(píng)級(jí)來(lái)衡量安全級(jí)別,用來(lái)保障電子商務(wù)交易的順利進(jìn)行,信用評(píng)級(jí)主要是通過(guò)調(diào)查、分析和評(píng)定等方法來(lái)確定電子商務(wù)交易的安全性,用一些特定的數(shù)值表示出信用等級(jí)。
1.3 B2C交易的信任
B2C的交易模式主要是通過(guò)商業(yè)機(jī)構(gòu)與消費(fèi)者之間的電子商務(wù),利用網(wǎng)絡(luò)資源平臺(tái),企業(yè)和消費(fèi)者之間以電子信息流通方式進(jìn)行各種商務(wù)活動(dòng)及其交易活動(dòng)。在B2C電子商務(wù)的交易過(guò)程中涉及到商家、消費(fèi)者和第三方認(rèn)證以及技術(shù)支持,可以將認(rèn)證和技術(shù)劃分為一組,那么信任的主體就包括三個(gè)部分:消費(fèi)者、商家、第三方及技術(shù),其中對(duì)于商品的購(gòu)買主要是消費(fèi)者,消費(fèi)者對(duì)商品的選取和商品質(zhì)量的鑒別,主要是通過(guò)商家的推薦,如果商品不滿意或者質(zhì)量出現(xiàn)問(wèn)題,消費(fèi)者要求賠償、退貨或者退款等,商家是否能及時(shí)幫助解決,同時(shí),第三方認(rèn)證也要起到關(guān)鍵性作用,來(lái)監(jiān)管資金的運(yùn)作,有效的來(lái)保障消費(fèi)者和商家的權(quán)益。目前,B2C電子商務(wù)信任問(wèn)題隨著網(wǎng)上購(gòu)買人群的增加,出現(xiàn)的問(wèn)題也比較多,在交易過(guò)程中就會(huì)出現(xiàn)形形色色的消費(fèi)者和形形色色的商家,尤其是商家只能靠品牌和信譽(yù)等進(jìn)行提高信任度。
建立信任機(jī)制的平臺(tái)是非常復(fù)雜的過(guò)程,為了能使信任機(jī)制在交易的過(guò)程中更好的體現(xiàn)信任度,通過(guò)數(shù)據(jù)挖掘技術(shù)在大量的交易數(shù)據(jù)中進(jìn)行分析,找出信任相關(guān)的技術(shù)指標(biāo),然后根據(jù)其指標(biāo)來(lái)衡量購(gòu)買雙方的信任度。
2.1 樸素貝葉斯算法
樸素貝葉斯是基于貝葉斯定理,是一種比較簡(jiǎn)單的算法,首先對(duì)所有變量進(jìn)行分類,假定所有變量對(duì)分類而言均是有用的,并且這些變量是相互獨(dú)立的,求得在某種條件下該類出現(xiàn)的概率,在經(jīng)過(guò)一些屬性選擇的過(guò)程,消除冗余,從而可以消除一些非獨(dú)立屬性,即可得到該對(duì)象所屬的類,在實(shí)際數(shù)據(jù)應(yīng)用上可以得到很好的效果。
2.2 關(guān)聯(lián)規(guī)則算法
關(guān)聯(lián)規(guī)則挖掘是指從海量數(shù)據(jù)中發(fā)現(xiàn)大量數(shù)據(jù)項(xiàng)之間的關(guān)聯(lián)關(guān)系,并生成它們之間規(guī)則的過(guò)程。挖掘的對(duì)象主要是事務(wù)型數(shù)據(jù)庫(kù)也可以是其他領(lǐng)域內(nèi)的關(guān)系型數(shù)據(jù)庫(kù)。挖掘生成的結(jié)果是人們易于理解的一系列關(guān)系公式,并且能使人很容易理解和發(fā)現(xiàn)數(shù)據(jù)項(xiàng)之間的關(guān)系[4]。
2.3 決策樹算法
決策樹算法具有代表性的是ID3算法,它是一種用來(lái)由數(shù)據(jù)構(gòu)造決策樹的遞歸過(guò)程。首先選擇一個(gè)屬性放置在根節(jié)點(diǎn),并對(duì)該屬性的每個(gè)值產(chǎn)生一個(gè)分支,分裂根節(jié)點(diǎn)上的數(shù)據(jù)集,并移動(dòng)到子女節(jié)點(diǎn),產(chǎn)生一顆局部樹。對(duì)該劃分的質(zhì)量進(jìn)行評(píng)估,對(duì)其他屬性重復(fù)改過(guò)程,每個(gè)用于劃分的屬性襯衫一棵局部樹,然后根據(jù)樹的質(zhì)量,選擇一棵局部樹。如果一個(gè)節(jié)點(diǎn)上都具有相同的類,則停止局部樹的生成[5]。
3.1 數(shù)據(jù)的采集
數(shù)據(jù)的采集是決定數(shù)據(jù)分析結(jié)果的去向,消費(fèi)者對(duì)不同的商品有不同的看法,而且不同品牌的商品也會(huì)影響消費(fèi)者的觀念,所以為了保證能夠科學(xué)的分析出信任機(jī)制,本文隨機(jī)抽取同種商品的部分交易數(shù)據(jù)進(jìn)行研究,如表1所示。
表1 商品交易數(shù)據(jù)
3.2 數(shù)據(jù)的離散化處理
根據(jù)上述表中的數(shù)據(jù),對(duì)好評(píng)率數(shù)據(jù)進(jìn)行離散化處理,可以分為幾個(gè)等級(jí):A等級(jí)(99%,100%),B等級(jí)為(97%,99%),C等級(jí)為(95%,97%),D等級(jí)為(90%,95%),那么通過(guò)好評(píng)率數(shù)據(jù)處理后得到表2所示。
ID近期成交量v成交價(jià)格c經(jīng)營(yíng)時(shí)間year近期差評(píng)數(shù)po好評(píng)率R信用度P12011402014-08-180A180028781252013-05-073B275631221562013-06-132B15204181202012-10-190A2305571462011-09-181A540681322012-01-250A867871192013-09-234C12082051582014-03-191A16749241182013-06-073D50
3.3 決策樹的構(gòu)建
首先將好評(píng)率高的都是A的數(shù)據(jù)作為決策樹的第0層進(jìn)行屬性拆分,然后對(duì)連續(xù)變量設(shè)置潛在的拆分點(diǎn),通過(guò)對(duì)數(shù)據(jù)做平均值處理后,可以得出潛在的拆分點(diǎn)v=54,c=155,year=2008,po=0.57,p=648,根據(jù)熵值進(jìn)行對(duì)每個(gè)拆分點(diǎn)進(jìn)行計(jì)算,然再對(duì)期望的信息進(jìn)行計(jì)算,從而得到?jīng)Q策樹第一層的拆分點(diǎn),計(jì)算步驟如下:
同上可以計(jì)算得出:Gain(S,year)=0.86;
Gain(S,po)=1.84;
Gain(S,p)=3.6。
根據(jù)同上的理論,遞歸操作,得到?jīng)Q策樹如下:
圖1 一棵決策樹
3.4 規(guī)則提取
通過(guò)構(gòu)造出的決策樹可以得到下面的分類規(guī)則:
(1)IF近期成交量的好評(píng)率=“A”THEN信用度=“高”。
(2)IF近期成交量的好評(píng)率=“B”THEN信用度=“偏高”。
(3)IF近期成交量的好評(píng)率=“C”THEN信用度=“偏低”。
(4)IF近期成交量的好評(píng)率=“D”THEN信用度=“低”。
(5)IF近期成交量的好評(píng)率=“A”AND近期差評(píng)數(shù)=“少”THEN信用度=“高”。
(6)IF近期成交量的好評(píng)率=“D”AND近期差評(píng)數(shù)=“多”THEN信用度=“低”。
3.5 仿真與結(jié)果分析
本文采用Swarm仿真軟件對(duì)電子商務(wù)交易過(guò)程中的信任機(jī)制進(jìn)行了分析,Swarm軟件分為模型、觀察員、主體和環(huán)境幾個(gè)部分,適合復(fù)雜的交易系統(tǒng),不僅能夠分析自身的屬性,還可以分析個(gè)體之間、個(gè)體與環(huán)境、主體與環(huán)境之間的相互作用,能夠有效的分析出龐大的數(shù)據(jù)交易過(guò)程。
為了實(shí)現(xiàn)算法的可行性,本文在電子商務(wù)交易系統(tǒng)中采集了樣本數(shù)據(jù),通過(guò)對(duì)數(shù)據(jù)的處理進(jìn)行仿真實(shí)驗(yàn),結(jié)果如圖2所示。
圖2 仿真實(shí)驗(yàn)結(jié)果
通過(guò)仿真實(shí)驗(yàn)好評(píng)率的走勢(shì)分析可以看出,隨著好評(píng)率的增加,信用值在不斷的提升,如果好評(píng)率降低會(huì)影響信用值的走向,好評(píng)率降低和升高都將影響信用值的走向,在交易的過(guò)程中,好評(píng)率高的交易用戶出現(xiàn)交易欺詐,后期仍會(huì)提升信任機(jī)制,好評(píng)率低的交易出現(xiàn)惡性交易后,信任機(jī)制很難得到提升。
隨著互聯(lián)網(wǎng)時(shí)代走向成熟,網(wǎng)購(gòu)已經(jīng)成為人們生活中的一部分,在電子商務(wù)交易中出現(xiàn)的信任問(wèn)題凸顯出來(lái),本文提出了一種決策樹算法對(duì)消費(fèi)者與供應(yīng)商之間的信任關(guān)系進(jìn)行了分析,根據(jù)對(duì)數(shù)據(jù)的統(tǒng)計(jì),可以找出消費(fèi)者和商家之間的聯(lián)系,從而為改變經(jīng)營(yíng)策略和信任購(gòu)買提供了決策支持。
[1]虞萍.影響企業(yè)電子商務(wù)成功的網(wǎng)站因素研究[D].北京:中國(guó)農(nóng)業(yè)大學(xué),2014.
[2]張樹梁.電子商務(wù)環(huán)境下云配送物流模式研究及其應(yīng)用[D].重慶:重慶大學(xué),2014.
[3]張啟偉.基于聲譽(yù)的P2P電子商務(wù)信任模型研究[D].北京:首都經(jīng)濟(jì)貿(mào)易大學(xué),2013.
[4]朱濤.基于FP-growth關(guān)聯(lián)規(guī)則挖掘算法的研究與應(yīng)用[D].南昌:南昌大學(xué),2010.
[5]何化玲,陸桂明.決策樹在成績(jī)分析中的應(yīng)用探討[J].現(xiàn)代農(nóng)業(yè),2010,(11):84-87.
[責(zé)任編輯:劉守義 英文編輯:劉彥哲]
Trust Mechanism Application of Decision Tree Algorithm in E-Commerce Transactions
MA Jian
(Department of Information Engineering,Bozhou Vocational and Technical College,Bozhou,Anhui 236800,China)
With the rapid development of e-commerce,the trust in e-commerce transactions has become a hot issue.To solve the problem of trust in B2C e-commerce transaction,this paper presents a study of e-commerce transactions trust decision based on the tree algorithm.After analysis and selection,a decision tree model is established.Visual simulation experiments are conducted using Swarm tools.The experimental results show that the method can quickly converge to equilibrium and accurately identify the bad trader,which helps building the trust platform in the future.
B2C;e-commerce;trade;trust mechanism
2013年安徽省教育廳質(zhì)量工程項(xiàng)目:“電子商務(wù)專業(yè)綜合改革”(2013zy120);亳州職業(yè)技術(shù)學(xué)院院級(jí)課題:“基于遺傳模擬退火指數(shù)平滑模型的中藥材價(jià)格預(yù)測(cè)研究”(BYK1511)
馬健(1980-),男,遼寧義縣人,講師,碩士,主要從事數(shù)據(jù)挖掘、網(wǎng)絡(luò)安全方面研究。
TP 311.13
A
10.3969/j.issn.1673-1492.2015.05.008
來(lái)稿日期:2015-09-08