許啟發(fā)+王陶+蔣翠俠
摘要:針對電子商務環(huán)境中賣家信用得分計算方式的不足,提出了相應的改進策略:引入主營業(yè)務占比、開店時長和賣家的買家身份信用三個因素,建立賣家信用評分的多因素校正模型。更進一步,提出店鋪的消費累積損失這一概念,并使用神經(jīng)網(wǎng)絡分位數(shù)回歸模型和相應的評價指標,來驗證改進賣家信用得分在解釋店鋪消費累積損失中的有效性。最后,對淘寶網(wǎng)信用評分實踐進行研究,實證結(jié)果表明:賣家信用評分的多因素校正模型,不僅能夠成功地解釋店鋪消費累積損失,而且能夠更好地預測其未來取值變動規(guī)律,具有有效性。
關(guān)鍵詞:C2C;賣家信用得分;多因素校正模型;神經(jīng)網(wǎng)絡分位數(shù)回歸;有效性檢驗
DOI:10.13956/j.ss.1001-8409.2017.01.23
中圖分類號:F7246;F224文獻標識碼:A 文章編號:1001-8409(2017)01-0105-04
Abstract: To overcome the deficiency of sellers credit scoring method in ecommerce, this paper sets up the corresponding improving strategy. And then, it introduces three factors including main business proportion, opening time of shop and sellers buyer credit to establish a sellers credit scoring multifactorial correction model. Further, it presents the concept of the cumulative consuming loss and use quantile regression neural networks (QRNN) model and corresponding evaluating index to verify the validity of the proposed sellers credit scoring method in explaining the cumulative consuming loss of shop. Finally, it conducts empirical study of sellers credit scoring on Taobao. Empirical results show that the sellers credit scoring multifactorial correction model is valid in practice since it can both successfully explain and accurately predict the cumulative loss of consumers.
Key words:C2C; sellers credit scoring; multifactorial correction model; quantile regression neural networks; validity test
引言
21世紀以來,中國電子商務發(fā)展迅猛。根據(jù)《第36次中國互聯(lián)網(wǎng)絡發(fā)展狀況統(tǒng)計報告》,截至2015年6月,中國網(wǎng)民規(guī)模達668億,互聯(lián)網(wǎng)普及率達488%。隨著中國網(wǎng)民規(guī)模的不斷擴大,網(wǎng)絡市場也隨之得到更大的發(fā)展,而C2C電子商務中賣家信用評價所存在的弊病也成為了亟待解決的問題。
Zhang等[1]在研究中系統(tǒng)分析了C2C中賣家信用欺詐的現(xiàn)象,并闡述了中國C2C市場中信用欺詐的發(fā)展歷史和信用欺詐的方式,總結(jié)了中國電商市場信用欺詐的特點及產(chǎn)生原因,同時也闡述了目前賣家信用計算方式的簡單累積效應,并以交易額權(quán)重、時間衰減系數(shù)、三個信用因子得到了新的動態(tài)信用計算模型。彭惠等[2]也指出了目前的累積信用評分的信用機制所存在的弊病,包括賣家信用分數(shù)主要基于累積效應、只增不減、買家評價積極性不高等問題,現(xiàn)行的信用評價體系已不能客觀反映賣家誠信,并且這種累積評分機制具有鼓勵賣家進行信用炒作的性質(zhì)。
由于目前的信用模型計算方式所存在的弊端,許多研究都致力于提出新的信用機制或者計算模型用以改善。Zhang等[3]提出了一個基于用戶評論的信用評價模型,通過挖掘C2C用戶評論內(nèi)容的信息,結(jié)合自然語言處理技術(shù)、觀點挖掘技術(shù)和主題模型技術(shù)進行信用打分,越高的分數(shù)對應越高的信用度。國內(nèi)文獻中對于新的信用評價模型的研究也有很多,這些研究都對現(xiàn)行的評分機制進行了相應的改進,并獲得了相應的效果。于兆吉等[4]使用拉開檔次機制的模糊綜合評價法,放大了各個被評價主體間信用級別的差異;陳傳紅等[5]針對目前實踐中使用的信譽值計算模型的弊端,提出了相應改進策略;李旭芳[6]、甘早斌等[7]分別提出了新的信用評價模型,并得到了新的功能與發(fā)現(xiàn)。
綜上,可以看出已有研究工作主要存在以下不足:第一,多數(shù)研究主張摒棄目前網(wǎng)上店鋪的信用評分機制,鮮有文獻提及如何改進已有信用評分方法;第二,多數(shù)研究提出信用評分模型或算法,并沒有獲得有效性檢驗。為此,本文以淘寶網(wǎng)為研究對象,主要開展了以下三個方面新的研究工作:第一,通過對已有賣家信用評分機制缺陷進行分析,在信用評分方法中引入了三個因素(主營業(yè)務占比、開店時長、賣家的買家身份信用),建立賣家信用評分的多因素校正模型,用以改進信用評分方法;第二,提出衡量店鋪給消費者帶來損失的指標——店鋪消費累積損失,通過神經(jīng)網(wǎng)絡分位數(shù)回歸(QRNN)模型,來驗證改進賣家信用得分在解釋店鋪消費累積損失中的有效性;第三,以淘寶網(wǎng)為例,將改進信用評分方法與原有信用評分機制進行比較,結(jié)果表明改進賣家信用得分不僅能夠有效地解釋店鋪消費者累積損失,而且能夠更好地預測其未來取值變動規(guī)律。
1信用評分理論基礎
信用評價是兩個主體相互信任的基礎,主要通過建立科學、合理的指標體系,運用恰當?shù)木C合評價方法,對可信任程度進行量化評分。根據(jù)信用評價對象不同,可將其大體劃分為:個人信用評價和企業(yè)信用評價。
在個人信用評價方面,常見于金融研究領域,大多通過個人信息作為信用評價的基礎完成個人信用評定,如:易傳和等[8]以個人基本情況(包括年齡等)、個人工作情況、個人經(jīng)濟情況、與金融機構(gòu)關(guān)系、歷史信用記錄等指標作為信用評價基礎。
在企業(yè)信用評價方面,又可以細分為實體企業(yè)、B2C電商企業(yè)和C2C電商賣家的信用評價。實體企業(yè)的信用評價主要依靠企業(yè)的財務報表數(shù)據(jù)來評估企業(yè)履行約定的能力和意愿,其指標體系包括定性指標和定量指標,如:譚中明[9]在中小企業(yè)的信用評價中,使用基礎素質(zhì)這個定性指標與財務狀況等定量指標作為信用評價的基礎。B2C企業(yè)的信用評價考慮了電子商務背景,如:王俊峰等[10]在對B2C企業(yè)進行信用評價時使用運營、償債、發(fā)展和網(wǎng)絡運營能力等指標。然而,C2C電商賣家的信用評價與上面討論的幾種信用評價有很大區(qū)別:第一,C2C電商賣家個人信息的不透明性;第二,C2C電商賣家財務信息的不充分性。因此,C2C電商賣家的信用評價既不能像個人信用評價時使用個人信息作為評價基準,也不能像實體企業(yè)或B2C電商企業(yè)一樣通過大量的財務數(shù)據(jù)進行信用評分。
綜上,C2C電商賣家的信用評價過程與其他對象存在很大差異,可以考慮通過其網(wǎng)上交易信息進行信用評價。
2電商賣家信用評分缺陷與改進
21目前信用評分機制的缺陷
淘寶網(wǎng)目前使用的信用評分機制具有代表性,主要采用信用分數(shù)累積方法,具體評分方式為:店鋪完成一筆交易之后,獲買家好評加1分、差評扣1分、中評不計分。
這種簡單的信用分數(shù)累加方法有以下幾個缺點:(1)開店時間早的賣家一般會比開店晚的賣家擁有更高的信用得分,但是并不能說明前者的信用水平就一定高于后者;(2)信用分數(shù)累加方法的無限增長性使得店鋪信用得分的比較失去了意義;(3)Zhang等[1]指出,這種信用評分的累積效應,使得后期進入的店鋪難以與早期店鋪競爭,促使一些急于求成的店鋪為了競爭而做出信用欺詐行為。
雖然這種信用分數(shù)累加方法存在弊病,但是越高的信用得分常常對應著更高的交易頻次,這樣的店鋪一般會對消費者有更大的保障。因此,信用分數(shù)累加方法也能在一定程度上體現(xiàn)賣家的信用狀況,可以對其中的不足進行改進,得到新的信用評分方法。
22對原始信用得分機制的改進
針對信用分數(shù)累加方法的缺點,考慮在其中加入以下因素:
(1)主營業(yè)務占比
主營業(yè)務占比是指淘寶店鋪中主要經(jīng)營的產(chǎn)品交易量占總交易量的比重,能體現(xiàn)一個店鋪的主要經(jīng)營方向。
在信用分數(shù)累加方法背景下,店鋪可以通過出售一些與主營業(yè)務不相關(guān)的物美價廉的產(chǎn)品,這類產(chǎn)品價格低、交易量大,且容易取得好評,從而使得店鋪快速獲得信用分數(shù)。但是賣家通過這種方式增加信用得分,會使得主營業(yè)務占比變低,所以通過加入主營業(yè)務占比因素,可以有效阻止賣家通過此方式進行信用分數(shù)的非常規(guī)獲取,使得信用分數(shù)更加真實地反映店鋪信用水平。
(2)店鋪開店時長
店鋪開店時長是指店鋪從開始營業(yè)至今的總時長。一般地,店鋪開店時長越長,往往在行業(yè)中占據(jù)更多的市場和利潤,并且在經(jīng)營管理、客戶服務等方面擁有更多的經(jīng)驗。
信用分數(shù)累加方法對于那些進入行業(yè)較晚的店鋪十分不利,制約了其獲得信用分數(shù)。網(wǎng)絡消費的從眾性使得那些早期進入且擁有更高賣家信用得分的店鋪獲得更多關(guān)注,自然使其擁有更多的交易機會,獲得更高的信用得分。這一因果鏈條,使得店鋪開店時長成為影響賣家信用得分的重要因素。為此,本文引入店鋪開店時長因素(以月為單位作為開店時長的周期)來部分抵扣信用得分隨開店時長增加而過分增長這一現(xiàn)象,改進信用分數(shù)累加方法的不足。
(3)賣家的買家身份信用
賣家的買家身份信用是指電商賣家在C2C平臺上作為買家進行交易后得到的信用累積。為了防止在購物過程中產(chǎn)生對自己店鋪不利的事件,電商賣家一般不會使用店鋪的賬戶進行網(wǎng)上消費,這使得正常電商賣家的買家身份信用分數(shù)保持在很低的水平。
現(xiàn)實中,存在賣家通過溝通達成協(xié)議進而互相購買彼此店鋪商品,但不發(fā)生實際交易的無金額虛假交易,實現(xiàn)賣家的買家身份信用分數(shù)的增長。所以,一個店鋪的買家身份信用得分可以從側(cè)面反映一個店鋪信用分數(shù)的虛假程度。為此,考慮在原始信用分數(shù)計算中加入賣家的買家身份信用因素,用以校正賣家信用分數(shù)中的虛假泡沫成分。
3模型與方法
針對已有賣家信用評分的不足,這里給出改進賣家信用評分方法,并建立其有效性檢驗方案。
31電商賣家信用評分多因素校正模型
32店鋪消費累積損失
為了檢驗改進信用評分方法的有效性,可以考慮信用評分與店鋪消費者效用之間的關(guān)系,若存在強的關(guān)聯(lián)關(guān)系,則表明建立的信用評分方法有效。然而,消費者效用難以直接度量,從正向去定義會忽視某些店鋪刻意刷好評現(xiàn)象。為此,本文從消費的不良結(jié)果方向提出店鋪消費累積損失這一概念,即店鋪消費的所有消費者在交易中所產(chǎn)生的損失累積和。
消費者在淘寶網(wǎng)進行消費的結(jié)果包括:第一,消費者對商品滿意并給出好評;第二,消費者對商品不滿意但仍接受了商品,給出中評或差評;第三,消費者對商品不滿意,不接受商品,選擇退貨且賣家同意退貨;第四,消費者對商品不滿意選擇退貨,但賣家不同意退貨從而產(chǎn)生糾紛。從這四種結(jié)果來看,只有第一種結(jié)果沒有對消費者造成損失,而后三種都或多或少地對消費者造成損失。
進一步,由于非好評率、退貨率及糾紛率都是以總交易筆數(shù)作為基數(shù)計算所得,而由于虛假交易與職業(yè)好評師的存在,使得非好評率、退貨率及糾紛率并不真實。因此,本文選擇非好評次數(shù)、退貨次數(shù)、糾紛次數(shù)作為定義店鋪的消費累計損失的指標,避免信用欺詐所導致的噪聲。定義店鋪消費累計損失R為:
R=a×A+b×B+c×C(7)
式(7)中,A、B、C分別為非好評次數(shù)、退貨次數(shù)、糾紛次數(shù);a、b、c分別為其權(quán)重。根據(jù)實際經(jīng)驗,給出差評、選擇退貨、產(chǎn)生糾紛對消費者造成影響的程度是逐漸遞增的,權(quán)重滿足:a
33有效性檢驗模型與指標
4實證研究
41數(shù)據(jù)與描述
根據(jù)中國互聯(lián)網(wǎng)信息中心2015年6月發(fā)布的《2014年中國網(wǎng)絡購物市場研究報告》,銷量排名前三的產(chǎn)品品類為:服裝鞋帽;電腦、通訊數(shù)碼產(chǎn)品及配件;日用百貨。為使研究更具有代表性,本文選取淘寶網(wǎng)主營業(yè)務為這三類產(chǎn)品的店鋪作為研究對象。本文使用八爪魚數(shù)據(jù)采集器直接從淘寶網(wǎng)抓取2015年10月29日共2671個店鋪的交易信息,使用淘寶網(wǎng)評定的賣家的買家身份信用等級數(shù)據(jù)代表賣家的買家身份信用水平。
表1報告了各變量的描述統(tǒng)計結(jié)果,可以看出:第一,主營業(yè)務占比、開店時長、買家身份信用等級的極差與標準差都較大,說明店鋪在這幾個因素方面的差異很大,這三個因素可能對賣家信用評分產(chǎn)生較大影響。第二,改進后所得賣家信用得分更為集中,其極差與標準差遠低于改進前的賣家信用得分,表現(xiàn)更加穩(wěn)健。此外,改進前賣家信用得分累積水平很高,最高分為20270397,與之相比,多因素校正模型明顯降低了信用得分水平,最大值僅為194911。
42建模與分析
按照4∶1的比例,將整個樣本劃分為兩個部分:樣本內(nèi)(樣本量為2137),樣本內(nèi)數(shù)據(jù)用于模型擬合;樣本外(樣本量為534),樣本外數(shù)據(jù)用于模型預測。在使用神經(jīng)網(wǎng)絡分位數(shù)回歸(QRNN)模型時,將懲罰參數(shù)固定為800,再根據(jù)BIC準則選出其隱含層節(jié)點數(shù)如表3所示。
型相比,QRNN模型在樣本內(nèi)表現(xiàn)與樣本外表現(xiàn)兩個方面都優(yōu)于前者,表現(xiàn)為R1(τ)的均值更大、QAAE(τ)的均值更小,意味著QRNN模型更適用于檢驗信用評分方法的有效性。第二,就QRNN模型的結(jié)果而言,改進后信用評分方法所得的R1(τ)均值都大于改進前方法,而前者的QAAE(τ)均值都小于后者,意味著改進信用評分方法是有效的,能夠更好地解釋和預測店鋪消費累積損失的變化。此外,改進后方法所得R1(τ)指標的標準差都要明顯小于改進前方法,而兩者的QAAE(τ)標準差則幾乎相當,這一結(jié)果表明:改進信用評分方法不僅有效,而且表現(xiàn)更加穩(wěn)健。
5結(jié)論與啟示
針對目前賣家信用評分存在的弊端,本文提出了多因素校正模型,并對所提模型的有效性進行了檢驗。一方面,引入了三個影響因素:主營業(yè)務占比、開店時長、賣家的買家身份信用水平,對已有的信用評分方法進行改進,建立賣家信用評分的多因素校正模型;另一方面,通過定義店鋪消費累積損失、建立QRNN模型、選取評價指標等,提出了改進信用評分方法的有效性檢驗方案。
以淘寶網(wǎng)信用評分實踐為研究對象,通過實證研究得到:第一,加入了三個改進因素之后的賣家信用分數(shù)更符合其本身所代表的含義——反映店鋪給消費者帶來的損失。第二,多因素校正模型計算所得信用分數(shù)可以為其他信用模型提供一個基數(shù),而不用完全摒棄原有的信用機制,這種方法更具有實際價值,為淘寶網(wǎng)為首的電商網(wǎng)站提供了信用機制改進的思路。第三,本文提出的方法同樣適用于其他信用機制或信用分數(shù)計算算法改進的檢驗。
參考文獻:
[1]Zhang Y, Bian J, Zhu W. Trust Fraud: A Crucial Challenge for Chinas E-commerce Market[J]. Electronic Commerce Research & Applications, 2013, 12(5): 299-308.
[2]彭惠, 王永瑞. C2C電子商務市場整體賣家信用分布研究[J]. 情報雜志, 2012, 31(5): 122-127.
[3]Zhang X, Cui L, Wang Y. CommTrust: Computing Multi-dimensional Trust by Mining E-commerce Feedback Comments[J]. Knowledge & Data Engineering IEEE Transactions on, 2014, 26(7): 1631-1643.
[4]于兆吉, 胡祥培, 毛強. 電子商務環(huán)境下信用評級的一種新方法[J]. 控制與決策, 2009, 24(11): 1668-1672.
[5]陳傳紅, 趙學鋒, 張金隆. 在線信譽系統(tǒng)的應用現(xiàn)狀及問題應對[J]. 情報雜志, 2012, 31(8): 171-176.
[6]李旭芳. 基于AHP的電商多維信譽的模型設計[J]. 統(tǒng)計與決策, 2014(11): 179-182.
[7]甘早斌, 曾燦, 馬堯, 等. 基于信任網(wǎng)絡的C2C電子商務信任算法[J]. 軟件學報, 2015(8): 1946-1959.
[8]易傳和, 彭江. 基于FAHP的個人信用評分模型[J]. 統(tǒng)計與決策, 2009 (15): 67-70.
[9]譚中明. 中小企業(yè)信用評價體系研究[J]. 學術(shù)論壇, 2009, 32(5): 123-127.
[10]王俊峰, 吳海洋. 基于改進的TOPSIS法的B2C企業(yè)信用評價[J]. 軟科學, 2014, 28(6): 21-24.
[11]Taylor J W. A Quantile Regression Neural Network Approach to Estimating the Conditional Density of Multiperiod Returns[J]. Journal of Forecasting, 2000, 19(4): 299-311.
[12]何耀耀, 許啟發(fā), 楊善林, 等. 基于RBF神經(jīng)網(wǎng)絡分位數(shù)回歸的電力負荷概率密度預測方法[J]. 中國電機工程學報, 2013, 33(1): 93-98.
[13]許啟發(fā), 張金秀, 蔣翠俠. 基于非線性分位數(shù)回歸模型的多期VaR風險測度[J]. 中國管理科學, 2015, 23(3): 56-65.
[14]Koenker R. Goodness of Fit and Related Inference Processes for Quantile Regression[J]. Journal of the American Statistical Association, 1999, 94(448): 1296-1309.
[15]Xu Q, Niu X, Jiang C, et al. The Phillips Curve in the US: A Nonlinear Quantile Regression Approach[J]. Economic Modelling, 2015, 49: 186-197.
(責任編輯:秦穎)