王興芬,杜惠英
(北京信息科技大學(xué),北京市100192)
近年來,電子商務(wù)發(fā)展迅速,伴隨著互聯(lián)網(wǎng)的發(fā)展逐漸滲透到人們生活的方方面面。中國電子商務(wù)研究中心發(fā)布的《2017年中國電子商務(wù)市場數(shù)據(jù)監(jiān)測報(bào)告》顯示,2017年中國電子商務(wù)交易額達(dá)到29.16萬億元,同比增長11.7%,電子商務(wù)交易規(guī)模繼續(xù)擴(kuò)大并保持高速增長態(tài)勢。網(wǎng)購用戶已經(jīng)達(dá)到5.33億人,同比增長14.3%。我國電子商務(wù)在快速發(fā)展的同時,投訴率居高不下。據(jù)統(tǒng)計(jì),2017年零售電商投訴占比最高,達(dá)到60.59%,同比增長7.91%。由此引發(fā)了諸多社會問題,其中信任問題最為嚴(yán)峻,對用戶決策具有重要影響。
電子商務(wù)以互聯(lián)網(wǎng)為媒介,可使交易變得更加便捷、快速、高效,但依然無法解決信息不對稱問題,阻礙了用戶信任感的提升,且隨著互聯(lián)網(wǎng)傳播速度的加快,用戶在線購買意愿也受到了極大影響。交易平臺設(shè)計(jì)的信譽(yù)系統(tǒng)可在一定程度上緩解這種狀況,對提高用戶對平臺的信心和信任感具有重要意義,然而其有效性卻一直飽受詬病。
本文基于相關(guān)研究理論與成果,結(jié)合當(dāng)前研究存在的問題與不足,針對評論文本分析和信任模型開展深入研究,構(gòu)建新的信任推薦模型,通過以電子商務(wù)平臺數(shù)據(jù)為支撐的實(shí)證分析為買家決策提供一定支撐,為電子商務(wù)平臺提高信任度提供一定借鑒。
迄今為止,已有眾多學(xué)者對信任進(jìn)行了研究,并結(jié)合當(dāng)時的背景和環(huán)境融入個人理解給出了各種不同的定義和解釋,其中有幾類得到了廣泛采用。社會學(xué)家盧曼(Luhmann N)等[1]認(rèn)為,信任是一種廣義上的期望,期望他人能夠保持自己的人格,這種人格至少是他已經(jīng)顯露且為社會看到的人格,在這種期望下他會控制自我、控制欲圖非分之舉的內(nèi)心,這表明信任是主觀的、樂觀的,且不對期望值進(jìn)行估計(jì)的的一種感性行為。科澤(Coser L A)等[2]從三個方面入手對信任進(jìn)行了解釋。首先,相信自然秩序、社會秩序是公平的、有利于自身的;其次,相信對方有能力勝任其扮演的角色;其三,相信對方是負(fù)責(zé)任的,并且會履行義務(wù)。
當(dāng)前有關(guān)信任的研究主要集中在兩個方面,一是對信任影響因素的研究;二是對信任計(jì)算模型的深入研究。信任影響因素主要從消費(fèi)者對環(huán)境、技術(shù)、安全、制度等的感知層面入手進(jìn)行研究;采用的信任計(jì)算模型大多為基于反饋評分的累加模型。
有關(guān)信任影響因素的研究成果非常豐富,研究人員從不同的角度和層面入手進(jìn)行了深入的挖掘和總結(jié)。金(Kim D J)等[3]從六個維度入手研究了電子商務(wù)信任的影響因素,包括內(nèi)容維度、產(chǎn)品維度、交易維度、技術(shù)維度、消費(fèi)者行為維度。坦(Tan F B)等[4]從三個維度入手闡述了信任的影響因素,包括個人維度、制度維度和人際維度。其中,個人維度指個人特征、家庭環(huán)境和文化因素等;制度維度包括網(wǎng)絡(luò)經(jīng)歷和保護(hù)認(rèn)知因素兩方面;人際維度包括有關(guān)競爭力、可信度、善良對待他人和忠誠度的知識。瓦爾楚赫(Walczuch R)等[5]將影響信任的因素分為個體因素、認(rèn)知因素、經(jīng)歷因素和知識因素。邵兵家等[6]將影響信任的因素歸納為企業(yè)自身、企業(yè)網(wǎng)站、消費(fèi)者個人因素和環(huán)境因素。耶爾文佩(Jarvenpaa S L)等[7]將影響信任的因素分為施信方過去的經(jīng)歷、戰(zhàn)略定位、信任傾向和對控制的感知。杰芬(Gefen D)[8]認(rèn)為,信任受對受信方熟悉程度以及個人信任傾向的影響,并由此推斷信任與施信方個人特征及對受信方的感知存在較大關(guān)系。
信任模型是一種量化的評論體系,使得平臺的信任程度可用數(shù)值進(jìn)行衡量。國內(nèi)外有關(guān)信任計(jì)算模型的研究已經(jīng)取得了較多成果,提出了各類拓展的信任度量模型。通過梳理各類信任模型相關(guān)文獻(xiàn),根據(jù)直接交互信任計(jì)算方式的不同,將之分為基于概率論的信任模型和基于評分累加的信任模型;根據(jù)應(yīng)用范圍的不同,將之分為P2P電子商務(wù)信任模型、文件共享信任模型、數(shù)據(jù)管理信任模型和協(xié)同計(jì)算信任模型。其中,甘早斌等[9]構(gòu)造了一個信任網(wǎng)絡(luò),以形式化語言進(jìn)行描述,認(rèn)為信任由直接信任和間接信任兩部分組成,同時提出了影響信任的時間衰減因子,采用評論相似度來衡量信任推薦的可信度。李道全等[10]對推薦節(jié)點(diǎn)進(jìn)行擴(kuò)展,除考慮具有直接交易關(guān)系的節(jié)點(diǎn)外,還引入了二層節(jié)點(diǎn)即有間接交易關(guān)系的節(jié)點(diǎn),綜合考慮時間、金額、交易失敗次數(shù)等因素,針對交易失敗次數(shù)設(shè)置懲罰因子,該模型在理論上能夠提高推薦的準(zhǔn)確性并有效遏制惡意節(jié)點(diǎn)的攻擊,但二層節(jié)點(diǎn)的推薦權(quán)重問題并未得到解決。巴爾加瓦(Bhargava K)等[11]對評論內(nèi)容進(jìn)行分析,根據(jù)情感分析結(jié)果修正評分,提出了基于評論內(nèi)容分析的信任模型,該模型能夠挖掘評論文本所表達(dá)的主觀信息,減少根據(jù)客觀評分判斷買家情感出現(xiàn)的偏差,但對評論本身是否具有推薦價值缺乏考慮。波恩特拉科(Porntrakoon P)等[12]采用神經(jīng)語言程序?qū)W(NLP)方法對評論文本進(jìn)行信息抽取,得出評論所涉及的維度,對不同維度賦予不同權(quán)重,對每一個維度結(jié)構(gòu)(中心詞,修飾語)中的修飾語進(jìn)行情感分析,計(jì)算該維度信任得分,結(jié)合各維度權(quán)重獲取每條評論的信任得分,最后對所有評論信任得分進(jìn)行求和獲得對該商家的信任值,在各維度權(quán)重的選取上,只是根據(jù)該維度評論條數(shù)占所有維度評論總量的比重來確定,其合理性和必要性有待進(jìn)一步研究。應(yīng)志恒等[13]考慮交易時間、金額等因素的影響,引入反饋機(jī)制,建立了全新的信任推薦模型,該模型能夠有效挖掘評論的真實(shí)推薦價值,提高計(jì)算所得信任值對買家決策的參考價值,且具有較高的可靠性。
基于已有研究成果,本研究以真實(shí)的消費(fèi)者對消費(fèi)者(C2C)電子商務(wù)交易過程為出發(fā)點(diǎn),結(jié)合交易現(xiàn)狀開展研究。
首先,對當(dāng)前研究存在的問題進(jìn)行了歸納:一是買家購物后發(fā)表的評論通常為習(xí)慣性好評,買家交易信息獲取難度大;二是買家之間幾乎沒有交流,無法建立有效的熟悉度關(guān)系;三是多數(shù)買家僅在第一次與某商家接觸時才會進(jìn)行信任判斷,若是發(fā)起第二次交易,則說明買賣雙方信任已經(jīng)建立,而如果第一次交易失敗,那么買賣雙方將無法建立有效信任。買家對賣家的初始信任一般通過其他買家對商家的推薦建立,而推薦的主體便是買家在交易完成后給出的評論信息。在信任研究中,對評論信息的利用通常是憑借評論標(biāo)簽,即好評、中評、差評進(jìn)行信任的累加,并沒有對評論信息的內(nèi)容進(jìn)行分析,而根據(jù)觀察,評論標(biāo)簽與實(shí)際評論內(nèi)容存在不相對應(yīng)的情況,好評標(biāo)簽下的評論內(nèi)容可能并非好評,存在評論內(nèi)容反映信息較少的情況,無法產(chǎn)生推薦效果。
接下來,對評論信息進(jìn)行有針對性的分析,對評論信息分析算法進(jìn)行拓展,挖掘其真實(shí)推薦價值。具體評論信息分析步驟如下:
第一步:標(biāo)準(zhǔn)評論信息詞組的確定。選定標(biāo)準(zhǔn)評論信息,涵蓋物流、商家、產(chǎn)品、服務(wù)四個方面,取四個詞的相關(guān)詞語各十個,形成標(biāo)準(zhǔn)評論信息詞組。
第二步:推薦權(quán)重的確定。依據(jù)評論文本與標(biāo)準(zhǔn)評論詞組的相似度,確定評論推薦權(quán)重。
第三步:評論文本情感分析。對評論文本進(jìn)行情感分析,得到評論的真實(shí)情感傾向,進(jìn)而綜合考慮時間、金額等信息,建立推薦信任模型。
標(biāo)準(zhǔn)評論信息詞組是某一維度評論詞語的集合,這組詞語能夠較為準(zhǔn)確、全面地代表該維度可能出現(xiàn)的評論內(nèi)容。因此,這組詞語所代表的評論內(nèi)容對消費(fèi)者具有較高價值。如果某一文本內(nèi)容與有關(guān)詞組相似,那么相似程度越高,評論文本對消費(fèi)者的推薦價值就越接近,利用相似度,我們可以較為準(zhǔn)確地衡量兩個文本內(nèi)容的接近程度。文本的相似度指兩個文本特征的匹配程度。當(dāng)前計(jì)算文本相似度較為常用的方法主要可分為兩類:一類是基于統(tǒng)計(jì)的方法,包括基于向量空間模型的詞頻—逆文檔頻率(TF-IDF)算法、基于漢明距離的相似度算法和基于隱性語義索引的相似度算法;另一類是基于語義理解的相似度算法,這類方法依賴于語義詞典。對于買家評論,評論文本一般篇幅較短,包含的詞語較少,反映文本特征的特征詞也比較少且頻數(shù)低,利用統(tǒng)計(jì)的方法無法通過有限的特征詞來表達(dá)文本的主題,因此將文本相似度的計(jì)算轉(zhuǎn)化為特征詞之間相似度的計(jì)算是一種較為合理的方法。本文采用的是基于知網(wǎng)語義詞典的相似度分析方法,其優(yōu)勢在于不需要復(fù)雜的計(jì)算,不必考慮數(shù)據(jù)稀疏問題,且對語料的依賴程度相對較低,對電子商務(wù)網(wǎng)站評論信息的分析具有較好的適用性。
在知網(wǎng)語義詞典中,收錄了1 618個義原,這些義原按照上下位關(guān)系形成了層次體系嚴(yán)密的義原樹,所有義原形成了多個義原樹,分別是事件、實(shí)體、屬性、屬性值、數(shù)量值、次要特征、語法、動態(tài)角色與特征。其中,前面七個為基本義原,后面兩個分別為語法義原和關(guān)系義原,此外在描述概念的語言表達(dá)式中還會包含一些符號,稱為符號義原。實(shí)詞的語言描述表達(dá)式均由基本義原(Basic)表達(dá)式、語法義原(Grammar)表達(dá)式、關(guān)系義原(Relation)表達(dá)式、符號義原(Symbol)表達(dá)式組成,其中基本義原表達(dá)式是必要的,而虛詞的語言描述表達(dá)式則由關(guān)系義原表達(dá)式或語法義原表達(dá)式組成。
假設(shè)存在兩個詞w1和w2,它們的義項(xiàng)集分別為和c22,…,c2m)。規(guī)定w1和w2之間相似度的計(jì)算方法為,取中的任意一個義項(xiàng)c1i和中的任意一個義項(xiàng)c2j進(jìn)行相似度計(jì)算,所得到的最大相似度即為w1和w2的相似度sim(w1,w2),即:
其中,wu1x、wu2y為c1i、c2j中的兩個義原,k為兩個義項(xiàng)同類義原按相似度最大原則匹配的義原對的數(shù)量。當(dāng)m<n時,k=m;當(dāng)m>n時,k=n。x≤m,y≤n。
義原在知網(wǎng)詞典表達(dá)體系中均有各自的相對位置,因此兩個義原的相似度可根據(jù)它們在義原樹中的相對位置加以衡量。假設(shè)兩個義原之間的相對距離為d,那么義原的相似度sim(wu1,wu2)可以表示為:
其中,θ為可調(diào)節(jié)參數(shù)。
評論由詞語構(gòu)成,評論的相似度取決于詞語間的相似度。傳統(tǒng)向量空間模型容易產(chǎn)生緯度高、數(shù)據(jù)稀疏、計(jì)算復(fù)雜度高等問題。本文根據(jù)語言表達(dá)的特性(即每一個短文本都由幾段用標(biāo)點(diǎn)符號分隔的短句組成,每一個短句都表達(dá)了一個中心意思),將兩條評論文本D1和D2按照標(biāo)點(diǎn)符號切分為,取中的一個短句s11和中的任意一個短句s2j計(jì)算相似度,與相似度最大的短句組成相似對similars11(s11,s2j)。同理,找到其他所有相似對,組成相似對集合相似對similars1i的計(jì)算式為:
其中,w1i、w2i分別表示s11、s2j中的詞語。當(dāng)m<n時,k=m;當(dāng)m>n時,k=n。
假設(shè)共有N個相似對,則文本相似度sim(Di,Dj)的計(jì)算式為:
選擇標(biāo)準(zhǔn)評論文本的第一步是確定主題詞。本研究以U盤為交易產(chǎn)品,選定的主題詞是物流、商家、產(chǎn)品、服務(wù)。根據(jù)主題詞搜索相關(guān)詞,包括名詞和形容詞,最終形成四個主題詞組。形成主題詞組的方法為,首先獲取評論文本,然后進(jìn)行分詞,以分詞文本作為語料庫,應(yīng)用詞向量(word2vec)模型進(jìn)行訓(xùn)練,該模型能夠根據(jù)語料將詞語表示成向量模式,并用向量之間的余弦值衡量詞語的相似度[14],以主題詞作為輸入,輸出與主題詞相關(guān)的若干詞語,即可從中選擇相似度較大的詞語和主題詞一起形成主題詞組。
利用爬蟲工具獲取某電子商務(wù)網(wǎng)站10萬條評論作為訓(xùn)練語料,經(jīng)過訓(xùn)練,輸入主題詞后得到相關(guān)詞語表,從中篩選出語義相近的10個詞語作為標(biāo)準(zhǔn)評論語句,得到物流詞組seglogis、商家詞組segseller、產(chǎn)品詞組segproduct、服務(wù)詞組segservice分別為:
seglogis=(物流,送貨,發(fā)貨,快遞,配送,貨物,服務(wù),運(yùn)送,自營,態(tài)度)
segseller=(商家,店家,廠家,賣家,負(fù)責(zé),答復(fù),提供,愛理不理,投訴,不負(fù)責(zé)任)
segproduct=(產(chǎn)品,商品,品質(zhì),物品,質(zhì)量,東東,信得過)
segservice=(服務(wù),態(tài)度,售后服務(wù),一流,配送,周到,小哥,優(yōu)質(zhì),良心,掌柜)
根據(jù)確定的標(biāo)準(zhǔn)評論文本詞組,結(jié)合本文設(shè)計(jì)的文本相似度算法,分別得到各評論文本與標(biāo)準(zhǔn)評論文本的相似度。具體實(shí)現(xiàn)流程參見圖1。評論文本和標(biāo)準(zhǔn)評論文本均為詞組形式。其中,評論文本表示為segD1=(s11,s12,…,s1m),標(biāo)準(zhǔn)評論文本表示為segstd=(seglogis,segseller,segservice,segproduct)。將s1i與segstd中的詞語進(jìn)行相似度計(jì)算,取最大的一對進(jìn)行匹配,已經(jīng)匹配過的不再進(jìn)入匹配,由此形成最優(yōu)匹配。
圖1 相似度算法流程
每一條評論都表達(dá)了評論者的感情,或正向,或中性,或負(fù)向,網(wǎng)絡(luò)購物平臺將這些評論分成了好評、中評、差評三類。然而,有些帶有好評標(biāo)簽的評論其內(nèi)容卻可能為中性或帶有負(fù)面情緒,中評和差評標(biāo)簽所對應(yīng)的評論內(nèi)容也存在類似情況。很多信任模型在匯集評論信息時,并沒有考慮到這一點(diǎn),在信任累積過程中直接對好評、中評、差評進(jìn)行加1、加0、減1的操作,這樣是無法反映評論者真實(shí)情緒和商家實(shí)際情況的。因此,本文對評論內(nèi)容進(jìn)行情感分析,通過分析得到正向、中性或負(fù)向情緒,并對不同情緒下的信任累積進(jìn)行不同的處理,以更加真實(shí)、有效地反映商家的實(shí)際信用狀況。
借助知網(wǎng)語義詞典推進(jìn)本文的研究。知網(wǎng)語義詞典中存在一些具有貶義或褒義的詞語,其中褒義詞匯包括褒義評論詞和褒義情感詞共4 566個,貶義詞匯包括貶義評論詞和貶義情感詞共計(jì)4 370個,對不同的詞語分別賦予不同的情感值senV以表達(dá)不同的感情。
對評論文本Di按照標(biāo)點(diǎn)符號進(jìn)行分割,可以得到幾個短句,即segDi=(si1,si2,…,sin),每個短句都表達(dá)了一個主題。比如,對評論文本“這也太坑人了吧,買的64G怎么只有57.9G,少了6.1G,少了10%,這就是大品牌的U盤?果然很垃圾”進(jìn)行分割,可以得到si1={這也太坑人了吧},對si1進(jìn)行分詞,去掉虛詞、指示代詞得到相應(yīng)的詞組sci1={“太”,“坑人”}。與之類似,可以發(fā)現(xiàn),這類詞組一般包括1~5個詞語,而詞語之間的組合可以達(dá)到20種之多。對存在程度副詞和否定副詞的詞組應(yīng)當(dāng)予以特別重視,因?yàn)檫@兩類詞語能夠加強(qiáng)某些詞組的情感強(qiáng)度或者造成語義反轉(zhuǎn)。
對文本Di進(jìn)行分割后得到對其中的短句sij進(jìn)行分詞,對每個短句進(jìn)行情感分析,得到每個短句的情感極性值規(guī)定整個文本的情感極性值為:
假設(shè)短句sij中存在組合A+B,則對于A+B情感極性值senti(A+B)的計(jì)算可對照以下幾種情況進(jìn)行:第一,如果文本中詞語A的情感極性值已知,直接取已知情感極性值senti(A);如果A的情感極性值未知,比較A與各情感極性值已知詞語term的相似度sim(A,term),取最大值max(sim(A,term)),則A的情感極性值為senti(term)×max(sim(A,term))。第二,如果A是程度副詞,B是中心詞語,則A+B的情感極性值senti(A+B)=level(A)×senti(B);如果A是中心詞語,B是程度副詞,則A+B的情感極性值senti(A+B)=level(B)×senti(A)。第三,如果A是否定副詞,B是中心詞語,則A+B的情感極性值senti(A+B)=(-1)×senti(B);如果A是中心詞語,B是否定副詞,則A+B的情感極性值senti(A+B)=(-1)×senti(A)。第四,如果不存在程度副詞和否定副詞,則A+B的情感極性值senti(A+B)=senti(A)+senti(B)??梢?,對于組合A+B的情感極性值senti(A+B),其計(jì)算式為:
而短句si j的情感極性值可根據(jù)其詞語組合的具體情況加總得到。
運(yùn)用分詞工具,采用Python軟件的分詞模塊jieba0.39對文本進(jìn)行分割,得到,繼而對進(jìn)行分詞,去掉停用詞后得到表征文本情感的幾個詞語組合。將詞語組合中的詞語與所建立的情感詞典進(jìn)行匹配,如果檢測到包含正面詞語、負(fù)面詞語、程度副詞或者否定副詞,則按照相應(yīng)的規(guī)則進(jìn)行處理,并在所有詞語組合匹配完畢后對詞語組合的情感值進(jìn)行加權(quán)平均,得到文本的情感極性值。情感分析流程參見圖2。
圖2 文本情感極性值計(jì)算流程
信任受諸多因素影響,梳理相關(guān)文獻(xiàn)發(fā)現(xiàn),影響推薦信任權(quán)重的因子有交易時間、交易金額、反饋評分、交易失敗次數(shù)等。重點(diǎn)考慮初次交易時買家對商家的信任,將交易時間、交易金額作為影響信任的因子,并引入評論中心度因子、評論情感因子進(jìn)行綜合考量。
按照常識,當(dāng)前時間的成功交易更容易使買方對賣方產(chǎn)生信任感,隨著時間的流逝,其信任感會慢慢變?nèi)酰碳业男袨橐矔l(fā)生變化。因此,對于買家給出的評論,一段時間之前的評論可能無法準(zhǔn)確反映賣家當(dāng)前的實(shí)際情況,而在一定的時間之內(nèi),這種信任感的弱化會比較緩慢。用時間窗Δt來衡量這段時間,即在當(dāng)前交易時間Δt內(nèi),信任感不會變化,當(dāng)間隔大于Δt時,信任感就會隨著時間間隔的增大呈加速弱化狀態(tài)。那么,時間因子T(Δt)Di可以表示為:
其中,e為歐拉常數(shù),v表示交易的時間窗。
在大額交易情況下,買方通常會在仔細(xì)斟酌的基礎(chǔ)上進(jìn)行交易決策,交易完成后對產(chǎn)品情況的反映也相對認(rèn)真,給出的評論往往能夠比較真實(shí)地反映交易的實(shí)際情況,且大額交易中商家的態(tài)度對于反映商家真實(shí)的信譽(yù)狀況也極其重要。本文認(rèn)為,交易金額越大,其評論的參考價值越高,推薦的可信度越高。金額因子MDi可表示為:
其中,Mn為第n次交易的金額,n為交易的總次數(shù)。
每一條評論的內(nèi)容都不盡相同,不同的買家其表達(dá)的方式不同,表達(dá)的情緒不同,表達(dá)的內(nèi)容不同,都會導(dǎo)致評論價值的差異。不同的評論其參考價值也截然不同,有的評論簡短,有的評論涉及內(nèi)容很多,有的評論僅僅表達(dá)購物心情,有的評論與購物內(nèi)容無關(guān),它們對推薦信任累積的重要性也不同。按照本文設(shè)計(jì)選定標(biāo)準(zhǔn)評論文本,隨著兩者相似度的不同,其推薦的重要性也會產(chǎn)生相應(yīng)的變化。因此,根據(jù)公式(5),設(shè)置評論中心度因子RDi:
其中,Dstd表示標(biāo)準(zhǔn)評論文本,Di表示任一評論文本。
多數(shù)研究者按照好評、中評、差評的標(biāo)簽進(jìn)行推薦信任累積,即好評加1,中評加0,差評減1。這種方式簡單、便捷,有利于快速計(jì)算賣家信用度,但沒有考慮大量的評論標(biāo)簽與評論內(nèi)容不相符的情況。比如,好評標(biāo)簽對應(yīng)的內(nèi)容有中性的,有表達(dá)不滿情緒的,差評標(biāo)簽對應(yīng)的內(nèi)容也有中性的,中評標(biāo)簽對應(yīng)的內(nèi)容有表達(dá)肯定態(tài)度的,僅僅按照評論標(biāo)簽進(jìn)行推薦信任累積并不合理。本文設(shè)計(jì)了情感分析方法,分析每一條評論所表達(dá)的情緒,確定每一條評論的情感傾向,獲取情感極性值。評論表達(dá)的情感包括正向、負(fù)向和中性三種情況,不同的情感對評論推薦作用具有不同的影響。根據(jù)公式(6),評論的情感因子sDi可表示為:
在網(wǎng)絡(luò)購物中,買家初次購買時,由于缺乏與商家交易的歷史經(jīng)驗(yàn),加之雙方信息不對稱,很難對商家有一個準(zhǔn)確的把握。在這種情況下,買家往往很難進(jìn)行購物決策,而其他買家的評論正好可以幫助其了解商家、產(chǎn)品、物流等相關(guān)情況。因此,評論對獲取信任具有非常重要的作用,而每條評論因?qū)傩圆煌鋮⒖純r值也不同。本文提出了交易時間、交易金額等因素,并引入評論中心度和評論情感兩個因子,進(jìn)而分析其對推薦信任的影響。推薦信任是所有評論產(chǎn)生的信任值的累加,本文規(guī)定推薦信任RT的計(jì)算式為:
其中,n為選取的評論條數(shù)。
研究數(shù)據(jù)來源于某知名電子商務(wù)網(wǎng)站,共選取10家銷售U盤的店鋪,每個店鋪選取1 000條評論數(shù)據(jù)。得到的信息包括買家用戶名、買家信用等級、買家評論等級(好、中、差)、評論文本、產(chǎn)品類型、產(chǎn)品規(guī)格和評論時間,形成了多屬性的樣本數(shù)據(jù)。仿真內(nèi)容為對比直接按照好、中、差評標(biāo)簽累積信任值和按照本文模型進(jìn)行信任累積的變化趨勢。采用Python軟件對實(shí)驗(yàn)進(jìn)行模擬仿真。結(jié)合樣本數(shù)據(jù)和研究對象特點(diǎn),選擇表1所示的主要參數(shù)和取值。
信任的累積指通過好評加1、中評加0、差評減1的方式,對所有相關(guān)評論進(jìn)行累加求和,以獲取消費(fèi)者對商家的信任值,信任值的高低可在一定程度上反映商家的可信程度。本節(jié)選取了1 000條評論,其中好評500條,中評300條,差評200條,模擬隨著評論的增加一般信任累加模型與本文模型信任值的變化情況。
一般信任累加模型根據(jù)評論標(biāo)簽所對應(yīng)的分值進(jìn)行信任累加。由圖3可以清楚地發(fā)現(xiàn),一般信任累加模型的信任累加值僅反映了評論數(shù)量的變化,而本文模型的信任累加值則呈曲線變化趨勢,累加速度更緩慢,更符合實(shí)際信任增長情況。
此外,還模擬了對信任取平均值時信任值隨交易次數(shù)增加而產(chǎn)生的變化情況。對信任取平均值時,一般信任累加模型的信任值沒有任何變化,本文模型能夠根據(jù)評論的內(nèi)容動態(tài)反映信任值的變化。因此,本文模型能夠更加真實(shí)地反映信任值在交易過程中的變化。
表1 本文參數(shù)取值
圖3對信任值的求和模擬過程展現(xiàn)了不同類別評論的混合累加,好評和差評產(chǎn)生的累加速率較一般信任累加模型低,中評也對信任累加產(chǎn)生了影響。因此,一方面,本文模型有效區(qū)分了好評、中評、差評三類評論對信任累加的影響;另一方面,本文模型不同于一般信任累加模型,體現(xiàn)了對某一類別不同評論的區(qū)分。在對信任值取平均值的實(shí)驗(yàn)過程中,選取某一類評論進(jìn)行分析,結(jié)果發(fā)現(xiàn)本文模型能夠打破既定評論類別劃分界限,挖掘評論文本潛在意義。綜合以上分析,說明模型既符合信任累加的一般規(guī)律,又體現(xiàn)了優(yōu)化信任累積的效用。
交易成功率指總交易次數(shù)中成功交易次數(shù)所占的比重,抽取20家店鋪共20 000條評論,以好評數(shù)作為成功交易次數(shù),對本文模型與一般信任累加模型進(jìn)行比較,即在信任值相同的情況下對本文模型的信任值與一般累加模型的交易成功率進(jìn)行比較。
圖3 信任累加趨勢(求和)
圖4 交易成功率分析
由圖4可以看出,在信任值相同的情況下,交易成功率高于一般信任累加模型,即在交易次數(shù)相同的情況下,為使本文模型的信任值與一般信任累加模型一致,需要數(shù)量更多的好評。因此,本文模型能夠更加真實(shí)地反映真實(shí)信任的積累,所得到的信任值也更具可信度,具有較好的適應(yīng)性與實(shí)用價值。
目前有關(guān)推薦信任的研究大多基于買家評分,卻沒有考慮評分與評論內(nèi)容的一致性,即沒有分析好評的內(nèi)容是否表達(dá)了積極情緒,中評的內(nèi)容是否完全中性,差評的內(nèi)容是否表達(dá)了負(fù)面情緒,因此直接進(jìn)行評分累加將導(dǎo)致信任評估失準(zhǔn)。而且,當(dāng)所有評論都是好評時,計(jì)算得到的信任值將無法體現(xiàn)商家的實(shí)際信用狀況。此外,沒有考慮評論文本是否具有推薦價值,即評論所表達(dá)的主題與購買商品是否相關(guān)或具有一定的相關(guān)性。而本研究則解決了上述問題,主要結(jié)論如下:
1.在理論上,本文從評論文本分析入手建立了新的推薦信任模型,通過比較評論文本與選定標(biāo)準(zhǔn)文本相似度,分析評論文本情感值來確定文本推薦價值,并引入評論文本中心度和評論文本情感因子作為信任的影響因子,此外還考慮了交易時間、交易金額等因素,使模型更具客觀性。
2.設(shè)計(jì)了合理的情感分析方法。本研究借助了知網(wǎng)語義詞典,其中存在一些貶義或褒義詞。對評論內(nèi)容進(jìn)行情感分析得到正向、中性和負(fù)向情緒,對不同詞語分別賦予不同的情感值senV以表達(dá)不同的情感,對不同情緒下的信任累積分別進(jìn)行處理,以更加真實(shí)、有效地反映商家的實(shí)際信用狀況。
3.在情感分析實(shí)現(xiàn)工具上,本文采用Python軟件的分詞模塊對文本進(jìn)行分割,去掉停用詞后得到表征文本情感的幾個詞語組合,將詞語組合中的詞語與所建立的情感詞典進(jìn)行匹配,對詞語組合的情感值進(jìn)行加權(quán)平均,得到文本的情感極性值。
4.在實(shí)證分析上,本文采用Python軟件對實(shí)驗(yàn)進(jìn)行模擬。仿真結(jié)果表明,與一般信任累加模型相比,本文模型的信任累加值呈曲線變化趨勢,累加速度更緩慢,更符合實(shí)際信任增長情況。從平均信任累計(jì)趨勢看,一般信任累加模型的信任值沒有任何變化,本文模型能夠根據(jù)評論的內(nèi)容動態(tài)反映信任值的變化。從交易成功率看,在信任值相同的情況下,本文得到的交易成功率高于一般信任累加模型,因此本文模型能夠更加真實(shí)地反映真實(shí)的信任積累,得到的信任值也更具可信度,具有較好的適應(yīng)性和實(shí)用價值。
綜上所述,在理論方面,本研究拓展了文本分析方法,對文本相似度分析算法和情感分析算法進(jìn)行了研究和優(yōu)化,基于評論文本分析提出了綜合考量文本相似度、文本中心度、評論文本情感等因素的信任影響因子體系,對研究電子商務(wù)平臺信任具有一定的理論意義。在實(shí)證分析方面,以電子商務(wù)網(wǎng)站實(shí)際評論數(shù)據(jù)為支撐,結(jié)合Python算法編程加以實(shí)現(xiàn),驗(yàn)證了算法的有效性,形成了切實(shí)可行的算法體系,具有一定的實(shí)踐指導(dǎo)意義,為電子商務(wù)網(wǎng)站提高信任度和幫助用戶購買決策提供了科學(xué)合理的理論支撐。因此,本文模型對推薦信任模型構(gòu)建具有重要指導(dǎo)意義,能夠?yàn)橄M(fèi)者提供有效的決策支持。
當(dāng)然,本研究仍然存在很多局限性。評論文本相似度分析采用基于語義的方法,基于語言表達(dá)特性對評論文本按照標(biāo)點(diǎn)符號進(jìn)行切分,匹配出最大相似度對,并以所有匹配對相似度的算術(shù)平均值作為兩個文本的相似度,并沒有對匹配對的內(nèi)容進(jìn)行識別,即兩個匹配對可能均為針對同一維度的評論,因此后續(xù)研究需要對匹配對的內(nèi)容進(jìn)行預(yù)處理。在情感分析方面,評論文本中包含很多表達(dá)特定情感的中性詞,為準(zhǔn)確識別評論所表達(dá)的情感傾向,還需要進(jìn)一步擴(kuò)充情感詞典。此外,本文對惡意差評、共謀評論識別能力有限,需要對這些類型的評論加以特性分析并進(jìn)行相應(yīng)處理,以提高評論的可靠度。
1.對電商而言,消費(fèi)者信任對電商平臺發(fā)展具有重要影響,是電商平臺的核心競爭力之一,因此電商應(yīng)當(dāng)在保障產(chǎn)品質(zhì)量的同時,致力于提高平臺的信譽(yù)度和便捷度。此外,電商平臺還需要在惡意差評規(guī)避、好評可信度保障、用戶信息與財(cái)務(wù)安全等方面作進(jìn)一步的考量和提升。
對平臺而言,在設(shè)計(jì)評論模塊時,需要重點(diǎn)結(jié)合相似度分析方法,通過比較評論文本與選定標(biāo)準(zhǔn)文本的相似度和分析評論文本的情感值來確定文本推薦價值,并考慮交易時間、交易金額等因素的影響來確定推薦度,這樣有助于提高評論文本的參考價值。
2.對消費(fèi)者而言,在線評論信息是消費(fèi)者判斷電商平臺信任度的重要依據(jù)。只有結(jié)合在線評論文本分析與情感分析,科學(xué)合理挖掘買家在線評論所體現(xiàn)的信息,才能科學(xué)判斷電商平臺信譽(yù)度,由此形成更加理性的消費(fèi),更好地保障消費(fèi)者權(quán)益。
3.監(jiān)管機(jī)構(gòu)的嚴(yán)格監(jiān)督以及各類政策法規(guī)的規(guī)范是電子商務(wù)健康發(fā)展的重要保障。電商、消費(fèi)者和監(jiān)管機(jī)構(gòu)只有共同努力,才能營造良好購物環(huán)境,保障電子商務(wù)健康有序發(fā)展。