摘 要新發(fā)展格局下,實體企業(yè)依托電商平臺零售商品已成為我國電子商務(wù)的主要模式。良好的網(wǎng)絡(luò)產(chǎn)品交流平臺對企業(yè)提升電子商務(wù)競爭力具有積極作用。選取包含評論者和評論內(nèi)容的多類型評論特征指標(biāo),構(gòu)建基于ID3算法的網(wǎng)絡(luò)產(chǎn)品交易非理性評論識別模型,并對具體案例中的非理性評論進(jìn)行了識別。研究表明,網(wǎng)絡(luò)產(chǎn)品交易非理性評論識別模型的總體識別效果較好,F(xiàn)1值達(dá)到73%,沒有出現(xiàn)過擬合現(xiàn)象,泛化能力較好。本方法優(yōu)于隨機(jī)森林、BP神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)等機(jī)器學(xué)習(xí)方法,能夠較好地解決以離散型特征指標(biāo)為主的非理性評論的識別問題。
關(guān)鍵詞網(wǎng)絡(luò)產(chǎn)品 交易評論 非理性評論 ID3算法 決策樹
一、引 言
互聯(lián)網(wǎng)技術(shù)的蓬勃發(fā)展正在加快推進(jìn)全球數(shù)字化,促進(jìn)產(chǎn)業(yè)數(shù)字化和數(shù)字產(chǎn)業(yè)化轉(zhuǎn)型。數(shù)字經(jīng)濟(jì)已成為中國經(jīng)濟(jì)高質(zhì)量發(fā)展的新引擎,正在激勵更多實體企業(yè)與電商平臺密切合作,共同推動電商平臺零售走向新的發(fā)展階段。在新發(fā)展格局下,實體企業(yè)依托電商平臺零售商品已成為我國電子商務(wù)的主要模式。①中國互聯(lián)網(wǎng)絡(luò)信息中心發(fā)布的第49次《中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告》顯示,截至2021年12月,我國網(wǎng)民規(guī)模達(dá)到10.32億人,互聯(lián)網(wǎng)普及率超過73%,較2020年底增長4296萬人,同比增長4.34%。②手機(jī)是網(wǎng)民上網(wǎng)的最主要設(shè)備,手機(jī)網(wǎng)民規(guī)模達(dá)到10.29億人,占我國網(wǎng)民總數(shù)的99.7%。借助互聯(lián)網(wǎng)的蓬勃發(fā)展,網(wǎng)絡(luò)零售逐漸成為實現(xiàn)國內(nèi)大循環(huán)的重要力量。2021年我國網(wǎng)絡(luò)購物的用戶規(guī)模達(dá)到8.42億人,較2020年底增長5968萬人,占網(wǎng)民總數(shù)的81.6%。網(wǎng)絡(luò)零售借助數(shù)字經(jīng)濟(jì)的力量吸引了大量國內(nèi)國際、城市鄉(xiāng)村居民的消費需求。根據(jù)商務(wù)部的統(tǒng)計數(shù)據(jù),2021年中國網(wǎng)絡(luò)零售總額高達(dá)13.1萬億元,同比增長14.1%,占社會消費品零售總額的24.5%,連續(xù)8年位居全球電商零售市場首位。網(wǎng)絡(luò)購物已成為生活中非常重要的一部分。
隨著網(wǎng)絡(luò)購物的高速發(fā)展,電商平臺之間的競爭日益激烈。良好的消費體驗有助于電商平臺提高競爭力、吸引更多實體企業(yè)入駐和刺激用戶消費。越來越多的電商平臺致力于改善平臺的消費體驗,為此,電商平臺除了要建立良好的商品和服務(wù)展示平臺以外,還要為消費者打造進(jìn)行消費體驗交流與評價的平臺,以不斷完善平臺的消費體驗。中國消費者協(xié)會調(diào)查顯示,97.7%的消費者在線上購物時都會查閱或參考相關(guān)評論信息,包括使用體驗評價、商家服務(wù)評價等。( 《中消協(xié):超七成參與網(wǎng)購評價的消費者遭遇默認(rèn)好評》,https://baijiahao.baidu.com/s?id=1628038463224849684amp;wfr=spideramp;for=pc。)然而,網(wǎng)絡(luò)產(chǎn)品交易評論具有很強(qiáng)的主觀性,評論的客觀性與合理性很難保證,這導(dǎo)致大量無效或具有欺騙性的評論內(nèi)容充斥網(wǎng)絡(luò)。2020年國家網(wǎng)絡(luò)信息辦公室發(fā)布《網(wǎng)絡(luò)信息內(nèi)容生態(tài)治理規(guī)定》,要求網(wǎng)民在發(fā)表自已觀點的同時,對自己的言論負(fù)責(zé),并承擔(dān)相應(yīng)的責(zé)任與義務(wù)。( 國家互聯(lián)網(wǎng)信息辦公室:《網(wǎng)絡(luò)信息內(nèi)容生態(tài)治理規(guī)定》,http://www.cac.gov.cn/2019-12/20/c_1578375159509309.htm。)在大數(shù)據(jù)時代,質(zhì)量參差不齊的網(wǎng)絡(luò)產(chǎn)品交易評論很有可能影響消費者的購買決策,所以建立健康的網(wǎng)絡(luò)購物秩序具有重要的現(xiàn)實意義。
當(dāng)前國內(nèi)外學(xué)者對網(wǎng)絡(luò)產(chǎn)品交易評論的特征指標(biāo)選取和識別研究還不夠深入全面,導(dǎo)致能夠識別和過濾網(wǎng)絡(luò)產(chǎn)品交易非理性評論的有效手段缺乏,所以對于建立健康有序的網(wǎng)絡(luò)購物秩序提出了不小的挑戰(zhàn)。本文選取包含評論人與評論內(nèi)容的多類型特征指標(biāo),基于ID3算法構(gòu)建網(wǎng)絡(luò)產(chǎn)品交易非理性評論識別方法,通過該方法可以輔助電商平臺篩選與展示理性評論,為消費者購物決策提供更可靠的判斷依據(jù),也為商家提供真實的用戶體驗反饋,進(jìn)而改善網(wǎng)絡(luò)購物體驗。
二、理論基礎(chǔ)與文獻(xiàn)綜述
(一)非理性評論
非理性評論是指在網(wǎng)絡(luò)虛擬世界中,網(wǎng)絡(luò)使用者在非理性思維因素如情感、直覺、下意識等的控制下進(jìn)行的網(wǎng)絡(luò)評論。非理性評論具有圍觀性、盲目性、情緒化、極端化等特點。( 袁婧、黃德林:《論網(wǎng)絡(luò)新聞評論中受眾的非理性表達(dá)與引導(dǎo)》,《新聞戰(zhàn)線》,2017年第8期。)其中,圍觀性是指評論者未對事件進(jìn)行深入思考,就發(fā)布了偏離或扭曲事件內(nèi)涵的評論;盲目性是指評論者在未了解事件全貌的情況下,就對事件發(fā)布具有抨擊與質(zhì)疑性質(zhì)的評論;情緒化是指評論者受情緒影響而對事件發(fā)布具有諷刺謾罵性質(zhì)的評論;極端化是指評論者對事件發(fā)布的評論具有人身侵犯與暴力煽動等特點?;ヂ?lián)網(wǎng)于1994年正式進(jìn)入我國,當(dāng)時我國網(wǎng)絡(luò)媒體的發(fā)展形態(tài)還比較簡單,大部分網(wǎng)民上網(wǎng)的目的只是查詢信息。但隨著網(wǎng)絡(luò)的普及和網(wǎng)絡(luò)媒體的蓬勃發(fā)展,互聯(lián)網(wǎng)已經(jīng)成為人們發(fā)表言論的重要空間和平臺??陀^地講,非理性評論是互聯(lián)網(wǎng)賦予人們的話語權(quán)和傳播權(quán)與網(wǎng)絡(luò)平臺具有的便捷性與匿名性等弱把關(guān)性特點進(jìn)行畸形融合的產(chǎn)物。非理性評論對網(wǎng)絡(luò)虛擬世界和現(xiàn)實社會都會造成負(fù)面影響,學(xué)界對其成因進(jìn)行了探討。馮林把非理性評論的成因歸結(jié)為網(wǎng)民求異、求新、盲目求快、傳播“軼聞趣事”的心理以及信息理解能力和選擇能力的缺失等因素。( 馮林:《網(wǎng)民評論理性缺失及成因探討》,《科教文匯(中旬刊)》,2008年第17期。)孫啟虎認(rèn)為理性思考缺乏、信息素養(yǎng)不足是產(chǎn)生非理性評論的主要原因。( 孫啟虎:《網(wǎng)民評論非理性現(xiàn)象分析和價值判斷》,《皖西學(xué)院學(xué)報》,2011年第2期。)
拉扎斯菲爾德(Paul Lazarsfeld)和默頓(Robert K. Merton)曾指出,大眾媒介是一種既可以為善服務(wù),又可以為惡服務(wù)的強(qiáng)大工具。但總的說來,如果不加以適當(dāng)?shù)目刂?,它為惡的可能性更大。一方面,根?jù)沉默螺旋理論,如果一個人感覺到他的意見是少數(shù)派,那么他會傾向于不表達(dá)出來,甚至轉(zhuǎn)變支持方向,與優(yōu)勢群體的意見保持一致,這導(dǎo)致具有盲目性和圍觀性的非理性評論容易占據(jù)優(yōu)勢,不利于網(wǎng)民清晰準(zhǔn)確地探討事件,也不利于營造良好的輿論氛圍。另一方面,競爭日益激烈的社會大環(huán)境使得人們需要釋放壓力和焦慮的空間,這導(dǎo)致具有情緒化特點的非理性評論充斥于匿名網(wǎng)絡(luò)平臺中,腐蝕和沖擊社會主流文化,影響環(huán)境秩序向好的方向發(fā)展。( 鄭麗霞:《重視網(wǎng)絡(luò)“草根”的評論 構(gòu)建和諧網(wǎng)絡(luò)文化》,《記者觀察(上半月)》,2014年第2期。)因此,如何及時有效地篩選與監(jiān)測網(wǎng)絡(luò)平臺中的非理性評論對于建立并維護(hù)健康有序的網(wǎng)絡(luò)環(huán)境秩序具有重要意義。
(二)網(wǎng)絡(luò)產(chǎn)品交易評論
網(wǎng)絡(luò)產(chǎn)品交易評論是指消費者在網(wǎng)絡(luò)購買行為發(fā)生后,對商品或服務(wù)進(jìn)行的評價。它是消費者對商品或服務(wù)進(jìn)行消費體驗后的效果分享和情感表達(dá)。( 杜學(xué)美、丁璟妤、謝志鴻等:《在線評論對消費者購買意愿的影響研究》,《管理評論》,2016年第3期。)網(wǎng)絡(luò)產(chǎn)品交易評論為消費者提供了獲取網(wǎng)絡(luò)產(chǎn)品消費體驗的信息來源,促進(jìn)了消費者之間的消費體驗交流,使消費者間接獲得了對網(wǎng)絡(luò)產(chǎn)品優(yōu)劣的評價信息,對于消費者調(diào)整優(yōu)化購買決策具有參考作用。( 周梅華、李佩镅、牟宇鵬:《在線評論對消費者購買意愿的影響——心理距離的中介作用》,《軟科學(xué)》,2015年第1期。)因此,網(wǎng)絡(luò)產(chǎn)品交易評論是消費者購買行為的重要影響因素,對消費者購買決策的影響不容小覷。同時,由于網(wǎng)絡(luò)產(chǎn)品交易評論具有低成本、高便捷性等特點,更為重要的是評論主體為消費者,其口碑效應(yīng)能夠產(chǎn)生更大的影響力,所以與廣告等其他宣傳因素相比,網(wǎng)絡(luò)產(chǎn)品交易評論更容易被消費者信任和接受。不同的網(wǎng)絡(luò)產(chǎn)品交易評論可能會帶來截然相反的影響,正面的網(wǎng)絡(luò)產(chǎn)品交易評論會激勵消費者的購買行為,而負(fù)面的網(wǎng)絡(luò)產(chǎn)品交易評論會觸發(fā)消費者的抵觸心理,因而網(wǎng)絡(luò)產(chǎn)品交易評論的客觀性就顯得尤為重要。網(wǎng)絡(luò)產(chǎn)品交易評論是以消費者為主體的一種交互性網(wǎng)絡(luò)評論,它與一般網(wǎng)絡(luò)評論類似,也容易出現(xiàn)非理性。例如,為了宣泄情緒或應(yīng)付了事,有些消費者會發(fā)表具有情緒化和隨意性特征的交易評論信息,從而造成網(wǎng)絡(luò)產(chǎn)品交易評論的客觀性和可信度大打折扣。因此,營造良好的網(wǎng)絡(luò)產(chǎn)品交易評論空間對于維護(hù)健康的網(wǎng)絡(luò)購物秩序具有重要意義。
國內(nèi)外學(xué)者對評論文本內(nèi)容識別的關(guān)注點是文本特征的選取和高效識別方法的構(gòu)建。Nitin Jindal和Bing Liu指出了郵件內(nèi)容識別的重要性,總結(jié)了過濾無關(guān)郵件的識別方法。( Nitin Jindal, Bing Liu, “Review spam detection”, Proceedings of the 16th International Conference on World Wide Web, 2007, pp.1189-1190. Nitin Jindal, Bing Liu, “Analyzing and detecting review spam”, Seventh IEEE International Conference on Data Mining, 2007, pp.547-552.)在評論內(nèi)容特征選取方面,學(xué)者們提出了各種可量化的評論內(nèi)容特征指標(biāo)。Dmitry Davidov等對Twitter(推特)上評論文本內(nèi)容的優(yōu)劣進(jìn)行人工標(biāo)注,并且提取了評論文本的主題標(biāo)簽和表情符號作為內(nèi)容特征指標(biāo)。( Dmitry Davidov, Oren Tsur, Ari Rappoport, “Enhanced sentiment learning using twitter hashtags and smileys”, The 23rd International Conference on Computational Linguistics, 2010, pp.241-249. )Myle Ott等利用量化方法從商品評論內(nèi)容中提取了詞性特征和心理情感特征。( Myle Ott, Yejin Choi, Claire Cardie, et al, “Finding deceptive opinion spam by any stretch of the imagination”, Proceedings of the 49th Annual Meeting of the Association for Computational Linguistics, 2011, pp.309-319.)游貴榮等根據(jù)量化評價思想,使用詞性路徑匹配模板檢測評論內(nèi)容,并通過在分詞中加入自定義評價詞詞典提高了自然語言處理評論內(nèi)容的準(zhǔn)確率。( 游貴榮、吳為、錢沄濤:《電子商務(wù)中垃圾評論檢測的特征提取方法》,《現(xiàn)代圖書情報技術(shù)》,2014年第10期。)昝紅英等從文本特征和元數(shù)據(jù)特征兩個方面量化提取了評論的內(nèi)容特征。( 昝紅英、畢銀龍、石金銘:《基于Adaboost算法與規(guī)則匹配的垃圾評論識別》,《鄭州大學(xué)學(xué)報(理學(xué)版)》,2017年第1期。)在評論人特征選取方面,國內(nèi)外研究主要聚焦于評論者定性和評論者特征兩個方面。Ee-Peng Lim等提出按照內(nèi)容的優(yōu)劣對評論進(jìn)行計數(shù),并以此作為評論發(fā)布人的特征指標(biāo)。( Ee-Peng Lim, Viet-An Nguyen, Nitin Jindal, et al, “Detecting product review spammers using rating behaviors”, Proceedings of the 19th ACM Conference on Information and Knowledge Management, 2010, pp.930-948.) Arjun Mukherjee等提出從評論內(nèi)容相似度、最大評論數(shù)量、評論重復(fù)率等視角識別劣質(zhì)評論發(fā)布人,并降低其發(fā)布內(nèi)容的曝光率。( Arjun Mukherjee, Abhinav Kumar, Bing Liu, et al, “Spotting opinion spammers using behavioral footprints”, Proceedings of the 19th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, 2013, pp.632-640.)邱云飛、孫升蕓等學(xué)者基于評論者的行為,提出利用評論回復(fù)量、產(chǎn)品評分偏差、評論員等級等特征指標(biāo)來識別垃圾評論。( 邱云飛、王建坤、邵良杉等:《基于用戶行為的產(chǎn)品垃圾評論者檢測研究》,《計算機(jī)工程》,2012年第11期。孫升蕓、田萱、何軍:《基于評論行為的商品垃圾評論的識別研究》,《計算機(jī)工程與設(shè)計》,2012年第11期。)少量文獻(xiàn)將評論內(nèi)容特征和評論人特征相結(jié)合,用于垃圾郵件過濾( Animesh Mukherjee, Vivek Venkataraman, Bing Liu, et al, “What yelp fake review filter might be doing?”, Proceedings of the 7th International Conference on Weblogs and Social Media, 2013, pp.409-418.)和博客垃圾評論識別。( 刁宇峰、楊亮、林鴻飛:《基于LDA模型的博客垃圾評論發(fā)現(xiàn)》,《中文信息學(xué)報》,2011年第1期。)在識別方法方面,Asma Baccouche等設(shè)計了多標(biāo)簽LSTM模型,可以用于各種來源的惡意文本識別。( Asma Baccouche, Sadaf Ahmed, Daniel Sierra-Sosa, et al, “Malicious text identification: Deep learning from public comments and emails”,Information (Switzerland), vol.11(2020).)徐閩樟等提出融合主題信息的生成對抗網(wǎng)絡(luò)模型,通過強(qiáng)化學(xué)習(xí)提高了對垃圾評論的分類能力。( 徐閩樟、陳羽中:《一種用于垃圾評論分類的融合主題信息的生成對抗網(wǎng)絡(luò)模型》,《小型微型計算機(jī)系統(tǒng)》,2021年第11期。)李翌昕等提出了基于特征提取和機(jī)器學(xué)習(xí)分類模型的文檔版面區(qū)塊分類算法,對公開數(shù)據(jù)集具有很高的分類準(zhǔn)確率,但是對于內(nèi)容較短且主觀性較強(qiáng)的評論文本的分類效果尚不明確。( 李翌昕、鄒亞君、馬盡文:《基于特征提取和機(jī)器學(xué)習(xí)的文檔區(qū)塊圖像分類算法》,《信號處理》,2019年第5期。)
綜上所述,目前對于網(wǎng)絡(luò)產(chǎn)品交易評論特征提取與識別的文獻(xiàn)較多,已經(jīng)積累了較為豐富的研究成果,但還存在如下不足:第一,多數(shù)文獻(xiàn)采用了基于單一特征識別的指標(biāo)體系,識別效果一般;第二,雖然少量文獻(xiàn)采用了基于多類型特征識別的指標(biāo)體系,但是僅針對垃圾郵件和微博評論識別領(lǐng)域,并非專門針對網(wǎng)絡(luò)產(chǎn)品交易評論;第三,盡管少量文獻(xiàn)在文本分類識別方法上不斷創(chuàng)新,但是這些新方法在網(wǎng)絡(luò)產(chǎn)品交易評論方面的應(yīng)用效果尚需觀察。網(wǎng)絡(luò)產(chǎn)品交易評論的內(nèi)容較短、主觀性較強(qiáng),并且特征指標(biāo)涉及較多離散變量,更適合利用ID3算法進(jìn)行分類。有鑒于此,本文選取包含評論者和評論內(nèi)容的多類型特征指標(biāo),基于ID3算法構(gòu)建網(wǎng)絡(luò)產(chǎn)品交易非理性評論識別方法,并利用該方法對淘寶網(wǎng)上關(guān)于智能手機(jī)的非理性評論進(jìn)行識別。
三、網(wǎng)絡(luò)產(chǎn)品交易非理性評論的識別模型
(一)網(wǎng)絡(luò)產(chǎn)品交易非理性評論的界定與識別流程
網(wǎng)絡(luò)產(chǎn)品交易非理性評論是指消費者在網(wǎng)絡(luò)平臺購物后,受各種因素影響發(fā)布的不符合實際或具有非理性特征的評論。它一般表現(xiàn)出強(qiáng)烈情緒性、欺騙性、低效用性和無關(guān)性等特征。其中,欺騙性評論是指評論發(fā)布者出于推銷或詆毀的目的,發(fā)布的與事實不相符的虛假性評論,包括蓄意提高或貶低商品聲譽(yù)的不真實評論,過度夸贊商品的評論稱為正導(dǎo)向非理性評論,蓄意貶低商品的評論稱為負(fù)導(dǎo)向非理性評論;低效用性評論是指評論字?jǐn)?shù)較少的敷衍性評論、具有明顯重復(fù)性的評論和系統(tǒng)自動評論,例如好、不錯等;無關(guān)性評論是指評論內(nèi)容與產(chǎn)品本身無關(guān),包括對該產(chǎn)品品牌或銷售商等的評論也為無關(guān)評論。產(chǎn)生非理性評論的原因主要有兩點:第一,線上店鋪為了提高同行競爭能力、增加商品銷售量、提高收益,以返現(xiàn)形式激勵消費者好評,或者雇傭評論者惡意詆毀競爭對手的產(chǎn)品;第二,消費者在未使用商品的前提下隨意對商品發(fā)表評論。
網(wǎng)絡(luò)產(chǎn)品交易非理性評論的識別過程包括數(shù)據(jù)預(yù)處理和非理性評論識別兩個步驟,具體流程見圖1。由于網(wǎng)絡(luò)產(chǎn)品交易評論為文本信息,而監(jiān)督學(xué)習(xí)的輸入空間為只包含數(shù)字的特征向量,所以要用自然語言處理的方法將文本信息處理為量化后的數(shù)據(jù)集,其中包含文本信息的各種評論特征信息。首先,通過人工標(biāo)注網(wǎng)絡(luò)產(chǎn)品交易評論是否為非理性評論;其次,用自然語言處理的方法將評論內(nèi)容按照評論特征進(jìn)行分解統(tǒng)計;最后,形成可供識別過程使用的數(shù)據(jù)集。非理性評論的識別方法屬于機(jī)器學(xué)習(xí)理論中的監(jiān)督學(xué)習(xí),主要由分類模型、算法和策略三要素構(gòu)成。其中,分類模型采用常見的決策樹模型,策略選擇信息增益準(zhǔn)則,并利用ID3算法在決策樹各個結(jié)點上選擇評論特征。具體的分類過程如下:首先,通過隨機(jī)抽取生成訓(xùn)練數(shù)據(jù)集和測試數(shù)據(jù)集;其次,利用ID3算法遞歸地選取最優(yōu)評論特征并將其作為結(jié)點,從而構(gòu)建出最優(yōu)決策樹;最后,將通過準(zhǔn)確性檢驗的非理性評論識別方法應(yīng)用于實踐。
+ (二)決策樹模型與ID3算法
決策樹模型是監(jiān)督學(xué)習(xí)中的一種典型的分類模型,表現(xiàn)為樹形結(jié)構(gòu),具有無須先驗假設(shè)、計算速度快、結(jié)果易解釋、穩(wěn)健性強(qiáng)等優(yōu)點。在分類問題中,決策樹是一系列基于評論特征的分類規(guī)則的集合。采用決策樹的目的是用訓(xùn)練數(shù)據(jù)集擬合出具有分類規(guī)則的非參數(shù)分類器。在輸入空間上,使用訓(xùn)練數(shù)據(jù)集,并根據(jù)信息增益最大化準(zhǔn)則建立決策樹;在輸出空間上,采用預(yù)測數(shù)據(jù)集,并依據(jù)建立好的決策樹進(jìn)行分類。
具體而言,決策樹通過對眾多評論特征進(jìn)行解析歸納,最終形成類似于流程圖的樹形結(jié)構(gòu)。決策樹由結(jié)點和有向邊兩個要素組成,其中結(jié)點包括根結(jié)點、中間結(jié)點和葉結(jié)點。利用決策樹進(jìn)行分類的過程如下:將信息增益最大的評論特征作為樹的根結(jié)點,從根結(jié)點開始對訓(xùn)練數(shù)據(jù)的所有評論特征進(jìn)行訓(xùn)練;基于上一級結(jié)點的分類規(guī)則分配的訓(xùn)練數(shù)據(jù),計算所有剩余評論特征的信息增益,挑選出信息增益最大的評論特征作為樹的中間結(jié)點;如此遞歸地對訓(xùn)練數(shù)據(jù)進(jìn)行分配,直至選出最后一個符合條件的評論特征作為決策樹的葉結(jié)點。在訓(xùn)練數(shù)據(jù)集的分配過程中,從根結(jié)點到葉結(jié)點的一條有向邊是一個分類規(guī)則。從根結(jié)點到葉結(jié)點的尋找過程實際上是一個分類過程,根結(jié)點和中間結(jié)點是評論特征,有向邊表示評論特征的分類規(guī)則,葉結(jié)點代表樣本的分類類別,原理見圖2。
ID3算法是決策樹的一種生成方式,其核心是利用遞歸思想和信息增益準(zhǔn)則來確定決策樹各結(jié)點的評論特征。ID3算法起源于概念學(xué)習(xí)系統(tǒng),以信息熵的下降速度作為確定評論特征的主要標(biāo)準(zhǔn)。該算法的具體流程如下:第一步,從根結(jié)點開始計算所有評論特征的信息增益,并將信息增益最高的評論特征作為根結(jié)點;第二步,根據(jù)根結(jié)點評論特征的取值情況來確定有向邊的條數(shù);第三步,遞歸地重復(fù)上述過程,即將某級結(jié)點下信息增益最高的評論特征作為下一級的中間結(jié)點,直到所有評論特征的信息增益均很小或者沒有評論特征可供選擇;第四,確定評論特征屬性作為決策樹的葉結(jié)點,即生成一棵具有完美分類的決策樹。
(三)評論特征選取
評論特征選取是非理性評論識別方法的重要內(nèi)容,要求選取的訓(xùn)練數(shù)據(jù)具有明顯的分類能力,從而降低決策樹的運算量,提高決策樹的學(xué)習(xí)效率與準(zhǔn)確性。只有當(dāng)利用某個評論特征進(jìn)行分類的結(jié)果與隨機(jī)分類的結(jié)果有顯著差異時,該特征才具有明顯的分類能力。將所有評論特征整合在一起構(gòu)成的集合,稱為評論特征選擇池。目前,國內(nèi)外學(xué)者從不同角度選取了不同的網(wǎng)絡(luò)交易產(chǎn)品評論特征指標(biāo),主要包括評論者、評論內(nèi)容特征兩個方面,(Minqing Hu, Bing Liu, “Mining opinion features in customer reviews”, Proceedings of the 19th National Conference on Artificial Intelligence, 2004, pp.755-760. 游貴榮、吳為、錢沄濤:《電子商務(wù)中垃圾評論檢測的特征提取方法》,《現(xiàn)代圖書情報技術(shù)》,2014年第10期。)個別文獻(xiàn)還選取了商品特征( 林煜明、王曉玲、朱濤等:《用戶評論的質(zhì)量檢測與控制研究綜述》,《軟件學(xué)報》,2014年第3期。)和情感特征( 李霄、丁晟春:《垃圾商品評論信息的識別研究》,《現(xiàn)代圖書情報技術(shù)》,2013年第1期。),涉及評論中是否提到產(chǎn)品名稱、評論長度、正負(fù)面情感詞數(shù)量、評論名稱等多個特征指標(biāo)。顯然,評論特征的選取應(yīng)該根據(jù)商品類型和電商平臺的差異而有所取舍,比如電子產(chǎn)品評論中參數(shù)描述會多一些、食品類產(chǎn)品評論對新鮮度更敏感。因此,為了盡可能降低主觀性,提高計算效率,本文在總結(jié)現(xiàn)有文獻(xiàn)的基礎(chǔ)上,綜合評論的共同特征,從評論者和評論內(nèi)容兩方面選取了12個評論特征指標(biāo)(表1)。
(四)策略
(五)非理性評論識別效果的評價標(biāo)準(zhǔn)
1.訓(xùn)練數(shù)據(jù)標(biāo)注效果的一致性檢驗
決策樹模型是一種監(jiān)督學(xué)習(xí)模型,需要事先輸入訓(xùn)練數(shù)據(jù)的分類情況,但這些分類情況往往不是已知的,所以需要對訓(xùn)練數(shù)據(jù)進(jìn)行人工標(biāo)注。弗雷斯(Joseph L. Fleiss)提出了檢驗人工標(biāo)注結(jié)果有效性和可信性的一種方法,即在一組評估人標(biāo)注同一套數(shù)據(jù)之后,可以利用Kappa統(tǒng)計量度量該組評估人標(biāo)注結(jié)果是否具有一致性。( Joseph L. Fleiss, “Measuring nominal scale agreement among many raters”, Psychological Bulletin, vol.76, no.5(1971).)同時,還形成了利用Kappa系數(shù)(記為Kc)評價一致性的經(jīng)驗標(biāo)準(zhǔn):當(dāng)Kcgt;0.75時,表示一致性較好;當(dāng)0.4lt;Kclt;0.75時,表示一致性正常或良好;當(dāng)Kclt;0.4時,表示一致性較差。
2.非理性評論識別方法的準(zhǔn)確性檢驗
由于基于訓(xùn)練數(shù)據(jù)生成的分類模型可能僅對實例有較好的分類能力,并不一定適用于其他數(shù)據(jù),所以在分類預(yù)測之前要將數(shù)據(jù)隨機(jī)分為訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù),其中訓(xùn)練數(shù)據(jù)約占原始數(shù)據(jù)的60%至80%,其余原始數(shù)據(jù)用作測試數(shù)據(jù)。先利用訓(xùn)練數(shù)據(jù)生成分類模型,然后用測試數(shù)據(jù)檢驗分類效果,并將檢驗效果最好的分類模型作為目標(biāo)模型。目標(biāo)模型的分類結(jié)果可以用混淆矩陣表示(表2)。在表2中,TP表示將正類判斷為正類的數(shù)量,F(xiàn)P表示將負(fù)類判斷為正類的數(shù)量,F(xiàn)N表示將正類判斷為負(fù)類的數(shù)量,TN表示將負(fù)類判斷為負(fù)類的數(shù)量。
一般采用精確率(記為Precision)、召回率(記為Recall)和F1值來評價二分類模型的效果,三個指標(biāo)的取值區(qū)間均為[0,1]。精確率用于測度被判斷為正的樣本中正樣本的比例。一般精確率越高,分類模型越不容易將理性評論判別為非理性評論,精確率的計算公式為Precision=TP/(TP+FP)。召回率用于測度正樣本中被判斷為正的樣本所占的比例。一般召回率越高,分類模型越不容易將非理性評論判斷為理性評論,召回率的計算公式為Recall=TP/(TP+FN)。F1值是精確率和召回率的調(diào)和平均值,隨著精確率和召回率的增高而增高,其取值為2TP/(2TP+FN+FP)。
四、網(wǎng)絡(luò)產(chǎn)品交易非理性評論識別方法的實證
(一)數(shù)據(jù)獲取
考慮到如下兩點事實:第一,淘寶網(wǎng)是中國最大的網(wǎng)購平臺,具有用戶規(guī)模大、交易額巨大、維權(quán)有力等特點;第二,智能手機(jī)作為當(dāng)下幾乎人手必備的手持設(shè)備,與手機(jī)交易相關(guān)的評論數(shù)量較多,具有代表性。因此,本文對淘寶網(wǎng)智能手機(jī)的非理性評論進(jìn)行識別研究。此外,根據(jù)2019年11月13日ZDC互聯(lián)網(wǎng)消費調(diào)研中心的熱門手機(jī)排行榜,并結(jié)合商品價格、熱門程度、商品評分、手機(jī)品牌、更新時間等因素,選取華為P30 Pro、華為Mate30、榮耀20、IPhone11 Pro、OPPO Renno2、小米9六款手機(jī)的消費者評論作為研究對象。
根據(jù)表1給出的評論特征,提取了用戶昵稱、用戶頭像、評論內(nèi)容、店家回復(fù)信息、附屬圖片、會員等級、有無解釋說明或追評、評論時間、手機(jī)內(nèi)存、機(jī)身顏色和存儲容量等指標(biāo),評論數(shù)據(jù)采集時間為2019年9月至2019年11月。剔除不完整和無效的評論數(shù)據(jù),最終得到11480條可用的評論數(shù)據(jù)。本文依據(jù)評論標(biāo)注準(zhǔn)則,(“30 ways you can spot fake online reviews”, https://consumerist.com/2010/04/14/how-you-spot-fake-online-reviews/.)以每組3人的方式對訓(xùn)練數(shù)據(jù)進(jìn)行人工標(biāo)注,得到非理性評論5108條、理性評論6372條,占有效數(shù)據(jù)的比重依次為44.49%和55.51%??梢?,非理性評論的占比較高,有可能對消費者的購買決策產(chǎn)生不利影響。計算對非理性評論進(jìn)行人工標(biāo)注結(jié)果的Kappa系數(shù),可知Kc=0.96,因而本次標(biāo)注的一致性較好,標(biāo)注結(jié)果可用于訓(xùn)練模型。
(二)數(shù)據(jù)特征的描述統(tǒng)計
1.評論類型的總體特征
圖3給出了不同產(chǎn)品網(wǎng)絡(luò)交易非理性評論和理性評論的頻率。不難發(fā)現(xiàn),網(wǎng)絡(luò)產(chǎn)品交易非理性評論已成為常見現(xiàn)象。在對于不同品牌和型號手機(jī)的評論中,均有非理性評論,且非理性評論的分布差異較大。OPPO Renno2的非理性評論頻數(shù)最低,占比為19.60%,而華為P30 pro非理性評論的頻數(shù)最高,占比高達(dá)67.53%。同時,通過統(tǒng)計評論字符數(shù)可知,大部分非理性評論的字符數(shù)在50個字符以下,而理性評論的字符數(shù)大多在50至150個字符。通過自然語言處理能夠得到評論重復(fù)率,理性評論的重復(fù)率在0.05%至0.15%,非理性評論的重復(fù)率大于0.15%,且重復(fù)率在0.05%至0.15%的非理性評論數(shù)遠(yuǎn)小于理性評論,因而評論重復(fù)率不在0.05%至0.15%的評論更有可能被判定為非理性評論。
2.評論內(nèi)容特征分析
可以利用自然語言處理方法對評論內(nèi)容進(jìn)行分解,提取特征詞,挖掘評論內(nèi)容包含的具體信息,并繪制詞云圖(圖4)。左側(cè)圖是所有非理性評論中出現(xiàn)頻率較高的詞語,右側(cè)圖是所有理性評論中出現(xiàn)頻率較高的詞語。在評論中出現(xiàn)頻率越高的詞語在詞云圖中占的面積越大。由圖4可知,在非理性評論中更容易出現(xiàn)一些情感詞如“不錯”“喜歡”“滿意”“支持”等和一些無關(guān)詞語如“用戶”“填寫”等;在理性評論中出現(xiàn)的詞語大多與商品特點有關(guān),比如“速度”“效果”“運行”“通信”“顯示”“拍照”“音質(zhì)”“電池”“清晰”“通暢”“續(xù)航”等。通過商品相關(guān)詞分析,發(fā)現(xiàn)理性評論包含商品相關(guān)詞的比例遠(yuǎn)高于非理性評論。通過情感詞數(shù)量分析,發(fā)現(xiàn)非理性評論與理性評論在情感詞占比方面整體上差別較小。因此,如果評論中出現(xiàn)很多與商品相關(guān)的詞,那么該評論大概率是理性評論,但是含有情感詞的評論是否可以被判別為非理性評論尚需進(jìn)一步討論。
3.其他評論特征分析
圖5對比了非理性評論與理性評論在其他特征指標(biāo)上的差異。從評論者是否有頭像方面看,非理性評論中無頭像的評論遠(yuǎn)遠(yuǎn)多于有頭像的評論,而理性評論中有頭像與無頭像的評論數(shù)相差較小,這說明相較于有頭像評論,無頭像評論更可能為非理性評論。從評論是否附圖方面看,非理性評論中大多數(shù)評論是無圖的,其無圖評論的占比高于理性評論,這說明相較于含圖評論,無圖評論更可能為非理性評論。從是否為超級會員方面看,超級會員的評論中理性評論較多,非超級會員的評論中非理性評論較多,這說明超級會員進(jìn)行非理性評論的概率更低。此外,理性評論與非理性評論在商家回復(fù)的數(shù)量以及評論時間方面差異不明顯。因此,如果評論者無頭像、評論者不是超級會員、評論無圖片,那么相應(yīng)的評論為非理性評論的概率較高,但是評論時間、客服回復(fù)評論數(shù)量不能作為判定評論是否理性的有效依據(jù)。
(三)實證結(jié)果與分析
從數(shù)據(jù)集中隨機(jī)抽取80%的數(shù)據(jù)進(jìn)入訓(xùn)練數(shù)據(jù)集(包含9184條數(shù)據(jù)),其余20%的數(shù)據(jù)進(jìn)入測試數(shù)據(jù)集(包含2296條數(shù)據(jù))。然后用訓(xùn)練數(shù)據(jù)與ID3算法構(gòu)建非理性評論識別模型,再將測試數(shù)據(jù)集代入網(wǎng)絡(luò)產(chǎn)品交易非理性評論識別模型,最后評估模型性能指標(biāo)。經(jīng)過10次交叉驗證,可得到測試數(shù)據(jù)集的識別效果(表3)。從表3可知,平均F1值為73.00%,說明網(wǎng)絡(luò)產(chǎn)品交易非理性評論識別模型的總體識別效果較好;平均精確率為71.49%,說明該分類模型預(yù)測的理性評論中有71.49%的評論是真正的理性評論;平均召回率為74.63%,這說明該分類模型可以將全部理性評論中74.63%的理性評論正確識別出來。因此,本文所提出的網(wǎng)絡(luò)產(chǎn)品交易非理性評論識別方法具有較強(qiáng)的識別能力,未出現(xiàn)過擬合和欠擬合現(xiàn)象,可以用于實際應(yīng)用研究。
作為對比,本文還嘗試了其他監(jiān)督學(xué)習(xí)方法,比如隨機(jī)森林、BP神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)方法。與決策樹模型類似,這些方法都能用于解決分類問題。隨機(jī)森林、BP神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)這三種方法的F1值依次為62%、61%和18%,顯然它們對本文所涉及特征指標(biāo)的訓(xùn)練能力較差,對網(wǎng)絡(luò)產(chǎn)品交易非理性評論的識別效果較弱。在識別過程中,隨機(jī)森林、BP神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)三種方法均出現(xiàn)過擬合現(xiàn)象,導(dǎo)致模型表現(xiàn)能力較差,尤其是支持向量機(jī)方法,其精準(zhǔn)率、召回率和F1值三項指標(biāo)均低于60%。
五、結(jié)論與應(yīng)用前景
隨著網(wǎng)絡(luò)交易的快速發(fā)展,實時跟蹤交易評論、有效識別各類網(wǎng)絡(luò)產(chǎn)品交易非理性評論,并采取相應(yīng)的治理措施,是構(gòu)建有序電商競爭環(huán)境和促進(jìn)網(wǎng)絡(luò)交易健康發(fā)展的必然要求。本文選取包括商品相關(guān)詞、情感詞、評論字符數(shù)、字符重復(fù)率等網(wǎng)絡(luò)產(chǎn)品交易評論特征指標(biāo),構(gòu)建基于ID3算法的網(wǎng)絡(luò)產(chǎn)品交易非理性評論識別模型,并應(yīng)用于淘寶網(wǎng)智能手機(jī)非理性評論的識別。
特征指標(biāo)的描述統(tǒng)計表明:當(dāng)評論內(nèi)容包含產(chǎn)品特征相關(guān)詞、字符數(shù)在50至150之間、評論重復(fù)率在0.05%至0.15%時,網(wǎng)絡(luò)產(chǎn)品交易評論更易被識定為理性評論;評論者無頭像、評論者非超級會員、評論無附圖等特征會使評論有更高的概率被判定為非理性評論;評論時間、商家回復(fù)數(shù)量、評論包含情感詞等特征不能作為判斷網(wǎng)絡(luò)產(chǎn)品交易評論是否理性的有效依據(jù)。實證結(jié)果表明:網(wǎng)絡(luò)產(chǎn)品交易非理性評論識別模型的識別效果較好,識別的精準(zhǔn)率、召回率和F1值三項指標(biāo)的均值都超過70%,而作為比照的隨機(jī)森林、BP神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)三種監(jiān)督學(xué)習(xí)方法的F1值均低于62%。因此,本文提出的網(wǎng)絡(luò)產(chǎn)品交易非理性評論識別方法具有更強(qiáng)的分類能力。
從電商平臺的角度來看,平臺通過非理性評論識別模型對網(wǎng)絡(luò)產(chǎn)品交易評論進(jìn)行有效識別,可以以較低的成本自動篩選出理性評論,進(jìn)而提升電商平臺網(wǎng)絡(luò)產(chǎn)品交易評論的質(zhì)量與用戶體驗。從平臺入駐商戶的角度來看,在同業(yè)競爭中,準(zhǔn)確掌握競爭對手商品的客觀信息有助于商家消除信息不對稱,促進(jìn)電商行業(yè)在良性競爭中不斷發(fā)展。從消費者角度來看,商品的評價信息對消費者決策具有重要影響,非理性評論大概率會誤導(dǎo)消費者的消費決策,而理性評論可以增進(jìn)消費者對商品真實信息的了解,能為消費者決策提供可靠依據(jù),幫助消費者更便捷地進(jìn)行消費決策。因此,從電商平臺自身、平臺入駐商戶和消費者三方來看,電商平臺都應(yīng)該引入非理性評論識別模型,提高評論的質(zhì)量和有效性,減少魚龍混雜的非理性評論,助力電商行業(yè)和網(wǎng)絡(luò)零售業(yè)高質(zhì)量發(fā)展。
〔責(zé)任編輯:來向紅〕
作者簡介:張兆鵬,中國社會科學(xué)院大學(xué)經(jīng)濟(jì)學(xué)院、中國社會科學(xué)院經(jīng)濟(jì)研究所博士研究生。
基金項目:中國社會科學(xué)院大學(xué)(研究生院)研究生科研創(chuàng)新支持計劃項目“碳市場對低碳技術(shù)創(chuàng)新效用的測度研究”(2023-KY-55)
①趙菊、劉龍、王艷等:《基于電商平臺的供應(yīng)商競爭和模式選擇研究》,《系統(tǒng)工程理論與實踐》,2019年第8期。
②中國互聯(lián)網(wǎng)絡(luò)信息中心:《第49次〈中國互聯(lián)網(wǎng)絡(luò)發(fā)展?fàn)顩r統(tǒng)計報告〉》,https://www.cnnic.cn/n4/2022/0401/c88-1131.html。