李思荃 劉新全
【摘? 要】 為了了解我國(guó)目前電子商務(wù)領(lǐng)域數(shù)據(jù)挖掘技術(shù)的應(yīng)用研究現(xiàn)狀與前沿,文章運(yùn)用文獻(xiàn)計(jì)量分析法和社會(huì)網(wǎng)絡(luò)分析法,對(duì) Web of Science 和 CNKI 期刊論文中2000-2021年的相關(guān)文獻(xiàn)進(jìn)行研究,對(duì)近二十年國(guó)內(nèi)外數(shù)據(jù)挖掘技術(shù)在電子商務(wù)領(lǐng)域的應(yīng)用研究的現(xiàn)狀、熱點(diǎn)及前沿進(jìn)行了客觀的呈現(xiàn)和分析。研究發(fā)現(xiàn),國(guó)內(nèi)外學(xué)者關(guān)于電子商務(wù)領(lǐng)域數(shù)據(jù)挖掘技術(shù)應(yīng)用研究熱點(diǎn)基本相同;但是在研究數(shù)量方面國(guó)外高于國(guó)內(nèi),但研究廣度上國(guó)內(nèi)與國(guó)外差別不大。國(guó)內(nèi)外的研究將會(huì)不斷深入,最終相互融合,共同致力于將成熟的數(shù)據(jù)挖掘技術(shù)結(jié)合實(shí)際企業(yè)銷售、服務(wù)環(huán)節(jié),實(shí)現(xiàn)最高的企業(yè)服務(wù)質(zhì)量,最佳的企業(yè)效益水平。
【關(guān)鍵詞】 數(shù)據(jù)挖掘;電子商務(wù);文獻(xiàn)統(tǒng)計(jì)法
隨著世界信息化水平的整體上升,計(jì)算機(jī)技術(shù)與網(wǎng)絡(luò)技術(shù)不斷普及,用戶數(shù)據(jù)量在不斷增加。據(jù)IDC預(yù)測(cè),到2025年全球數(shù)據(jù)圈將擴(kuò)展至163ZB9(1ZB等于1萬(wàn)億GB),這相當(dāng)于2016年所產(chǎn)生16.1ZB數(shù)據(jù)的10倍。面對(duì)每日高速增長(zhǎng)的數(shù)據(jù)量,采用普通的統(tǒng)計(jì)分析方法進(jìn)行分析已經(jīng)無(wú)法滿足企業(yè)要求,因此,數(shù)據(jù)挖掘技術(shù)應(yīng)運(yùn)而生。電商企業(yè)中應(yīng)用數(shù)據(jù)挖掘技術(shù)的案例有很多,如分析挖掘網(wǎng)站內(nèi)容,進(jìn)行網(wǎng)站設(shè)計(jì)、收集用戶數(shù)據(jù),進(jìn)行客戶管理、分析廣告有效性,進(jìn)行網(wǎng)絡(luò)廣告的精準(zhǔn)投放等。在大數(shù)據(jù)時(shí)代,電子商務(wù)業(yè)務(wù)日益增多,數(shù)據(jù)挖掘技術(shù)在電商企業(yè)市場(chǎng)發(fā)展空間巨大。由于各個(gè)電子商務(wù)網(wǎng)站在交易狀態(tài)下產(chǎn)生大量數(shù)據(jù)記錄,為了實(shí)現(xiàn)企業(yè)核心發(fā)展優(yōu)勢(shì)的快速提高,可以根據(jù)數(shù)據(jù)分析處理的結(jié)果為客戶提供全方位服務(wù)。企業(yè)必須不斷完善優(yōu)化,才能獲得更大的進(jìn)步。
基于此,文章對(duì)近二十年的國(guó)內(nèi)外數(shù)據(jù)挖掘在電子商務(wù)領(lǐng)域應(yīng)用的相關(guān)文獻(xiàn)進(jìn)行梳理、歸納和分析,助力我國(guó)學(xué)者明確未來的研究方向與研究視角,進(jìn)而豐富我國(guó)數(shù)據(jù)挖掘技術(shù)在電子商務(wù)領(lǐng)域中的應(yīng)用研究成果。
一、數(shù)據(jù)獲取與研究方法
為了更好地把握大數(shù)據(jù)在制造業(yè)領(lǐng)域應(yīng)用研究的發(fā)展現(xiàn)狀與熱點(diǎn)問題,保證研究的客觀真實(shí),將中國(guó)知網(wǎng)CNKI和WOS核心數(shù)據(jù)庫(kù)分別作為國(guó)內(nèi)外數(shù)據(jù)來源,并采取關(guān)鍵詞組合的方式進(jìn)行檢索。中文文獻(xiàn)的檢索詞為主題→大數(shù)據(jù)且主題→制造,文獻(xiàn)類別為期刊,來源類別選擇為SCI、EI、CSSCI、CSCD以及核心期刊,限定時(shí)間范圍是2000—2022年。英文檢索策略與中文檢索策略一致。為保證研究的可靠新和典型性,剔除會(huì)議、論壇等與研究主題關(guān)系不密切的文章,最終得到有效文獻(xiàn)共753篇,其中中文文獻(xiàn)為333篇,外文文獻(xiàn)為420篇。
本研究采用文獻(xiàn)計(jì)量分析、社會(huì)網(wǎng)絡(luò)分析等方法,對(duì)國(guó)內(nèi)外數(shù)據(jù)挖掘技術(shù)在電子商務(wù)領(lǐng)域的應(yīng)用研究的現(xiàn)狀、熱點(diǎn)以及前沿進(jìn)行研究分析,在分析過程中運(yùn)用的對(duì)應(yīng)軟件分別為基于Java語(yǔ)言開發(fā)的文獻(xiàn)計(jì)量軟件CiteSpace。文獻(xiàn)題錄信息統(tǒng)計(jì)分析工具 SATI 以及社會(huì)網(wǎng)絡(luò)分析軟件Ucinet。
二、國(guó)內(nèi)外研究熱點(diǎn)分析
從CNKI檢索到的論文條目來看,國(guó)內(nèi)數(shù)據(jù)挖掘在電子商務(wù)領(lǐng)域應(yīng)用研究出現(xiàn)頻率較高的關(guān)鍵詞推薦系統(tǒng)、營(yíng)銷、客戶關(guān)系管理、數(shù)據(jù)處理、協(xié)同過濾、商務(wù)智能、web數(shù)據(jù)挖掘等,國(guó)內(nèi)學(xué)者對(duì)數(shù)據(jù)挖掘技術(shù)在電子商務(wù)領(lǐng)域中的研究熱點(diǎn)側(cè)重于圍繞電商平臺(tái)商品銷售展開探討。在大數(shù)據(jù)時(shí)代,電子商務(wù)應(yīng)用數(shù)據(jù)挖掘技術(shù)的場(chǎng)景在不斷地增加。
從Web of Science數(shù)據(jù)庫(kù)中檢索到的論文條目來看,國(guó)外學(xué)者對(duì)以下問題較為關(guān)心,如data warehouse、big data、web mininng、cloud computing、business intelligence、customer management、recommendation等。由此可見,近二十年來,國(guó)外的研究學(xué)者所關(guān)注的研究熱點(diǎn)與國(guó)內(nèi)學(xué)者基本相同。
三、國(guó)內(nèi)外研究前沿分析
從CNKI數(shù)據(jù)庫(kù)中檢索到的文獻(xiàn)條目可知,國(guó)內(nèi)從2004年逐漸開始數(shù)據(jù)挖掘的相關(guān)研究,從2004年到2021年出現(xiàn)的高頻關(guān)鍵詞有g(shù)enetic algorithm、cloud computing、utility evaluation、clustering analysis、information management、web data mining等。近年來,電子商務(wù)得到了快速發(fā)展,同時(shí)也出現(xiàn)了許多問題,如孫桂鴻等人(2022) 為了解決生鮮電商中供需不平衡問題,基于數(shù)據(jù)挖掘,通過問卷調(diào)查法和實(shí)地調(diào)研法,構(gòu)建了營(yíng)銷策略與消費(fèi)者購(gòu)買意愿的Logistics回歸模型。電商營(yíng)銷、電商物流配送以及物流配送站點(diǎn)的選擇三者是相輔相成的,缺一不可。Fonseca-Galindo Juan Camilo等人(2022) 以電商物流配送作為研究切入點(diǎn)展開研究針對(duì)現(xiàn)實(shí)中電子商務(wù)物流問題,使用軌跡數(shù)據(jù)挖掘改善了最后一公里配送路線。董紹斌(2021)則以菜鳥驛站網(wǎng)點(diǎn)選址為研究重點(diǎn),探究淮安區(qū)菜鳥驛站選址空間分布格局及優(yōu)化方案。雖然網(wǎng)購(gòu)極大地便利了人們的生活,但是在線購(gòu)買產(chǎn)品時(shí),商家與客戶的信任關(guān)系以及電子商務(wù)交易風(fēng)險(xiǎn)問題都需要考慮。因此Tahmid Hasan Pranto等人(2022)提出了一種基于區(qū)塊鏈的架構(gòu),并使用數(shù)據(jù)挖掘技術(shù)用于檢測(cè)欺詐性用戶。Haohua Qing等人(2021)基于數(shù)據(jù)挖掘進(jìn)行了跨境電商交易風(fēng)險(xiǎn)分析研究,并經(jīng)過實(shí)證研究表明數(shù)據(jù)挖掘在預(yù)測(cè)和掌握跨境電商交易風(fēng)險(xiǎn)數(shù)據(jù)方面可以發(fā)揮理想作用。
電商平臺(tái)為了實(shí)現(xiàn)點(diǎn)對(duì)點(diǎn)精準(zhǔn)營(yíng)銷,需要在大量的數(shù)據(jù)中尋找到最大客戶價(jià)值。王越、鄭奇(2019)通過研究模糊C均值聚類,處理龐大的電子商務(wù)用戶數(shù)據(jù),挖掘電商核心資源商業(yè)價(jià)值,從而實(shí)現(xiàn)精準(zhǔn)營(yíng)銷。陳娥祥(2022)介紹了如何利用RFM模型進(jìn)行客戶價(jià)值分析。然而進(jìn)行客戶價(jià)值分析的最終目標(biāo)是使在線商家普遍向其現(xiàn)有和潛在客戶提供強(qiáng)化和差異化的營(yíng)銷服務(wù),并告訴客戶感興趣的項(xiàng)目(Ehikioya Sylvanus A, Zeng Jinbo(2021),所以宋倩(2022)基于關(guān)聯(lián)規(guī)則算法設(shè)計(jì)一種電子商務(wù)商品推薦系統(tǒng),并經(jīng)過測(cè)試驗(yàn)證其實(shí)際命中率較高。電商企業(yè)不僅要關(guān)注當(dāng)下消費(fèi)者偏好,還要對(duì)未來的消費(fèi)趨勢(shì)進(jìn)行預(yù)測(cè)才能提供滿足消費(fèi)者需求的商品。Zhang Qing等人(2022)經(jīng)研究表明數(shù)據(jù)挖掘技術(shù)和神經(jīng)網(wǎng)絡(luò)在預(yù)測(cè)未來消費(fèi)者購(gòu)買力信息方面具有較高的準(zhǔn)確性。
從Web of Science數(shù)據(jù)庫(kù)中檢索到的論文條目可知,國(guó)外數(shù)據(jù)挖掘在電子商務(wù)領(lǐng)域應(yīng)用研究高頻詞主要集中出現(xiàn)在2013年到2016年,其中包括data mining system、product data management、customer relationship、data warehouse、clickstream history、digital marketing information retrieval等。網(wǎng)購(gòu)產(chǎn)品使用體驗(yàn)分享以及在線客戶評(píng)論影響著店鋪發(fā)展以及客戶的購(gòu)買決策。Madhumita Guha Majumder等人(2022)使用機(jī)器學(xué)習(xí)和探索性數(shù)據(jù)分析的評(píng)論挖掘方法探討了影響在線評(píng)論的主要和次要影響因素。因此良好的客戶關(guān)系管理有助于加強(qiáng)優(yōu)質(zhì)客戶的培養(yǎng),提高客戶滿意度與忠誠(chéng)度(Xiaowei Huang(2021))。為了對(duì)客戶進(jìn)行有效管理,獲取最大企業(yè)效益,就需要分析客戶價(jià)值,Hui Yang等人(2022)設(shè)計(jì)并開發(fā)了一種基于數(shù)據(jù)挖掘和電子商務(wù)農(nóng)產(chǎn)品價(jià)值特征的電子商務(wù)領(lǐng)域客戶價(jià)值評(píng)價(jià)模型。而且為了提升客戶體驗(yàn),為不同的客戶提供符合其消費(fèi)偏好的差異化營(yíng)銷服務(wù)也是必要的。Dilip KumarSharma等人(2022)構(gòu)建電子商務(wù)門戶對(duì)產(chǎn)品購(gòu)買行為進(jìn)行分類和區(qū)分,并根據(jù)用戶偏好為其提供產(chǎn)品。而Klas Hjort等人(2013)研究分析了線上購(gòu)物行為模式,并確定在銷售和退貨模式的基礎(chǔ)上對(duì)客戶進(jìn)行細(xì)分可以促進(jìn)差異化的服務(wù)交付方法。更為重要的是,為客戶提供合適的物流配送服務(wù)也被視為必要的,但是平衡物流配送速度與配送成本之間的矛盾,已成為電商企業(yè)之間競(jìng)爭(zhēng)的關(guān)鍵(Kai Guo(2020))。為了解決這個(gè)問題,Chen Chao(2017)等人研究了一個(gè)帶有時(shí)間窗(2S-LRITW)的食品位置-路由-庫(kù)存兩階段問題。但是電商平臺(tái)運(yùn)營(yíng)過程中也應(yīng)該注意規(guī)范化管理問題。崔慧敏(2021)就云電子商務(wù)的安全審計(jì)問題進(jìn)行了探討研究,并提出了在審計(jì)實(shí)施過程中的難點(diǎn)與痛點(diǎn)。從前人研究可以看出,數(shù)據(jù)挖掘技術(shù)在電商領(lǐng)域得到了廣泛的應(yīng)用,而Xiaojing Tang(2021)提出電子商務(wù)平臺(tái)必須不斷完善和簡(jiǎn)化,才能更好地開展其業(yè)務(wù)。
國(guó)內(nèi)外學(xué)者的研究?jī)?nèi)容一直隨著學(xué)科的發(fā)展深入而變化,但是國(guó)內(nèi)外的研究前沿基本相同。從根本上說,國(guó)內(nèi)外的學(xué)者關(guān)于數(shù)據(jù)挖掘在電子商務(wù)領(lǐng)域中的應(yīng)用研究都是圍繞如何為客戶提供優(yōu)質(zhì)的服務(wù)而展開的。國(guó)內(nèi)學(xué)者對(duì)于數(shù)據(jù)挖掘在電子商務(wù)領(lǐng)域中的應(yīng)用研究雖晚于國(guó)外學(xué)者,但是國(guó)內(nèi)學(xué)者卻不甘示弱,用吃苦耐勞的科研精神做出了許多研究成果,為我國(guó)的電子商務(wù)發(fā)展提供了極大的助力。數(shù)據(jù)挖掘技術(shù)在電子商務(wù)領(lǐng)域中的建模和優(yōu)化研究將會(huì)不斷深化,數(shù)據(jù)挖掘技術(shù)也將用于解決更加具體、全面的電子商務(wù)發(fā)展問題。國(guó)內(nèi)外的研究?jī)?nèi)容終將趨于同化,共同致力于數(shù)據(jù)挖掘在電子商務(wù)領(lǐng)域的應(yīng)用研究,以提升企業(yè)服務(wù)質(zhì)量,增加企業(yè)經(jīng)濟(jì)效益。
四、結(jié)論與展望
隨著信息技術(shù)的發(fā)展,數(shù)據(jù)挖掘技術(shù)在電子商務(wù)領(lǐng)域的應(yīng)用受到研究人員和企業(yè)的高度關(guān)注,為了解國(guó)內(nèi)外數(shù)據(jù)挖掘技術(shù)在電商平臺(tái)應(yīng)用研究的不同,本研究運(yùn)用文獻(xiàn)計(jì)量軟件和社會(huì)網(wǎng)絡(luò)分析軟件,對(duì)國(guó)內(nèi)外期刊數(shù)據(jù)挖掘技術(shù)在電子商務(wù)領(lǐng)域中的應(yīng)用研究進(jìn)行了整理分析,具體結(jié)論如下:
第一,在發(fā)文量和重要作者方面,國(guó)外的文獻(xiàn)量始終高于國(guó)內(nèi);國(guó)外對(duì)數(shù)據(jù)挖掘技術(shù)在電子商務(wù)的應(yīng)用研究早于國(guó)內(nèi);國(guó)內(nèi)數(shù)據(jù)挖掘技術(shù)的應(yīng)用研究還處于初級(jí)階段,但國(guó)外核心作者隊(duì)伍已經(jīng)達(dá)到一定規(guī)模,科研具有一定的延展性和深入性。
第二,在研究熱點(diǎn)與前沿方面,國(guó)內(nèi)外學(xué)者均一直致力于探索電子商務(wù)領(lǐng)域的數(shù)據(jù)挖掘技術(shù)的各種可能性。
第三,在未來發(fā)展趨勢(shì)方面,國(guó)內(nèi)外的研究將會(huì)不斷深入,最終相互融合,共同致力于將成熟的數(shù)據(jù)挖掘技術(shù)結(jié)合實(shí)際的企業(yè)銷售、服務(wù)環(huán)節(jié),實(shí)現(xiàn)最高的企業(yè)服務(wù)質(zhì)量,最佳的企業(yè)效益水平。
本研究通過對(duì)比分析國(guó)內(nèi)外期刊關(guān)于數(shù)據(jù)挖掘技術(shù)應(yīng)用在電子商務(wù)領(lǐng)域中的現(xiàn)有研究狀況和未來研究趨勢(shì),為未來的研究者提供了可參考的知識(shí)范圍并指明了研究方向。不過,本研究對(duì)于文章之間的引用與被引用關(guān)系并未進(jìn)行探討,在未來的研究中,將考慮結(jié)合文獻(xiàn)的引文分析和共被引分析,更好地把握電子商務(wù)數(shù)據(jù)挖掘技術(shù)應(yīng)用的研究進(jìn)展與趨勢(shì)。
參考文獻(xiàn):
[1] 孫桂鴻,林麗珠,余玉娥,等. 基于數(shù)據(jù)挖掘的生鮮電子商務(wù)營(yíng)銷策略研究——以疫情影響的生鮮電商為例[J]. 新經(jīng)濟(jì),2022(01):114-119.
[2] Fonseca-Galindo J C,Surita G D C,Neto J M,et al. A multi-agent system for solving the dynamic capacitated vehicle routing problem with stochastic customers using trajectory data mining[J/OL]. 2022,https://xueshu.baidu.com/usercenter/paper/show?paperid=1a7m0ta0eq7h0070b1220e90dy068913&site=xueshu_se.
[3] 董紹斌. 電子商務(wù)趨勢(shì)下基于數(shù)據(jù)挖掘技術(shù)的淮安區(qū)菜鳥驛站選址分析[J]. 營(yíng)銷界,2021(20):40-41.
[4] Pranto T H,Noman A A,Rahaman M,et al. A blockchain,smart contract and data mining based approach toward the betterment of E-Commerce[J/OL]. [2023-09-25]. https://xueshu.baidu.com/usercenter/paper/show?paperid=1m3c0cb0n f000mx08p430a00qr417785.
[5] Haohua Qing,Guokai Zheng,sDie Fu. Risk data analysis of cross border E-commerce transactions based on data mining[J/OL]. [2023-09-25]. https://xueshu.baidu.com/usercenter/paper/show?paperid=1k460jh02u4a0t60bh3m0rq0uf117711&site =xueshu_se.
[6] 王越,鄭奇. 基于模糊聚類的電子商務(wù)用戶數(shù)據(jù)挖掘研究[J]. 計(jì)算機(jī)產(chǎn)品與流通,2019(03):49.
[7] 陳娥祥. 電子商務(wù)數(shù)據(jù)分析中基于RFM模型的客戶價(jià)值分析研究[J]. 特區(qū)經(jīng)濟(jì),2022(02):148-152.
[8] Ehikioya S A,Zeng J. Mining web content usage patterns of electronic commerce transactions for enhanced customer se rvices[J/OL]. 2021,3(11). https://xueshu.baidu.com/usercenter/paper/show?paperid=112h02v0pb7b0vv0980c0tj0yy487201&si te=xueshu_se.