李浩洋 張瑞軍 周瑜
摘要:在線評論聚集了海量意見與建議,可以為物流企業(yè)的運營管理提供方向性參考。文章提出基于情感分析的用戶創(chuàng)意挖掘方法,幫助物流運營管理獲得具有創(chuàng)新性的用戶反饋,以提升運營效率。文章以郵政快遞為研究對象,以抖音和快手短視頻物流評論為數據源,通過爬蟲獲取數據;其次利用改進的LSTM情感分析模型Bi-LSTM實現情感分類;最后以詞云聚焦話題點,以語義網絡分析圖并結合Apriori關聯規(guī)則分析算法可視化出話題背后最后一公里的服務問題,以便資源調整與服務經營的改進。實驗結果表明,用戶對于快遞員很少送貨上門轉而放入快遞柜不滿;在物流末端的偏遠地區(qū)配送服務一般集中在鄉(xiāng)鎮(zhèn)地區(qū),農村配送難以實現;用戶對于貴重物品損壞丟失以及快遞員服務態(tài)度反映強烈。
關鍵詞:物流評論;服務改進;創(chuàng)意挖掘;情感分類;關聯分析
中圖分類號:F618文獻標志碼:A
DOI:10.13714/j.cnki.1002-3100.2024.11.016
Abstract:Useronlinereviewsgatherahugeamountofopinionsandsuggestions,whichcanprovidedirectionalreferencesfortheoperationandmanagementoflogisticsenterprises.Thispaperproposesausercreativityminingmethodbasedonsentimentanalysistohelplogisticsoperationmanagementobtaininnovativeuserfeedbackandimproveoperationalefficiency.Thisstudytakespostallogisticsastheresearchobject,takesTiktokandKuaishouvideocommentsasthedatasource,andobtainsdatathroughcrawlers;thentheimprovedLSTMsentimentanalysismodelBi-LSTMisusedtoachievesentimentclassification;finally,wordcloudisusedtofocusontopicpoints,andthenetworksemanticgraphiscombinedwithAprioriassociationruleanalysisalgorithmtovisualizetheserviceproblembehindthelastmileofthetopic,inordertoadjustresourcesandimproveservicemanagement.Theresultsoftheexperimentshowthatusersaredissatisfiedwiththefactthatcouriersrarelydelivertotheirhomesandputtheminthedeliverylockersinstead.Distributionservicesinremoteareasattheendoflogisticsaregenerallyconcentratedintownshipareas,andruraldistributionisdifficulttoachieve.Usersstronglyreflectonthelossofdamagedvaluablesandcouriersserviceattitude.
Keywords:logisticsreviews;serviceimprovement;creativitymining;sentimentclassification;associationanalysis
0引言
隨著電商市場發(fā)展趨于飽和,物流同質化愈加嚴重,德邦、極兔被收購都在證明物流市場逐漸開始大洗牌,尤其是像郵政有著悠久歷史的物流企業(yè)如何提升用戶滿意度值得深思。當用戶參與物流企業(yè)的選擇權日漸交給商家時,在線獲取用戶生成內容(UserGeneratedContent,UGC)是獲得用戶反饋,讓用戶參與企業(yè)經營與決策必經的一步。傳統電話熱線,問卷調查等數據分析方法存在用戶涉及面窄、樣本量不足等問題,無法滿足物流需求爆發(fā)下了解客戶訴求變化、提升運輸端服務質量的訴求。建立企業(yè)開放社區(qū),如花粉社區(qū)、開源社區(qū)雖保證了流量和數據樣本量,用戶反饋可靠性高,但對于傳統制造企業(yè)來講維護成本較高。當前能更好弱化時效性且初具數據規(guī)模的及時數據為產品服務在線評論,短視頻評論在穩(wěn)定數據量下還可以很好地聚焦于物流以及其他話題。以郵政物流為例,該主題單個短視頻評論量大多維持在500~1000條左右,可作為數據獲取的途徑。
1文獻綜述
通過在線評論進行物流數據分析與質量評價已經極為普及。王洪偉等基于情感分析的方法深入研究快遞服務質量評價體系,提出了影響快遞服務質量的主要因素,為快遞服務的改進提供針對性參考[1]。張志堅等構建了由制造商和零售商組成的博弈模型,研究零售商是否提供在線評論服務的策略選擇,分析在線評論對供應鏈成員與消費者的影響[2]。夏名首利用中文分詞、RFM改進模型對天貓碧根果買家在線評論的分析表明,各類型買家關注的因素大體相同,但關注度不一;各類型買家購后情感聚焦點基本一致,但參與程度不同[3]。張海道等采用特征提取、主體挖掘與事件構建等方法,對消費者網購在線評論進行分析,探究電商平臺物流服務質量的主要影響因素[4]。
如上研究,傳統物流領域研究更多還只停留在對物流評論進行粗粒度分析,諸如情感分析、影響因素的分析,很少有對物流評論進行挖掘隱含且有直接價值的信息。創(chuàng)意挖掘做為文本挖掘的一個分支,它通過機器學習或深度學習等手段從在線評論中挖掘有價值的信息,可以為物流細粒度研究提供新的思路。如程斌等通過細粒度情感分析模型構建評價指標,對多款手機進行綜合評價與可視化分析,幫助生產者進行工藝改進和發(fā)展方向調整[5]。李琰等借助文本挖掘技術提取不安全行為及其誘因特征詞,運用Apriori算法進行關聯規(guī)則挖掘,搭建不安全行為及其誘因關聯網絡。發(fā)現6類核心誘因與關聯因素會對不安全行為產生直接影響[6]。姜早龍等應用文本挖掘技術提取出改造認知、改造需求、改造施工等主題中不同熱點詞匯的關聯信息,深入研究公眾的關注熱點與討論內容,據此提出針對性的老舊小區(qū)改造推進策略[7]。陰艷超等針對用戶個性化文本需求,提出一種應用于汽車外觀造型設計的改進微粒群算法的混合啟發(fā)式挖掘方法,有效指導了產品創(chuàng)新的實施[8]。
2基于機器學習的郵政創(chuàng)意挖掘流程
本文在文獻研究以及方法綜述的基礎上,聚焦于用戶對于物流企業(yè)的創(chuàng)意性評價。這里基于神經網絡及其他機器學習算法構建評論挖掘模型,具體研究框架如圖1所示,主要由三個部分組成:數據準備、情感分析、物流創(chuàng)意挖掘。
2.1郵政評論獲取與預處理
本文選擇主流的抖音和快手作為物流評論的數據源,利用Python庫偽裝成瀏覽器發(fā)送請求實現爬取物流數據。在進行繁轉簡、錯別字糾正、短句去除等清洗后需要對數據進行預處理。漢語不同于機器語言,一個含義可以有多種表達方式,這就需要分析前在不改變原義的情況下盡可能詞語統一表達。在自定義詞典與百度停用詞進行自定義增刪調整后,分詞效果如圖2所示。
2.2基于神經網絡的文本情感分類
數據集標注與詞向量訓練。本文采用以LSTM為基礎改進的Bi-LSTM有監(jiān)督的情感分類算法,采用維基百科語料庫對評論進行預訓練[9]。為保證標記的客觀性,負向標記為-1,中性或者正向統一標記為1的規(guī)則分類模型,利用Word2vec進行詞向量訓練。不同于滿意度分析,創(chuàng)意源于痛點,創(chuàng)意挖掘的觀點應該更多在物流負面評論中產生,即將正面評論或者中性評論視為一類過濾出去,其中文本分類處理簡化過程如圖3所示。
2.3創(chuàng)意挖掘分析
2.3.1詞云與語義網絡分析
本文以Python的WordCloud庫進行可視化分析,以預處理的詞語為基礎,根據詞頻的不同,詞語大小不同,從而凸顯各個詞語在文本中的不同重要性[10]。
2.3.2關聯規(guī)則分析
本文使用ROST-CM6軟件繪制可視化的語義網絡圖來分析出各個特征詞之間的聯系,比較出詞語彼此之間依存關系[11]。利用Apriori算法對物流負面評論預處理詞語進行關聯分析,它是用一種稱作逐層搜索發(fā)現詞語關系的迭代方法[12]。如圖4所示,K個項的集合為k項集,如果某項集滿足最小支持度,則稱它為頻繁項集,k項集用于探索k+1項集。首先,找出頻繁1項集的集合記做l,l用于找出頻繁2項集的集合l,再用于找出l,如此循環(huán)下去,直到不能找到頻繁k項集。如圖4為一個簡單的分析過程,items為項集,sup為支持度計數,c為候選集i,l為頻繁項集i[13]。
3郵政物流實例研究
3.1數據介紹
郵政數據評論時間集中在2019—2022年9月份,評論量為50000條左右,主要集中在10~25個字符長度,如圖5所示。通過構建Bi-LSTM對郵政評論進行學習,模型準確率如圖6、圖7所示,預測準確度維持在85%以上,Loss下降并趨于平穩(wěn),效果比較理想。最終得出23988條負面評論用于接下來的創(chuàng)意挖掘分析。
3.2創(chuàng)意挖掘結果分析
3.2.1詞云分析
如圖8所示,通過詞云發(fā)現用戶對于郵政的負面話題可以聚焦在丟件問題、速度慢問題、取貨節(jié)點三個方面。丟件話題中與其相關的詞語有貴重物品、賠償、保價、丟失等。速度話題中與其相關的詞語有多天、沒到、路上等。配貨話題則是自提、送貨上門、鄉(xiāng)鎮(zhèn)、農村等詞語。
3.2.2語義網絡與關聯分析
(1)從圖9看出與“丟失”密切相關的詞語有“保價”、“賠償”、“貴重”,用戶通常在發(fā)貨前對商品進行保價來降低損失。從表1中的關聯分析表看,“丟失”出現的情況下“賠償”出現的概率達80%,說明商品損壞或者丟失的情況下消費者關注的問題之一是賠償。在“運費”出現時“賠償”一詞出現概率為74.7%,結合文本來看消費者不滿于解決方案多是3倍運費,小于商品本身的價值?!百F重物品”出現的情況下,“保價”出現概率為53.1%,說明通過保價方式來減小損失是消費者普遍接受的一種解決賠償方式。
(2)圖9中與速度密切相關的詞語有:“多天”、“沒到”、“三天”等,文本對于速度的界定多以3~4天到貨為準,而負面評論表示收貨多在一周左右甚至更久。從置信度來看“郵寄”、“沒到”詞語出現的情況下主要詞語為“多天”,其概率分別均高于40%,說明用戶在運輸速度上不滿,結合詞云和文本發(fā)現爆倉、門店營運時間、快遞員服務意識對于速度產生一定影響,說明郵政物流需要在這幾個節(jié)點上進行改進。
(3)在取貨問題上,與取貨問題相關的詞語有“打電話”、“鄉(xiāng)鎮(zhèn)”、“送貨上門”等,郵政配送網點難以覆蓋所有區(qū)域,且多以電話或者短信形式直接通知用戶去自提點取貨。“放”出現的情況下“自提點”出現的概率為76.47%,即快遞小哥多在未征得用戶意見的情況下放到自提點,加之驛站距離較遠,下班時候驛站已經關門給消費者帶來了極大的不便利性?!八拓浬祥T”59%概率表明用戶訴求是送貨上門。從支持度來看“農村”、“鄉(xiāng)鎮(zhèn)”詞語出現概率較大,結合上文分析發(fā)現郵政物流在上述行政區(qū)域網點覆蓋率低,配送范圍止于鄉(xiāng)鎮(zhèn),農村等偏遠地區(qū)難以進行配送。
4結論與展望
本文通過創(chuàng)意挖掘分析發(fā)現郵政物流存在的諸多問題。上述這些問題與其內部人員管理、組織結構以及組織戰(zhàn)略相關,但不是單個原因造成的,而是環(huán)環(huán)相扣交錯影響所帶來的結果。通過上述分析總結出如下建議:
(1)加強對自提點的管控。早期市場競爭時期,為了加快市場布局,物流多采用加盟方式推進市場布局,雖然在速度上取得了優(yōu)勢,但是也導致管理的困難,諸如疫情防控難以落實、員工素質低、安全性差、不服從總部管理等問題。中國郵政的自提點為中郵驛站,其主要集中在一線城市。進行擴充中郵驛站市場,在加強驛站自營比例的同時,加強和完善經營制度以及嚴格的經營流程是一種比較好的方向。
(2)注重員工成長,提升員工待遇。當前分揀效率提升下,一線員工作業(yè)強度也不斷加大,且越加機械,員工的崗位認同感也逐漸降低。快遞員不愿送貨上門的原因,不單是責任心問題,還有配送員個人利益問題,每單利潤過于稀薄。放到驛站可以減少配送量,利潤進一步分割也是無奈之舉。不難發(fā)現德邦、順豐在價格上高于市場但在服務上可以做到送貨上門。郵政之所以難以下沉到村級配送,也是由于參與農村配送的企業(yè)與員工利潤太少,也是造成快件丟失,服務差的主要原因。
(3)完善公司作業(yè)服務規(guī)章制度。制定公司各項規(guī)章制度,嚴格按規(guī)章制度辦事,獎懲分明有章可循,有法可依,才能改變公司的面貌職工才有歸屬感。另外在運輸、倉儲、搬運、裝卸、流通等環(huán)節(jié)作業(yè)流程應標準化與規(guī)范化,比如在產品寄件時提醒顧客貴重貨物保價問題以及賠償標準事宜等,不僅可提升服務質量,也可減少后期投訴頻率。監(jiān)督倉庫作業(yè)人員、配送員在包裝、分揀、貼標、搬運、質檢時,嚴格按作業(yè)規(guī)范進行操作,保障服務質量。比如郵政物流倉庫環(huán)節(jié)中對于臨時工的作業(yè)規(guī)范,服務外包的管控。
本文仍有不足之處可以在未來研究中進行完善,諸如針對短文本話題分析可以利用針對性算法研究,或者采用多種組合算法進行研究。
參考文獻:
[1]王洪偉,宋媛,杜戰(zhàn)其,等.基于在線評論情感分析的快遞服務質量評價[J].北京工業(yè)大學學報,2017,43(3):402-412.
[2]張志堅,王鵬,郭軍華,等.基于在線評論服務策略的電商供應鏈決策[J].系統工程學報,2021,36(2):227-239.
[3]夏名首.基于買家在線評價的購后評價特征數據挖掘[J].中國流通經濟,2017,31(7):30-38.
[4]張道海,楊晨.基于語義的電商平臺物流服務質量主題分析[J].物流科技,2023,46(1):36-40.
[5]程斌,高圣國.基于細粒度情感的文本挖掘及可視化分析[J].應用數學進展,2021,10(1):128-136.
[6]李琰,張祎,侯濤,等.基于文本挖掘的不安全行為誘因關聯網絡分析[J].煤礦安全,2023,54(4):251-256.
[7]姜早龍,李荷.老舊小區(qū)改造的公眾關注熱點及推進策略研究——基于文本挖掘技術[J].建筑經濟,2023,44(1):29-36.
[8]陰艷超,孫林夫,郭成.基于模糊物元PSO混合優(yōu)化算法的客戶創(chuàng)意挖掘[J].計算機應用研究,2008,25(8):2309-2311,2318.
[9]SIAMI-NAMINIS,TAVAKOLIN,NAMINAS.TheperformanceofLSTMandBiLSTMinforecastingtimeseries[C]//2019IEEEInternationalConferenceonBigData(BigData).LosAngeles,CA,USA:IEEE,2019:3285-3292.
[10]NINGW,LINS,ZHOUJ,etal.WocEA:Thevisualizationoffunctionalenrichmentresultsinwordclouds[J].JournalofGeneticsandGenomics,2018,45(7):415-417.
[11]楊雯丹,曹國忠.基于依存句法和語義網絡的用戶需求識別方法[J].機械設計,2022,39(10):154-160.
[12]李英,湯庸.基于關聯規(guī)則與相似度的數據挖掘算法研究[J].華南師范大學學報(自然科學版),2021,53(5):121-127.
[13]PAPIR,ATTARCHIS,BOLOORANIAD,etal.KnowledgediscoveryofMiddleEastdustsourcesusingApriorispatialdataminingalgorithm[J].EcologicalInformatics,2022,72:101867.
收稿日期:2023-06-07
基金項目:武漢科技大學研究生創(chuàng)新創(chuàng)業(yè)基金項目(JCX2021039);湖北省高等學校省級教學研究項目(2020369);湖北省高等學校哲學社會科學研究重點項目(21D014)
作者簡介:李浩洋(1997—),男,河南漯河人,武漢科技大學管理學院碩士研究生,研究方向:自然語言處理、物流管理;張瑞軍(1972—),男,湖北仙桃人,武漢科技大學服務科學與工程研究中心,教授,博士,研究方向:自然語言處理;周瑜(1999—),男,湖北鄂州人,武漢科技大學管理學院碩士研究生,研究方向:供應鏈管理。
引文格式:李浩洋,張瑞軍,周瑜.基于在線評論的郵政物流服務創(chuàng)意挖掘研究[J].物流科技,2024,47(11):64-67.