羅向東 強(qiáng)威 張?,? 吳夢(mèng)
User evaluation and sentiment analysis of running shoes based on text mining
收稿日期:2023- 12 -11;修回日期:2024-04-25
基金項(xiàng)目:教育部人文社會(huì)科學(xué)一般項(xiàng)目(22YJCZH246) ;陜西省重點(diǎn)研發(fā)計(jì)劃項(xiàng)目(2023-YBGY-144)
作者簡(jiǎn)介:羅向東(1974),男,教授,博導(dǎo),主要從事產(chǎn)品大數(shù)據(jù)與標(biāo)準(zhǔn)化的研究。
摘要:為了挖掘消費(fèi)者在線購(gòu)買跑鞋時(shí)的關(guān)注信息,文章用大數(shù)據(jù)分析視角,以“京東商城”為例按照銷量排序分析了前600款跑鞋品牌定位、價(jià)格分布、優(yōu)惠信息、標(biāo)簽占比,使用LDA模型對(duì)10萬(wàn)條跑鞋在線評(píng)論進(jìn)行文本挖掘,對(duì)商品評(píng)論數(shù)據(jù)進(jìn)行詞頻共現(xiàn)分析、主題聚類與情感分析,從品牌、技術(shù)和售后服務(wù)的維度分析了問(wèn)題的原因并提出相關(guān)建議。研究表明:國(guó)產(chǎn)品牌跑鞋在各價(jià)位段布局完整,銷量高的跑鞋多使用滿減和商品券,自營(yíng)和優(yōu)惠券標(biāo)簽對(duì)跑鞋購(gòu)買具較為顯著的促進(jìn)作用;消費(fèi)者購(gòu)買跑鞋時(shí)主要關(guān)注外觀細(xì)節(jié)、功能屬性、性價(jià)比、穿著感受、服務(wù)優(yōu)惠等方面。
關(guān)鍵詞:跑鞋;文本挖掘;LDA模型;聚類分析;情感分析
中圖分類號(hào):TS101.91?????? 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1001-7003(2024)06-0108 -12
DOI: 10.3969 / j.issn.1001-7003.2024.06.012
隨著網(wǎng)購(gòu)消費(fèi)模式日漸習(xí)以為常,消費(fèi)者獲取產(chǎn)品評(píng)價(jià)信息的途徑從以往的口碑相傳變?yōu)榱嗽诰€評(píng)論。超過(guò)七成的消費(fèi)者網(wǎng)購(gòu)時(shí)會(huì)參考電商平臺(tái)商品評(píng)價(jià)信息,九成以上的企業(yè)相信評(píng)論意見會(huì)對(duì)未來(lái)消費(fèi)行為產(chǎn)生決定性作用[1]。產(chǎn)品在線評(píng)論不同于主觀調(diào)研數(shù)據(jù),不會(huì)受到調(diào)研過(guò)程中研究人員的主觀判斷,能夠反映用戶真實(shí)的使用體驗(yàn)與情感傾向。因此,研究用戶評(píng)價(jià)大數(shù)據(jù)對(duì)于加快產(chǎn)品設(shè)計(jì)轉(zhuǎn)向、促進(jìn)市場(chǎng)營(yíng)銷和提高用戶滿意度等牽引產(chǎn)品設(shè)計(jì)研發(fā)的方式十分重要。
跑步作為一項(xiàng)不需要場(chǎng)地和技術(shù)要求的低門檻運(yùn)動(dòng)項(xiàng)目,兼具愉悅身心、降低體脂率和減少慢性疾病患病的風(fēng)險(xiǎn),深受廣大人群喜愛[2]。跑鞋在跑步中扮演著至關(guān)重要的角色,無(wú)論是專業(yè)運(yùn)動(dòng)員還是業(yè)余跑者,選擇合適的跑鞋都是確保跑步效果和舒適度的關(guān)鍵因素。近年來(lái),本土設(shè)計(jì)制造的崛起促使國(guó)產(chǎn)跑鞋在某些市場(chǎng)賽道實(shí)現(xiàn)了彎道超車,跑鞋也因其日常穿著舒適性和個(gè)性化設(shè)計(jì)受到了廣泛的市場(chǎng)關(guān)注,也是中國(guó)體育運(yùn)動(dòng)產(chǎn)品中最受關(guān)注的品類之一[3-4]。當(dāng)前關(guān)于跑鞋的研究主要包括以下三個(gè)方向:
1)以產(chǎn)品功能為核心,主要集中在設(shè)計(jì)、制造與測(cè)試的產(chǎn)品研發(fā)流程,其中主要包括結(jié)構(gòu)設(shè)計(jì)和材料選擇。跑鞋的結(jié)構(gòu)涉及外底、中底、幫面、鞋舌和鞋帶,設(shè)計(jì)時(shí)需要考慮功能與人體運(yùn)動(dòng)之間的協(xié)調(diào)性,減少運(yùn)動(dòng)時(shí)外力對(duì)人體造成的沖擊[5]。近年來(lái),有不少研究致力于在跑鞋對(duì)人體下肢的影響和跑步經(jīng)濟(jì)性之間尋求平衡[6-7]。跑鞋設(shè)計(jì)的重要目標(biāo)是在保護(hù)跑步者身體的同時(shí),提高跑步經(jīng)濟(jì)性。一些研究指出,過(guò)度緩震的跑鞋可能會(huì)減少跑步者的運(yùn)動(dòng)效率和穩(wěn)定性,從而增加能量消耗[8]。另一些研究則表明,適當(dāng)?shù)木徴鹪O(shè)計(jì)可以降低跑步時(shí)對(duì)膝蓋和其他關(guān)節(jié)的沖擊,減少運(yùn)動(dòng)損傷風(fēng)險(xiǎn)[9]。因此,跑鞋設(shè)計(jì)需要在緩震、穩(wěn)定和支撐等方面尋求平衡點(diǎn),以最大程度地保護(hù)跑步者身體健康的同時(shí),提高跑步經(jīng)濟(jì)性。材料方面主要涉及幫面材料的透氣性和舒適性[10],外底的耐磨性及中底的緩震性[11]。近年來(lái),跑鞋制造技術(shù)更多是在方法尋求創(chuàng)新,目的是實(shí)現(xiàn)個(gè)性化定制[12]。在跑鞋的測(cè)試環(huán)節(jié)主要是驗(yàn)證功能性和舒適性是否達(dá)到了預(yù)期目標(biāo),主要用到的方法是實(shí)驗(yàn)法和主觀評(píng)價(jià)法[13-14]。2)以鞋楦再設(shè)計(jì)為重點(diǎn),旨在確保鞋類舒適性、耐用性和美觀程度,目前研究主要集中在鞋楦曲面優(yōu)化和個(gè)性化定制。鞋楦曲面優(yōu)化包括三維曲面特征快速提取[15],曲面誤差分析[16],腳型楦型匹配精度分析[17],曲面加工效率提升[16]等。鞋楦?jìng)€(gè)性化定制主要解決腳部曲面和鞋楦曲面數(shù)據(jù)的匹配,主要用到了模糊層次分析法[18],點(diǎn)云相似度評(píng)估[19],人工神經(jīng)網(wǎng)絡(luò)[20]等。3) 以市場(chǎng)需求為導(dǎo)向,通過(guò)主觀問(wèn)卷和查閱相關(guān)文獻(xiàn)資料的方式,借助需求分析模型和統(tǒng)計(jì)類方法確定跑鞋市場(chǎng)定位,發(fā)現(xiàn)潛在市場(chǎng)機(jī)會(huì)。有學(xué)者對(duì)鞋類需求要素分類并賦權(quán),指導(dǎo)相關(guān)產(chǎn)品研發(fā)[21]。另有研究運(yùn)用K-Means和ANOVA方差分析,發(fā)現(xiàn)了跑鞋各品牌中休閑身份認(rèn)同與品牌來(lái)源國(guó)效應(yīng)的共同作用[22]。也有學(xué)者通過(guò)深度訪談,從屬性、結(jié)果和價(jià)值三級(jí)深層次挖掘了馬拉松愛好者購(gòu)買運(yùn)動(dòng)跑鞋時(shí)的內(nèi)心價(jià)值和產(chǎn)品評(píng)價(jià),但該研究只針對(duì)線下商超和專賣渠道[23]。至2020年疫情以來(lái),因供應(yīng)商問(wèn)題導(dǎo)致全球運(yùn)動(dòng)鞋庫(kù)存不足,各大品牌促銷活動(dòng)減少被迫全價(jià)銷售,消費(fèi)者購(gòu)買熱情降低,在整體電商市場(chǎng)低迷的情況下,跑鞋的線上銷售熱度卻逆勢(shì)上揚(yáng),2021年6月至2022年5月,中國(guó)跑鞋電商營(yíng)業(yè)額累計(jì)429.9億元[24]。因此,了解跑鞋的消費(fèi)趨勢(shì)和消費(fèi)者偏好對(duì)產(chǎn)業(yè)發(fā)展和營(yíng)銷策略制定具有重要意義,但目前這方面的研究還相對(duì)較少,尤其是“大數(shù)據(jù)+跑鞋”方面的研究。
通過(guò)文獻(xiàn)梳理可知,目前還鮮有學(xué)者從電商大數(shù)據(jù)角度探討消費(fèi)者在購(gòu)買和使用跑鞋時(shí)的關(guān)注因素。因而,本文以“京東商城”為例采集跑鞋的銷售特征信息和商品評(píng)論數(shù)據(jù),分析京東平臺(tái)銷售前600跑鞋的銷售特征并對(duì)10萬(wàn)條用戶評(píng)論進(jìn)行文本挖掘,探討消費(fèi)者購(gòu)買跑鞋時(shí)的關(guān)注重點(diǎn)并提出相關(guān)建議,以大數(shù)據(jù)視角幫助商家和研發(fā)機(jī)構(gòu)更好地了解消費(fèi)者需求和市場(chǎng)情況,為產(chǎn)品戰(zhàn)略決策提供參考,具有較強(qiáng)的創(chuàng)新性和實(shí)用意義。
1 研究方案設(shè)計(jì)
1.1 研究方法
文本挖掘是針對(duì)非結(jié)構(gòu)化文本進(jìn)行的數(shù)據(jù)挖掘,包括情感分析、詞頻分析和語(yǔ)義網(wǎng)絡(luò)分析等,在評(píng)論分析等領(lǐng)域得到了國(guó)內(nèi)外學(xué)者廣泛應(yīng)用[25-26]。邢云菲等[27]運(yùn)用文本聚類算法和主題圖譜理論構(gòu)建了網(wǎng)絡(luò)用戶在線評(píng)論的聚類模型,利用圖譜可視化揭示了不同地區(qū)酒店用戶觀點(diǎn)的差異,并對(duì)不同圖譜的社會(huì)網(wǎng)絡(luò)特征進(jìn)行了分析。張艷豐等[28]運(yùn)用語(yǔ)義特征分析、情感特征分析、詞頻共現(xiàn)分析和時(shí)間特征分析等方法,從內(nèi)容上對(duì)手機(jī)在線用戶追加評(píng)論文本進(jìn)行了文本內(nèi)容挖掘,研究了在線用戶追加評(píng)論的內(nèi)容情報(bào)特征與初始評(píng)論文本語(yǔ)義之間的關(guān)聯(lián)和差異。Chunjeong等[29]首先根據(jù)評(píng)分將42款騎行褲的電商評(píng)論劃分為正面評(píng)論和負(fù)面評(píng)論,然后運(yùn)用詞云圖和共現(xiàn)聚類等方法,揭示了消費(fèi)者對(duì)產(chǎn)品滿意和不滿意的方面。與傳統(tǒng)調(diào)研方法相比,文本挖掘能夠更方便快速地發(fā)現(xiàn)消費(fèi)者的關(guān)注點(diǎn)和偏好,具有規(guī)模化、客觀化、多維化和成本低等優(yōu)勢(shì)。
1.2 數(shù)據(jù)采集
京東商城作為中國(guó)第二大電商平臺(tái),擁有大量客戶群體,
其在線評(píng)論模塊十分全面、細(xì)致且便于消費(fèi)者閱讀[30];其次京東平臺(tái)提供了豐富的API服務(wù),支持獲取評(píng)論數(shù)據(jù)和商品數(shù)據(jù)等,方便進(jìn)行大規(guī)模的數(shù)據(jù)采集和分析。本文使用Python 3.11,于2023年11月1日收集京東商城跑鞋銷售特征數(shù)據(jù)和用戶評(píng)論數(shù)據(jù):第一步,通過(guò)Python調(diào)用Requests第三方庫(kù)發(fā)送按銷量排序的跑鞋鏈接地址,獲取到網(wǎng)頁(yè)評(píng)論源代碼。第二步,解析HTML內(nèi)容。使用Lxml和Json第三方庫(kù)進(jìn)行數(shù)據(jù)解析并提取銷售排名前600款跑鞋品牌、價(jià)格、優(yōu)惠、標(biāo)簽和商品評(píng)論內(nèi)容,提取評(píng)論時(shí)將每款跑鞋能夠顯示出的所有評(píng)論全部提取。第三步,進(jìn)行分頁(yè)處理。依據(jù)構(gòu)造頁(yè)碼的請(qǐng)求地址,且以Maxpage為基準(zhǔn)進(jìn)行最大分頁(yè)提取。第四步,儲(chǔ)存提取的數(shù)據(jù)。調(diào)用Python中Pymysql庫(kù)將數(shù)據(jù)儲(chǔ)存為“xlsx.”格式[31]。要注意的是,獲取數(shù)據(jù)過(guò)程中為了模擬真實(shí)的用戶訪問(wèn)環(huán)境,需在構(gòu)造函數(shù)前將其初始化,并將驗(yàn)證登錄信息中請(qǐng)求頭中的Uer-Agent和Referer模擬瀏覽器訪問(wèn)界面,使用UA、Referer和Cookie抓取當(dāng)前評(píng)論。在獲取數(shù)據(jù)過(guò)程中需遵守《中華人民共和國(guó)網(wǎng)絡(luò)安全法》,不得對(duì)服務(wù)器造成壓力,確保數(shù)據(jù)的合法性。由于跑鞋的價(jià)格和中底材料密切相關(guān),而在部分跑鞋的商品參數(shù)頁(yè)中并未明確該標(biāo)識(shí),需要依據(jù)商品詳情手動(dòng)補(bǔ)充。
1.3 數(shù)據(jù)預(yù)處理
由于用戶評(píng)論文本屬于非結(jié)構(gòu)化數(shù)據(jù),其中存在大量無(wú)關(guān)詞匯、表情符號(hào)和無(wú)效評(píng)論,直接進(jìn)行文本挖掘分析可能會(huì)導(dǎo)致效果不佳,因此需進(jìn)行文本預(yù)處理。首先,需進(jìn)行數(shù)據(jù)去重。本次總共收集跑鞋評(píng)論數(shù)據(jù)131 022條,去重后包括50個(gè)品牌600個(gè)鞋款在內(nèi)的用戶評(píng)論數(shù)據(jù)共計(jì)103 874條;接著,設(shè)置自定義詞庫(kù)、文本分詞和去除停用詞等預(yù)處理,以提高文本挖掘的準(zhǔn)確性和有效性[32]。通過(guò)Jieba庫(kù)中文分詞系統(tǒng)中的精確模式,對(duì)在線評(píng)論文本進(jìn)行分詞處理,結(jié)果如表1所示。1.4 數(shù)據(jù)分析
完成數(shù)據(jù)預(yù)處理后,即可進(jìn)行數(shù)據(jù)分析。本文首先使用Origin 2021對(duì)跑鞋銷售特征基本信息進(jìn)行繪圖分析并提取評(píng)論文本關(guān)鍵詞;然后利用LDA模型和Gibbs抽樣對(duì)評(píng)論文本進(jìn)行聚類,探究不同主題下的產(chǎn)品特征詞分布。LDA模型是一種基于三層貝葉斯概率模型的方法,包括文檔、主題和特征詞三個(gè)層次。其核心思想是將每個(gè)文檔表示為多個(gè)潛在主題的混合分布,而每個(gè)主題則是詞匯表中所有單詞的概率分布[33]。通過(guò)對(duì)高維單詞的降維,形成由一組主題詞構(gòu)成的小維度主題空間,降低了文本相似性。首先,將分詞結(jié)果轉(zhuǎn)化為詞典Corpus,基于Corpus運(yùn)用LDA模型,設(shè)置主題數(shù)num_topics,獲得LDA主題分析結(jié)果;接著,使用pyLDAvis模塊,根據(jù)LDA模型、詞典、語(yǔ)料生成主題可視化網(wǎng)頁(yè),直觀展示各主題的詞語(yǔ)分布、主題間關(guān)系等信息;最后,使用SnowNLP對(duì)文本進(jìn)行情感打分,獲得正面和負(fù)面標(biāo)簽,并基于情感標(biāo)簽進(jìn)
行主題分析,比較正負(fù)面評(píng)論的主題分布差異,技術(shù)路線如圖1所示。
2 跑鞋銷售特征數(shù)據(jù)分析
運(yùn)動(dòng)科學(xué)的發(fā)展和對(duì)運(yùn)動(dòng)體驗(yàn)感要求的提升促使跑鞋不但要在功能設(shè)計(jì)上符合腳型特征和運(yùn)動(dòng)規(guī)律,而且在款式設(shè)計(jì)上要體現(xiàn)運(yùn)動(dòng)性、場(chǎng)景化和個(gè)性化特征。為保證商品信息內(nèi)容完整且方便閱讀,選取京東商城商品相關(guān)信息為數(shù)據(jù)來(lái)源,具有較強(qiáng)的代表性,且有利于后期信息數(shù)據(jù)分析。以“跑
鞋”作為關(guān)鍵詞進(jìn)行商品檢索,將結(jié)果按銷量從高到低排序,獲取前600名鞋款的商品基本信息,包括品牌、價(jià)格、優(yōu)惠等,目的是對(duì)跑鞋商品的銷售現(xiàn)狀作以基本了解。
2.1 品牌定位
通過(guò)對(duì)京東商城獲取的跑鞋數(shù)據(jù)進(jìn)行清洗,被列入的品牌包括“安踏、耐克、李寧、亞瑟士、鴻星爾克”等近50個(gè)品牌,由于其中27個(gè)品牌前600的銷售鞋款低于2款,且銷量排名靠后,為了使統(tǒng)計(jì)結(jié)果更具代表性,將這些較為冷門的鞋款不納入品牌統(tǒng)計(jì)。品牌間的價(jià)格區(qū)間分布如圖2所示,主銷產(chǎn)品系列數(shù)量如圖3所示。由于品牌定位及內(nèi)部主銷產(chǎn)品系列價(jià)格跨度的差異,各價(jià)格層級(jí)跑鞋品牌定位已形成同類聚集效應(yīng)。首先,以“匹克、回力和迪卡儂”為代表的跑鞋主打價(jià)格在85~359元的入門市場(chǎng),該價(jià)格段除“迪卡儂”其余均為國(guó)產(chǎn)品牌,其中,回力在79~120元布局了31款產(chǎn)品,遠(yuǎn)超該價(jià)位段所有品牌系列產(chǎn)品的總和,說(shuō)明該價(jià)位段的跑鞋消費(fèi)者在關(guān)注產(chǎn)品性價(jià)比的同時(shí)同樣關(guān)注品牌效應(yīng)。其次,以“安踏、斯凱奇、美津濃”等為代表的跑鞋主打價(jià)格在139 ~599元的中低端市場(chǎng),其中安踏跑鞋以72款產(chǎn)品系列數(shù)量位居所有品牌第一。該價(jià)位層級(jí)逐漸出現(xiàn)了類似“必邁”的新興品牌,
同時(shí)消費(fèi)者在選購(gòu)時(shí)較多地關(guān)注到了國(guó)外品牌。再次,以“特步、李寧、鴻星爾克”等為代表的跑鞋主打價(jià)格在89 ~ 1 299元的全品類市場(chǎng)。因?yàn)楫a(chǎn)品價(jià)格跨度大,所以該價(jià)位層級(jí)所有品牌主銷產(chǎn)品系列數(shù)較多,且大部分為國(guó)產(chǎn)品牌,同時(shí)由于較強(qiáng)的品牌效應(yīng),該價(jià)位層級(jí)的高端產(chǎn)品依然受到了消費(fèi)者的認(rèn)可。隨后,以“耐克和亞瑟士”為代表的跑鞋主打價(jià)格在429~1 870元的高端市場(chǎng),他們憑借強(qiáng)大的品牌效應(yīng)和專業(yè)的研發(fā)團(tuán)隊(duì)使其各系列跑鞋無(wú)論在銷量還是售價(jià)上均處于市場(chǎng)絕對(duì)優(yōu)勢(shì)。最后,以“斐樂(lè)和安德瑪”為代表的跑鞋主打價(jià)格在509~1 219元的中高端市場(chǎng),需要說(shuō)明的是此價(jià)位層級(jí)的跑鞋雖然在單價(jià)上高于大部分競(jìng)品,但其主銷產(chǎn)品系列較少,定位于中高端市場(chǎng)中的較少特定消費(fèi)群體。
2.2 產(chǎn)品價(jià)格區(qū)間分布
跑鞋的核心技術(shù)集中在中底的材質(zhì)和加工工藝更好的支撐、回彈和滾動(dòng)設(shè)計(jì)將服務(wù)于更高的跑步效率。圖4為銷售前600款跑鞋的價(jià)格散點(diǎn)圖。中底方面,以EVA為單一基材的中底跑鞋主要分布在400元以下,具有更好回彈性能的ETPU和PEBAX材質(zhì)主要分布在450 ~1 200元。同時(shí),在平均價(jià)格385元以下跑鞋中底主要由單一的EVA材料發(fā)泡而成,售價(jià)越高,中底結(jié)構(gòu)及工藝越復(fù)雜,以碳板和TPU支撐輔件為中底的跑鞋多分布在700元以上中高價(jià)位段。此外,銷售排名前300中具有復(fù)合中底的跑鞋數(shù)量要高于300名以后的。EVA中底跑鞋價(jià)格從98元跨越到1 400元,跨度較大,有可能受到發(fā)泡工藝的影響。
2.3 產(chǎn)品優(yōu)惠情況
在調(diào)研中發(fā)現(xiàn),滿減、商品券、贈(zèng)品和折扣是常見的優(yōu)惠形式。銷售排名前600的跑鞋中有465款跑鞋參與優(yōu)惠,其中383款跑鞋參與滿減,322款跑鞋參與商品券的使用。由于“滿300減30”有280款跑鞋,占比較大,為了呈現(xiàn)效果所以未顯示于圖5中,由圖5可知大部分鞋款的滿減條件低于400元,滿減優(yōu)惠在10~200元不等;商品優(yōu)惠券方面,由于用“券99減10元”有91款跑鞋,“券6減5元”有25款跑鞋,“券249減20元”有24款跑鞋均占比較大,為了呈現(xiàn)效果所以未顯示于圖6中,由圖6可知大部分鞋款的用券條件低于也400元,用券優(yōu)惠在5 ~ 200元不等,用券優(yōu)惠度高于滿減,尤其是在部分高價(jià)位段,如在1 000 ~ 1 600元也存在一定數(shù)量的用券條件,尤其是耐克的五款跑鞋更是推出了“券1 000減400元”的大幅優(yōu)惠。贈(zèng)品主要有備用鞋墊和鞋帶、清洗劑、襪子、logo掛件等。折扣分為一雙5.9折、7折、8折、8.1折或8.8折,兩雙8折或9折。需要說(shuō)明為了不使圖中各價(jià)位的圓形區(qū)域疊加混淆,所以賦予不同的顏色,便于視覺(jué)區(qū)分。
2.4 產(chǎn)品各標(biāo)簽占比
分別統(tǒng)計(jì)銷量前100和前600名的跑鞋的各標(biāo)簽占比,以研究高銷量商品標(biāo)簽和整體的差異,如圖7所示。高銷量鞋款在自營(yíng)、優(yōu)惠券、門店有售和品質(zhì)認(rèn)證標(biāo)簽占比高于整體水平;在折扣、京東物流和品質(zhì)溯源標(biāo)簽占比與整體基本持平;在贈(zèng)品、新品和免郵方面低于整體。總體看,圖7中自營(yíng)和優(yōu)惠券處前100標(biāo)簽占比要明顯高于前600(藍(lán)色區(qū)域面積
明顯高于紅色),說(shuō)明該兩類標(biāo)簽對(duì)跑鞋購(gòu)買具較為顯著的促進(jìn)作用,與前100熱銷鞋款相比,新品標(biāo)簽的對(duì)購(gòu)買影響不大(紅色區(qū)域面積明顯高于藍(lán)色)。
3 跑鞋評(píng)論文本分析
為進(jìn)一步挖掘跑鞋用戶在線評(píng)論中的信息、了解消費(fèi)者對(duì)跑鞋的關(guān)注點(diǎn),本文采用LDA主題聚類與情感分析探索消費(fèi)者對(duì)現(xiàn)有跑鞋商品的滿意度,采用詞頻分析、主題聚類、情感分析、共現(xiàn)分析探討消費(fèi)者的關(guān)注重點(diǎn)。
3.1 詞頻分析
評(píng)論數(shù)據(jù)分詞后存在一些與商品本身相關(guān)屬性無(wú)關(guān)的重復(fù)詞匯,如“好評(píng)”“很好”等,因此需要進(jìn)行數(shù)據(jù)清洗,剔除與商品屬性無(wú)關(guān)的評(píng)論信息并設(shè)置停用詞表。詞頻—逆文本頻率(Term Frequency-Inverse Document Frequency, TF-IDF)算法不僅基于詞頻計(jì)算,而且引入了逆文本頻率的概念,以提高關(guān)鍵詞提取的準(zhǔn)確性和代表性[34]。因此,該算法可以有效地衡量單詞在評(píng)論文本中的重要性,并提取最具代表性的關(guān)鍵詞。表2為部分與跑鞋商品屬性相關(guān)的關(guān)鍵詞及其詞頻信息。從詞頻統(tǒng)計(jì)中可以看出“舒服”一詞的出現(xiàn)頻率最高,表明消費(fèi)者尤為關(guān)注跑鞋的穿著體驗(yàn),特別是對(duì)舒適度的關(guān)注。其次是“做工”,反映了在穿著體驗(yàn)之外,跑鞋產(chǎn)品本身的設(shè)計(jì)和質(zhì)量也會(huì)成為消費(fèi)者關(guān)注的焦點(diǎn)。在詞頻排名前十中,“透氣性”是消費(fèi)者關(guān)注的另一重要的穿著體驗(yàn),這關(guān)系到跑鞋的衛(wèi)生性能,即幫面設(shè)計(jì)如何能夠及時(shí)排出鞋腔內(nèi)的水蒸氣,保持內(nèi)部濕度合適。另外,“尺碼”“顏值”“細(xì)節(jié)”“鞋底”等跑鞋重要設(shè)計(jì)要素也是消費(fèi)者評(píng)論關(guān)注的重點(diǎn)內(nèi)容。使用TF-IDF算法分詞功能提取評(píng)論文本的特征關(guān)鍵詞后基于分詞結(jié)果繪制詞云圖,如圖8所示。
3.2 關(guān)鍵詞共現(xiàn)分析
使用KH Coder 3.Beta.07e對(duì)上述跑鞋評(píng)論關(guān)鍵詞做共現(xiàn)分析。通過(guò)分析關(guān)鍵詞的共現(xiàn)情況,可以揭示不同關(guān)鍵詞之間的關(guān)聯(lián)性和相關(guān)性,有助于理解文本中的語(yǔ)義關(guān)系,發(fā)現(xiàn)隱藏的主題和潛在的關(guān)聯(lián)[35]。在TF-IDF算法基礎(chǔ)上,通過(guò)計(jì)算Jaccard相似性系數(shù)判斷樣本集中兩樣本之間的相似度,建立關(guān)鍵詞之間的共現(xiàn)網(wǎng)絡(luò)或相關(guān)性圖譜[36]。圖9為跑鞋評(píng)論中關(guān)鍵詞共現(xiàn)圖譜,圓圈大小表示該關(guān)鍵詞的出現(xiàn)頻率,關(guān)鍵詞之間有鏈接代表其具有相關(guān)關(guān)系,數(shù)值代表關(guān)聯(lián)度的強(qiáng)弱。由圖9可以發(fā)現(xiàn),關(guān)鍵詞間的共現(xiàn)關(guān)系復(fù)雜,整體性和系統(tǒng)性趨勢(shì)明顯,說(shuō)明在消費(fèi)跑鞋過(guò)程中,消費(fèi)者較為注重從品牌認(rèn)同、產(chǎn)品、購(gòu)物到售后的綜合體驗(yàn)過(guò)程。跑鞋的舒適性是其功能的核心,也是產(chǎn)品宣傳和銷售話術(shù)中的重點(diǎn)[37],與“舒服”直接或間接相關(guān)度高的詞有“舒適度”“腳”“透氣”“包裹”“輕便”“外觀”“質(zhì)量”“服務(wù)”,可見消費(fèi)者對(duì)舒適的體驗(yàn)是綜合性評(píng)價(jià)的結(jié)果,不僅局限在產(chǎn)品功能層面,也會(huì)受到視覺(jué)及服務(wù)的間接影響。評(píng)價(jià)關(guān)鍵詞中和“鞋底”高度相關(guān)的是“軟”和“支撐”,鏈接強(qiáng)度分別是0.19和0.09,說(shuō)明與回彈性相比,消費(fèi)者更在意跑鞋鞋底的緩震功能;與關(guān)鍵詞“好
看”高度相關(guān)的產(chǎn)品要素是“顏色”和“款式”,鏈接強(qiáng)度分別是0.10和0.08,可見相對(duì)于跑鞋款式,消費(fèi)者更在意產(chǎn)品的配色設(shè)計(jì)。需要特別說(shuō)明的是,在共現(xiàn)圖譜中存在一些與其他高頻詞關(guān)聯(lián)性差的頻率較低的詞匯,這是由于該類詞語(yǔ)單獨(dú)出現(xiàn)的概率較大,Jaccard系數(shù)較低,因此有利于關(guān)聯(lián)詞群之外。
3.3 聚類分析
利用LDA模型對(duì)銷量前600的跑鞋用戶評(píng)論文本進(jìn)行分析,通過(guò)計(jì)算困惑度[38]得到了最佳主題數(shù)為7,最終設(shè)定為Topic =7,α=0.2,β = 0.03,循環(huán)迭代次數(shù)為4 000次,通過(guò)LDAvis得到主題聚類的可視化文檔。
文檔結(jié)果展示了跑鞋消費(fèi)者評(píng)論中7個(gè)主題的分布情況和概率占比,在選中某個(gè)主題的情況下則會(huì)出現(xiàn)該主題下的30個(gè)代表性熱點(diǎn)詞,可用于確定主題內(nèi)容。λ值表示詞語(yǔ)與主題之間的相關(guān)性程度:當(dāng)λ接近于1時(shí),結(jié)果中將顯示在該主題下出現(xiàn)最頻繁的詞語(yǔ),有助于了解用戶在該主題下討論的熱點(diǎn)詞匯;當(dāng)λ接近于0時(shí),結(jié)果中將顯示在該主題下相對(duì)獨(dú)特的詞語(yǔ),可以了解該主題與其他主題的區(qū)別所在。通過(guò)調(diào)節(jié)λ值可以保證每個(gè)主題展現(xiàn)熱點(diǎn)詞的同時(shí),凸顯與其他主題的差異。表3列出了7個(gè)主題下的前10個(gè)特征詞。
通過(guò)對(duì)每類主題熱點(diǎn)詞的反復(fù)對(duì)比篩選,按照熱度排序最終總結(jié)出7個(gè)主題的名稱,分別是外觀細(xì)節(jié)、家庭、功能屬性、性價(jià)比、穿著感受、售后服務(wù)、電商優(yōu)惠。
外觀細(xì)節(jié):消費(fèi)者比較在意跑鞋呈現(xiàn)的整體視覺(jué)效果,包括外觀、款式、色彩、笨重,以及細(xì)節(jié)設(shè)計(jì)包括做工、瑕疵、線頭等。外觀細(xì)節(jié)能夠展現(xiàn)個(gè)人的時(shí)尚品位和風(fēng)格,消費(fèi)者希望通過(guò)穿著漂亮的跑鞋來(lái)展示自己的形象,反映了廣大跑鞋消費(fèi)群體相對(duì)于穿著感受的功能屬性,更加注重跑鞋的外在表征反映的社會(huì)屬性。夏季是跑鞋銷售和穿著的旺季,簡(jiǎn)約的服裝搭配使得消費(fèi)者更加注重跑鞋所呈現(xiàn)的視覺(jué)效果。
家庭:許多消費(fèi)者將跑鞋作為禮物贈(zèng)與家人,由此可見許多跑鞋的消費(fèi)者并非使用者。當(dāng)跑鞋作為禮品贈(zèng)與家人時(shí)有以下特征:首先,跑鞋是一種實(shí)用的禮物,適合喜歡運(yùn)動(dòng)、需要運(yùn)動(dòng)的人士。其次,現(xiàn)代跑鞋不僅具有良好的功能性,還融合了時(shí)尚設(shè)計(jì)。鞋的各種款式、顏色和功能,可以根據(jù)家人的喜好和需求進(jìn)行個(gè)性化選擇。最后,跑鞋產(chǎn)品滿足舒適的要求相比衣服要高很多,會(huì)受到個(gè)人的腳型、腳感及日常運(yùn)動(dòng)狀等諸多因素影響。因此,只有高度熟識(shí)的人才會(huì)為對(duì)方購(gòu)買跑鞋產(chǎn)品。
功能屬性:舒適性是消費(fèi)者最關(guān)注的功能,主要反映在鞋底舒適性和鞋面舒適性。鞋底分中底和外底,輕便、軟和彈性主要是跑鞋中底的屬性,反映了用戶已從跑鞋單一的減震功能,上升到減震與回彈并重的綜合性體驗(yàn),而鞋底輕量化要優(yōu)先于上述中底的功能性設(shè)計(jì)。防滑是用戶最關(guān)注的外底功能屬性,這表明部分跑鞋的使用環(huán)境已從運(yùn)動(dòng)步道擴(kuò)展到了濕滑路面甚至是非鋪裝路面。對(duì)于跑鞋鞋面,透氣性和耐磨性是消費(fèi)者最關(guān)注的功能屬性,也是影響跑鞋舒適度的重要因素。
性價(jià)比:對(duì)于大部分消費(fèi)者而言,跑鞋僅被定義為日常生活用品或運(yùn)動(dòng)裝備,對(duì)于價(jià)格較高的專業(yè)跑鞋,絕大多數(shù)消費(fèi)者可能并不需要或無(wú)法充分發(fā)揮專業(yè)跑鞋的優(yōu)勢(shì)。因此,對(duì)于絕大多數(shù)消費(fèi)者而言,普通的跑鞋已經(jīng)足夠滿足他們的日常生活和一般運(yùn)動(dòng)需求,而專業(yè)的跑鞋則更適合那些追求高性能和專業(yè)水平的少數(shù)人群。另外,以“安踏、李寧、鴻星爾克和361°”為代表的國(guó)產(chǎn)品牌的崛起,極大地豐富了世界跑鞋的中端和平民市場(chǎng),無(wú)論在外觀款式和功能技術(shù)創(chuàng)新方面都讓消費(fèi)者有了更廣泛的選擇。
穿著感受:跑鞋的穿著感受與功能屬性密切相關(guān),舒適感仍然是消費(fèi)者最為關(guān)注的話題。與靜態(tài)試穿相比,消費(fèi)者更加關(guān)注在跑步或行走中跑鞋的腳感,尤其是中底帶來(lái)的推進(jìn)感和回彈感,以及鞋面帶來(lái)的包裹感、跟腳感和透氣感。跑鞋的輕量化設(shè)計(jì)給運(yùn)動(dòng)帶來(lái)的輕松也是消費(fèi)者關(guān)注的重點(diǎn)。
快遞服務(wù):物流發(fā)貨速度被認(rèn)為是消費(fèi)者非常重視的因素,在下單跑鞋之后,消費(fèi)者希望能夠盡快收到他們購(gòu)買的商品。服務(wù)質(zhì)量在消費(fèi)者心中也占有重要地位,消費(fèi)者期望在購(gòu)買跑鞋過(guò)程中得到良好的服務(wù)體驗(yàn),包括售前咨詢、售后支持等。同時(shí),精美的包裝可以給消費(fèi)者帶來(lái)額外的愉悅感,同時(shí)也傳達(dá)了跑鞋的品質(zhì)和價(jià)值。友好、耐心且專業(yè)的客服和賣家上門服務(wù)也是消費(fèi)者相對(duì)比較在意的。
電商優(yōu)惠:跑鞋消費(fèi)者非常重視購(gòu)物節(jié)、促銷活動(dòng)和打折優(yōu)惠?!半p十一”和“6 · 18”是中國(guó)著名的購(gòu)物節(jié),許多消費(fèi)者會(huì)在這些時(shí)間節(jié)點(diǎn)期待能獲得較大的折扣和優(yōu)惠。許多年輕的跑鞋消費(fèi)者追求時(shí)尚和新潮,通常對(duì)新品跑鞋感興趣。贈(zèng)品和包郵作為一種購(gòu)物促銷手段,也會(huì)引起部分消費(fèi)者的關(guān)注。
整體而言,消費(fèi)者在線購(gòu)買跑鞋時(shí)會(huì)重點(diǎn)關(guān)注跑鞋的外觀細(xì)節(jié)和功能屬性,同時(shí)性價(jià)比、快遞服務(wù)和優(yōu)惠策略也是消費(fèi)者重點(diǎn)關(guān)注的內(nèi)容,對(duì)購(gòu)買決策會(huì)產(chǎn)生重要影響。
3.4 情感分析
使用Python中的SnowNLP情感語(yǔ)料庫(kù)將跑鞋用戶評(píng)論數(shù)據(jù)劃分成了積極和消極評(píng)論[39],在此基礎(chǔ)上,利用LDA主題模型對(duì)潛在的主題、主題下的關(guān)鍵詞進(jìn)行數(shù)據(jù)挖掘并確定最優(yōu)主題數(shù),最終生成產(chǎn)品好評(píng)、差評(píng)不同主題的關(guān)鍵詞列表。通過(guò)計(jì)算不同LDA各主題間的平均余弦距離判斷主題相似度,相似度最小時(shí)的主題個(gè)數(shù)為最優(yōu)主題數(shù)[40]。圖10為主題數(shù)2 ~ 10中每個(gè)主題的平均余弦值,確定正面和負(fù)面評(píng)論最優(yōu)主題數(shù)為5和4,最終生成正面和負(fù)面的主題聚類可視化文檔。表4和表5列出了5個(gè)正面主題和4個(gè)負(fù)面主題下前10個(gè)特征詞。
3.4.1 正面評(píng)價(jià)主題分析
消費(fèi)者正面評(píng)價(jià)聚類結(jié)果如表4所示,正面評(píng)價(jià)包括5個(gè)主題。1)外在品質(zhì):大部分消費(fèi)者認(rèn)可市場(chǎng)上的跑鞋在舒適度和外觀要素上的表現(xiàn),尤其是跑鞋實(shí)際尺碼的工藝細(xì)節(jié)。2)實(shí)用功能:消費(fèi)者對(duì)目前跑鞋鞋底的功能表現(xiàn)滿意,包括輕量化、回彈、柔軟和耐磨等,這也和近年來(lái)國(guó)產(chǎn)跑鞋科技進(jìn)步有關(guān)。同時(shí),對(duì)知名品牌跑鞋的認(rèn)可度較高。3) 使用場(chǎng)景:許多跑步愛好者對(duì)目前商場(chǎng)上跑步的運(yùn)動(dòng)表現(xiàn)滿意,部分消費(fèi)者認(rèn)為跑鞋在常規(guī)使用中如通勤或久站體驗(yàn)較好。4)產(chǎn)品服務(wù):消費(fèi)者對(duì)產(chǎn)品的物流速度到貨準(zhǔn)時(shí)性較為滿意,對(duì)產(chǎn)品的包裝質(zhì)量和客服的態(tài)度也較為認(rèn)可。5)產(chǎn)品優(yōu)惠:消費(fèi)者對(duì)“京東”現(xiàn)有跑鞋的價(jià)格和優(yōu)惠政策比較滿意,熱衷于定期推出優(yōu)惠活動(dòng),對(duì)價(jià)格合適、物有所值的跑鞋興趣較高。
3.4.2 負(fù)面評(píng)價(jià)主題分析
由于跑鞋差評(píng)的數(shù)量遠(yuǎn)小于好評(píng),因此主題僅代表少數(shù)消費(fèi)者,負(fù)面評(píng)價(jià)聚類結(jié)果如表5所示。1)穿著感受:少數(shù)消費(fèi)者對(duì)于穿著感受的負(fù)面評(píng)價(jià)主要集中在舒適度和匹配性方面,舒適度不足體現(xiàn)在壓腳、不透氣和磨腳,主要的原因包
括鞋楦造型不合理及鞋面材料舒適度不佳。匹配性弱指消費(fèi)者腳型與鞋型不匹配,造成偏瘦或偏胖和腳趾不適等問(wèn)題,主要原因包括個(gè)體腳型差異及楦型設(shè)計(jì)不合理。2)產(chǎn)品質(zhì)量:部分消費(fèi)者認(rèn)為跑鞋有異味問(wèn)題,主要來(lái)自鞋底的發(fā)泡材料及膠水,開膠的原因是鞋底和鞋幫黏接不牢。跑鞋不耐臟也會(huì)引起消費(fèi)者的不滿。3)產(chǎn)品服務(wù):少數(shù)消費(fèi)者會(huì)因?yàn)榉?wù)態(tài)度、耐心和回復(fù)時(shí)間對(duì)客服不滿,在收貨過(guò)程中會(huì)因?yàn)榘b破損或快遞人員送貨問(wèn)題產(chǎn)生不滿情緒。4)產(chǎn)品宣傳:少數(shù)評(píng)論認(rèn)為產(chǎn)品實(shí)物與宣傳不符,甚至?xí)霈F(xiàn)售賣假貨的行為。
4 結(jié) 語(yǔ)
本文對(duì)“京東商城”銷售前600的跑鞋線上銷售的品牌定位、價(jià)格區(qū)間、產(chǎn)品優(yōu)惠和標(biāo)簽進(jìn)行分析,總結(jié)了跑鞋電商銷售特征,同時(shí)用LDA主題模型對(duì)10萬(wàn)條商品評(píng)論進(jìn)行詞頻共現(xiàn)分析、聚類分析和情感分析,挖掘消費(fèi)者的關(guān)注因素,并針對(duì)相關(guān)問(wèn)題提出合理化建議。
1)國(guó)產(chǎn)跑鞋從入門市場(chǎng)到高端市場(chǎng)具有完整的產(chǎn)品布局,但是由于世界品牌效應(yīng)、技術(shù)積累和用戶口碑,相較于銷量靠前且主打中高端市場(chǎng)的頭部品牌“耐克、阿迪達(dá)斯和亞瑟士”仍有一段距離。銷量排名靠前的跑鞋大多參與滿減和優(yōu)惠券活動(dòng),且在自營(yíng)、門店有售和品質(zhì)認(rèn)證標(biāo)簽占比高于整體水平,銷量高的跑鞋多使用滿減和商品券,自營(yíng)和優(yōu)惠券標(biāo)簽對(duì)跑鞋購(gòu)買具有較顯著的促進(jìn)作用。
2)消費(fèi)者在線上購(gòu)買跑鞋時(shí)主要關(guān)注外觀細(xì)節(jié)、功能屬性、性價(jià)比、穿著感受、服務(wù)優(yōu)惠等方面。大部分消費(fèi)者在上述幾個(gè)方面持滿意態(tài)度,少數(shù)消費(fèi)者對(duì)跑鞋的穿著感受、產(chǎn)品質(zhì)量及服務(wù)宣傳的態(tài)度不佳。
3)在信息透明化的時(shí)代,產(chǎn)品在線評(píng)論成為消費(fèi)者購(gòu)買前了解和對(duì)比商品的重要渠道。因此,跑鞋行業(yè)及相關(guān)企業(yè)需要科學(xué)應(yīng)對(duì)并做出相應(yīng)調(diào)整。首先,相關(guān)跑鞋生產(chǎn)企業(yè)和研究部門要形成用戶需求驅(qū)動(dòng)產(chǎn)品研發(fā)的思維模式,相比一味地宣傳品牌的“黑科技”,深入挖掘網(wǎng)購(gòu)用戶評(píng)論信息對(duì)產(chǎn)品進(jìn)行優(yōu)化十分必要。其次,對(duì)于跑鞋在銷售和使用過(guò)程中出現(xiàn)的產(chǎn)品質(zhì)量及穿著主觀感受不理想等未檢測(cè)出的問(wèn)題,企業(yè)要高度重視,在加強(qiáng)產(chǎn)品質(zhì)量監(jiān)管的同時(shí)要做好消費(fèi)者“最后一公里”服務(wù)。最后,企業(yè)要嚴(yán)把產(chǎn)品服務(wù)和宣傳環(huán)節(jié),建立線上服務(wù)人員服務(wù)標(biāo)準(zhǔn)體系,避免夸大宣傳和價(jià)格大幅波動(dòng),加強(qiáng)與物流人員的溝通與培訓(xùn),為線上消費(fèi)者營(yíng)造良好的購(gòu)物體驗(yàn)。
本文還存在以下不足:第一,由于用戶評(píng)論內(nèi)容里未深入涉及有關(guān)跑鞋功能技術(shù)分析的內(nèi)容,致使聚類結(jié)果中的功能技術(shù)分析指標(biāo)不夠細(xì)化。第二,未探討不同電商平臺(tái)下跑鞋的銷售和評(píng)論特征,具有一定的局限性。第三,由于京東平臺(tái)的信息保護(hù)機(jī)制,未能建立特定消費(fèi)群體和評(píng)論主題之間的關(guān)聯(lián)。未來(lái)可以根據(jù)消費(fèi)者各個(gè)特征開展深入研究,在采集用戶評(píng)論大數(shù)據(jù)的基礎(chǔ)上,通過(guò)對(duì)年齡、地域、職業(yè)等用戶信息的進(jìn)一步挖掘,使評(píng)論主題能夠映射至特定用戶群體,有助于滿足特定消費(fèi)群體的定向研發(fā)和精準(zhǔn)營(yíng)銷的實(shí)施。此外,為了使結(jié)果更具普適價(jià)值,未來(lái)需繼續(xù)增加數(shù)據(jù)量,使模型更好地理解各種主題、領(lǐng)域和語(yǔ)境,從而提高結(jié)果的信度和效度。
參考文獻(xiàn):
[1]沈長(zhǎng)霞,車萬(wàn)留,桂海霞.基于貝葉斯網(wǎng)絡(luò)的電商客戶滿意度影響因素分析:以京東運(yùn)動(dòng)鞋為例[J].數(shù)學(xué)的實(shí)踐與認(rèn)識(shí), 2020,50(23): 285-294.
SHEN C X, CHE W L, GUI H X.Analysis of influencing factors on customer satisfaction of e-commerce based on Bayesian network:Taking Jingdong mall as a example[J].Mathematics in Practice and Theory, 2020, 50(23): 285-294.
[2]向勉,易本順,周丙濤,等.利用慣性傳感器與多模態(tài)網(wǎng)絡(luò)解析跑步參數(shù)[J].武漢大學(xué)學(xué)報(bào)(信息科學(xué)版),2023:10.13203/j.whugis20220229.
XIANG M, YI B S, ZHOU B T, et al.Analyzing of running parameters using IMU and multi-modal networks[J].Geomatics and Information Science of Wuhan University, 2023: 10.13203 / j.whugis20220229.
[3]蔡麗玲,季曉芬,王若瑾,等.國(guó)內(nèi)運(yùn)動(dòng)鞋網(wǎng)絡(luò)社區(qū)用戶創(chuàng)新價(jià)值評(píng)價(jià)研究[J].絲綢, 2020, 57(5): 47-52.
CAI L L, JI X F, WANG R J, et al.Research on user innovation value evaluation of sneaker network community in China[J].Journal of Silk, 2020, 57(5): 47-52.
[4]董紅剛,易劍東,任慧濤.運(yùn)動(dòng)鞋服企業(yè)治理的國(guó)際經(jīng)驗(yàn)借鑒及晉江轉(zhuǎn)型發(fā)展路向[J].武漢體育學(xué)院學(xué)報(bào),2021, 55(10):33-39.
DONG H G, YI J D, REN H T.International experience of governance of sports shoes and clothing enterprise and transformation and development road of Jinjiang [J].Journal of Wuhan Sport University, 2021, 55(10):33-39.
[5]相亮亮,梅齊昌,李建設(shè),等.不同緩沖(能力)跑鞋對(duì)跑者膝、踝關(guān)節(jié)局部動(dòng)態(tài)穩(wěn)定性的影響[J].中國(guó)體育科技,2023, 59(4):84-93.
XIANG L L, MEI Q C, LI J S, et al.Effects of running shoes with different cushioning capacities on the local dynamic stability of runners knee and ankle joints [J].China Sports Science and Technology, 2023, 59(4):84-93.
[6]李秋捷,萬(wàn)祥林,劉卉,等.慢跑鞋前掌屈曲剛度對(duì)男性跑者的跑步經(jīng)濟(jì)性及下肢關(guān)節(jié)功的影響[J].成都體育學(xué)院學(xué)報(bào),2022,48(6):101-106.
LI Q J, WAN X L, LIU H, et al.Effects of forefoot bending stiffness of running shoes on the running economy and joint work of lower extremity in male runners [J].Journal of Chengdu Sport University, 2022, 48(6):101-106.
[7]孫冬,宋楊,全文靜,等.跑鞋抗彎剛度調(diào)整對(duì)下肢生物力學(xué)表現(xiàn)及跑步經(jīng)濟(jì)性的影響研究[J].中國(guó)體育科技,2022, 58 (7):68-75.
SUN D, SONG Y, QUAN W J, et al.Effect of running shoes bending stiffness alteration on lower extremity biomechanical performance and running economy [J].China Sports Science and Technology, 2022, 58(7):68-75.
[8]張燊,崔科東,張希妮,等.后跟著地跑步技術(shù)對(duì)足弓肌肉力量的影響[J].中國(guó)運(yùn)動(dòng)醫(yī)學(xué)雜志,2019,38(11):955-959.
ZHANG S, CUI K D, ZHANG X N, et al.The effects of rear-foot strike running on the muscle strength of the longitudinal arch [J].Chinese Journal of Sports Medicine, 2019, 38(11):955-959.
[9]葉靖怡,陳海榮,宋楊,等.跑鞋縱向抗彎剛度調(diào)整對(duì)青少年下肢生物力學(xué)影響的研究[J].應(yīng)用力學(xué)學(xué)報(bào),2022, 39(2):209-217.
YE J Y, CHEN H R, SONG Y, et al.Effect of running shoes increased longitudinal bending stiffness on lower limb biomechanics of adolescents runners [J].Chinese Journal of Applied Mechanics,2022, 39(2):209-217.
[10]魏書濤.不同鞋幫類型足球鞋對(duì)踝關(guān)節(jié)穩(wěn)定性的影響[J].皮革科學(xué)與工程, 2021, 31(1):69-74.
WEI S T.Football shoes collar types effect on ankle stability [J].Leather Science and Engineering, 2021, 31 (1):69-74.
[11]王家雨,傅鳳琴,謝志浩,等.不同EVA中底氣泡結(jié)構(gòu)對(duì)跑步過(guò)程中下肢生物力學(xué)特征的影響[J].醫(yī)用生物力學(xué),2021, 36(增1): 417.
WANG J Y, FU F Q, XIE Z H, et al.Effects of different EVA midsole bubble structures on lower limb biomechanical characteristics during running [J].Journal of Medical Biomechanics, 2021, 36(S1): 417.
[12]李勇,劉遠(yuǎn)哲.3D打印技術(shù)下的運(yùn)動(dòng)鞋設(shè)計(jì)發(fā)展趨勢(shì)[J].包裝工程, 2018, 39(24): 152-157.
LI Y, LIU Y Z.Development trend of sports shoes design under 3D printing technology[J].Packaging Engineering, 2018, 39 (24):152-157.
[13]弓太生,郭思逸,高倩,等.護(hù)踝抗扭轉(zhuǎn)功能鞋靴的運(yùn)動(dòng)穩(wěn)定性測(cè)試[J].皮革科學(xué)與工程,2022,32(2):88-93.
GONG T S, GUO S Y, GAO Q, et al.Kinematic stability testing of ankle protection and torsion resistance functional footwear [J].Leather Science and Engineering, 2022, 32(2): 88 -93.
[14]湯運(yùn)啟,郭新宇,王勇,等.鞋靴主觀舒適性評(píng)價(jià)方法研究進(jìn)展[J].皮革科學(xué)與工程, 2022, 32(2): 47-53.
TANG Y Q, GUO X Y, WANG Y, et al.Research progress on subjective comfort evaluation methods for footwear [J].Leather Science and Engineering, 2022, 32(2): 47-53.
[15] CHEN X, ZHANG X.Shoe last free-form surface reconstruction technique based on reverse engineering: Advanced research on computer education, simulation and modeling, PT D [Z]//LIN S,HUANG X.International Conference on Advanced Research onComputer Education.Simulation and Modeling, 2021: 176, 396.
[16] BIAN X J, LI X L, et al.A new error analysis and accuracy synthesis method for shoe last machine[J].Sensors & Transducers,2014, 170(5): 256-261.
[17] HINOJO-PEREZ J J, DAVIA-ARACIL M, JIMENO-MORENILLA A, et al.Automation of the shoe last grading process according to international sizing systems [J].The International Journal of Advanced Manufacturing Technology, 2016, 85(1 -4): 455-467.
[18]任懷藝,王伯雄,羅秀芝.基于模糊層次分析的足楦匹配算法在鞋楦定制中的應(yīng)用[J].光學(xué)精密工程, 2014, 22(6): 1677-1685.
REN H Y, WANG B X, LUO X Z.Application of FAHP-based foot-last matching algorithm to customization shoe-last [J].Optical and Precision Engineering, 2014, 22(6): 1677-1685.
[19] SAMBHAV K, TANDON P, DHANDE O S.Computer aided design and development of customized shoe last [J].Computer-Aided Design and Applications, 2011, 8(6): 819-826.
[20] GERMANI M, MANDOLINI M, MENGONI M, et al.Tools for design and validation of shoe lasts for diabetic patients [J].Footwear Science, 2012, 4(3): 221 -241.
[21]羅向東,強(qiáng)威,張?,?女士皮鞋外觀設(shè)計(jì)需求驅(qū)動(dòng)方式建構(gòu)[J].包裝工程, 2024: 10.19554 / j.cnki.1001-3563.2024.02.034.
LUO X D, QIANG W, ZHANG X Y.Constructing a demand-driven approach to ladies leather shoes appearance design [J].Packaging Engineering, 2024: 10.19554 / j.cnki.1001-3563.2024.02.034.
[22]邢曉燕.體育健身驅(qū)動(dòng)下的體育用品消費(fèi):我國(guó)大型城市馬拉松參賽選手跑鞋品牌市場(chǎng)細(xì)分的實(shí)證研究[J].中國(guó)體育科技,2017, 53(1): 27-37.
XING X Y.Sports goods consumption driven by physical fitness:An empirical study on running shoe brand segmentation of runners at a large city marathon in China [J].China Sports Science and Technology, 2017, 53(1): 27-37.
[23]李凌,張瑞林.方法目的鏈在體育消費(fèi)行為領(lǐng)域研究中的應(yīng)用與適用[J].天津體育學(xué)院學(xué)報(bào),2021, 36(1):67-75.
LI L, ZHANG R L.Application of means-end chain theory in the field of sport consumption behavior [J].Journal of Tianjin University of Sports, 2021, 36(1): 67-75.
[24]覃思悅.2022年全球球鞋銷量增長(zhǎng)放緩,但跑鞋產(chǎn)品仍瘋漲[EB/OL].(2023-02-08) [2023-12-11].https: / / finance.sina.com.cn/jjxw/2023-02-08 /doc-imyeyhrw3162832.shtm.
QIN S Y.Global sneaker sales growth slows in 2022, but running shoe products still rise wildly[EB/OL].(2023-02-08) [2023-12-11].https: / / finance.sina.com.cn / jjxw /2023-02-08 / doc-imyeyhrw3162832.shtm.
[25] XIAO Y, LI C D, THURER M, et al.User preference mining based on fine-grained sentiment analysis [J].Journal of Retailing and Consumer Services, 2022, 68 (9): 103013.
[26] PETER D A, LIANG D C.Modeling customer satisfaction through online reviews: A flowsort group decision model under probabilistic linguistic settings [J].Expert Systems with Applications, 2022(195): 116649.
[27]邢云菲,曹高輝,陶然.網(wǎng)絡(luò)用戶在線評(píng)論的主題圖譜構(gòu)建及可視化研究:以酒店用戶評(píng)論為例[J].情報(bào)科學(xué),2021, 39(9):101-109.
XING Y F, CAO G H, TAO R.Research on the construction and visualization of topic mapping of online users online reviews:Taking hotel users reviews as an example [J].Information Science, 2021, 39(9):101-109.
[28]張艷豐,王羽西,彭麗徽,等.基于文本挖掘的在線用戶追加評(píng)論內(nèi)容情報(bào)研究:以京東商城手機(jī)評(píng)論數(shù)據(jù)為例[J].現(xiàn)代情報(bào), 2020, 40(9):96-105.
ZHANG Y F, WANG Y X, PENG L H, et al.Research on information of online users additional comments based on text mining: Taking the mobile phone review data of Jingdong Mall as an example[J].Journal of Modern Information, 2020, 40(9): 96-105.
[29] CHUNJEONG K, YOUNGJOO N.Consumer reviews analysis on cycling pants in online shopping malls using text mining [J].Fashion and Textiles, 2021, 8(1): 1 -21.
[30]劉佳鍇,李敏.基于文本挖掘的蠶絲被在線評(píng)論分析:以京東商城為例[J].絲綢,2023, 60(8):11-20.
LIU J K, LI M.Analysis of online reviews of silk quilt based on text mining: Taking Jingdong Mall as an example [J].Journal of Silk, 2023, 60(8): 11-20.
[31]張皓,吳夢(mèng)潔,陳星宇,等.整合視域下衛(wèi)生服務(wù)“以人為本”的語(yǔ)義解構(gòu)、建構(gòu)與實(shí)踐指引:基于Python爬蟲搜索的文本分析[J].中國(guó)衛(wèi)生政策研究, 2022, 15(12): 9-17.
ZHANG H, WU M J, CHEN X Y, et al.Semantic deconstruction,construction and practical guidance of “ people-oriented ” health service under the integration perspective: A text analysis based on Python crawler search [J].China Journal of Health Policy, 2022,15(12): 9-17.
[32]李春曉,李輝,劉艷箏,等.多彩華夏:大數(shù)據(jù)視角的入境游客體驗(yàn)感知差異深描[J].南開管理評(píng)論,2020, 23(1):28-39.
LI C X, LI H, LIU Y Z, et al.Colorful Huaxia: A deep description of the differences in the perceived experience of inbound tourists from the perspective of big data [J].Nankai Business Review, 2020, 23(1):28-39.
[33]王晨,廖啟明.基于改進(jìn)的LDA模型的文獻(xiàn)主題挖掘與演化趨勢(shì)研究:以個(gè)人隱私信息保護(hù)領(lǐng)域?yàn)槔齕J].情報(bào)科學(xué),2023,41(10):112-120.
WANG C, LIAO Q M.Literature topic mining and evolutionary trend based on improved LDA model:Taking the field of personal privacy information protection as an example [J].InformationScience, 2023, 41(10):112-120.
[34]劉佳,陳敏時(shí),謝懿,等.基于TF-IDF算法的運(yùn)營(yíng)商用戶畫像
分析[J].電信工程技術(shù)與標(biāo)準(zhǔn)化,2023, 36(10):1-5.
LIU J, CHEN M S, XIE Y, et al.Carrier user portrait analysis based on TF-IDF algorithm[J].Telecom Engineering Technics and Standardization, 2023, 36(10):1 -5.
[35]徐選華,黃麗,陳曉紅.基于共詞網(wǎng)絡(luò)的群智知識(shí)挖掘方法:在應(yīng)急決策中應(yīng)用[J].管理科學(xué)學(xué)報(bào),2023, 26(5):121-137.
XU X H, HUANG L, CHEN X H.Collectire intelligence knowledge mining method based on co-word networks:Application in emergency decision making[J].Journal of Management Science in China, 2023, 26(5):121-137.
[36]張吉玉,張均勝.考慮時(shí)序的單篇科技文獻(xiàn)新穎性評(píng)估方法[J].圖書情報(bào)工作, 2022, 66(17):93-105.
ZHANG J Y, ZHANG J S.Novelty evaluation method of single scientific and technical literature considering time series[J].Library and Intelligence Service, 2022, 66(17):93-105.
[37]白嘯天,霍洪峰.基于運(yùn)動(dòng)生物力學(xué)的運(yùn)動(dòng)鞋功能研究進(jìn)展[J].皮革科學(xué)與工程, 2023, 33(5):73-78.
BAI X T, HUO H F.Research Progress on the function of sports shoes based on sports biomechanics [J].Leather Science and Engineering, 2023, 33(5):73-78.
[38] GRIFFITHS T L, MARK S.Finding scientific topics [J].Proceedings of the National Academy of Sciences of the United States of America, 2004, 101(2):5228-5235.
[39]張冬,魏俊斌.情感驅(qū)動(dòng)下主流媒體疫情信息數(shù)據(jù)分析與話語(yǔ)引導(dǎo)策略[J].圖書情報(bào)工作,2021, 65(14):101-108.
ZHANG D, WEI J B.Emotion-driven data analysis of mainstream media epidemic information and discourse guidance strategy [J].Library and Information Service, 2021, 65(14):101-108.
[40]劉兵,鄭承利.基于EMD特征提取的高頻面板數(shù)據(jù)自適應(yīng)聚類方法[J].統(tǒng)計(jì)與決策,2022,38(10):16-20.
LIU B, ZHENG C L.Adaptive clustering method for high-frequency panel data based on EMD feature extraction[J].Statistics & Decision, 2022, 38(10):16-20.
User evaluation and sentiment analysis of running shoes based on text mining
LUO Xiangdonga b QIANG Weia b ZHANG Xiyingb WU Menga b
a.Shoe and Clothing Big Data and Standardization Research Center b.School of Design & ArtShaanxi University of Science and Technology, Xi' an 710021, China)
Abstract With the consumption pattern of online shopping becoming increasingly common the way for consumers to obtain product evaluation information has changed from word of mouth in the past to online reviews.More than 70% of consumers refer to e-commerce platform product evaluation information when shopping online and more than 90% of enterprises believe that reviews will play a decisive role in future consumer behavior.Unlike subjective survey data product online reviews are not subject to the subjective judgment of researchers during the survey process and can reflect the real user experience and emotional tendency.Therefore it is important to study the ways in which user evaluation big data drive product design research and development such as accelerating the shift in product design promoting marketing and improving user satisfaction.Current research on running shoes mainly focuses on product function development shoe last redesign and market demand classification.At present no scholars have explored the factors that consumers pay attention to when buying and using running shoes from the perspective of e-commerce big data.Understanding the consumption trend and consumer preference of running shoes is of great significance for industrial development and marketing strategy formulation.
To mine consumers' attention information in their buying running shoes online, firstly, Requests library and Pymysql library in Python 3.11 were used to collect the sales feature data of top 600 running shoes sold on Jingdong Mall and 100 000 user comments.Secondly text preprocessing of online review text was performed by using the precise mode in the Chinese word segmentation system of Jieba Database.Thirdly Origin 2021 was used to analyze the basic information of the sales characteristics of running shoes.Fourthly LDA model and Gibbs sampling were used to cluster review texts to explore the distribution of product feature words under different themes.Finally SnowNLP was used to score the text for emotion so as to obtain positive and negative labels and topic analysis was performed based on emotion labels to compare the difference in topic distribution of positive and negative comments.From the perspective of big data analysis this paper used LDA model to conduct text mining on 100 000 online reviews of running shoes conduct word frequency co-occurrence analysis topic clustering and sentiment analysis on product review data analyze the causes of problems from the dimensions of brand technology and after-sales service and put forward relevant suggestions.Domestic running shoes have a complete product layout from the entry market to the high-end market but due to the world brand effect technology accumulation and user reputation there is still a long way to go compared with the top brands in sales and focusing on the mid-to-high-end market.Most of the running shoes with top sales ranking participate in discount and coupon activities and the proportion of self-operated store sales and quality certification labels is higher than the overall level while self-operated and coupon labels have a significant role in promoting the purchase of running shoes.When consumers buy running shoes online they mainly pay attention to the appearance details functional attributes cost performance wearing feelings service concessions and so on.A small number of consumers have a poor attitude towards the wearing experience product quality and service promotion of running shoes.
In the future in-depth research can be carried out according to various characteristics of consumers.On the basis of collecting big data of user comments it is necessary to further mine user information such as age region and occupation so that the comment topic can be mapped to specific user groups which is helpful to meet the targeted research and development of specific consumer groups and the implementation of precision marketing.In addition to make the results more universally valuable it is necessary to continue to increase the amount of data in the future to make the model better understand the various topics domains and contexts so as to improve the reliability and validity of the results.
Key words running shoes text mining LDA model cluster analysis sentiment analysis