文/王扶東 劉曦冉 孫增耀(東華大學(xué)旭日工商管理學(xué)院)
隨著經(jīng)濟(jì)的飛速發(fā)展和人們生活水平的不斷提高,用戶不再只是單純的重視基于功能特征的理性需求,而是逐漸更加在意基于使用體驗(yàn)的感性需求。因此對于企業(yè)而言,充分考慮用戶對產(chǎn)品的情感訴求,深入挖掘用戶的感性需求就變得至關(guān)重要。感性體現(xiàn)在當(dāng)消費(fèi)者面對產(chǎn)品時,會被產(chǎn)品的造型、顏色、觸感等打動,引起心理和生理上的反應(yīng),在這個背景下,感性工學(xué)概念應(yīng)運(yùn)而生[1]。利用感性工學(xué),可將人們這些模糊不明的感性需求及意象轉(zhuǎn)化為產(chǎn)品的設(shè)計(jì)要素,在產(chǎn)品設(shè)計(jì)等領(lǐng)域得到廣泛應(yīng)用。
目前,挖掘用戶感性需求的方法,主要有傳統(tǒng)感性工學(xué)和結(jié)合在線評論的感性工學(xué)。在傳統(tǒng)感性工學(xué)中,不少學(xué)者進(jìn)行了將隱性的用戶情感外化于顯性的產(chǎn)品特征的研究。林晨曄利用語義差異法定量地研究了用戶關(guān)于辦公文具的色彩偏好[2]。王雪潔和肖旺群利用問卷調(diào)查法收集感性意向詞匯和用戶對不同工業(yè)機(jī)器人外形組合的評價[3]。田正清等將Kano模型與感性工學(xué)相結(jié)合,通過主成分分析結(jié)合多重線性回歸探究了用戶的感性需求與產(chǎn)品造型設(shè)計(jì)之間的關(guān)系[4]。王年文等人利用主成分分析等方法,對用戶的感性需求偏好進(jìn)行挖掘,并研究了用戶感性情感與產(chǎn)品設(shè)計(jì)要素的映射關(guān)系[5,6]。這類研究積累了一批質(zhì)量較優(yōu)且高度領(lǐng)域化的感性情感詞。然而,用戶感性需求是多樣且動態(tài)變化的,如果簡單依據(jù)現(xiàn)有研究積累的領(lǐng)域詞匯,結(jié)果可能會產(chǎn)生偏差。因此,部分學(xué)者考慮采用結(jié)合在線評論的感性工學(xué)方法,即以在線評論為數(shù)據(jù)源,進(jìn)行用戶感性需求的挖掘。Hsiao等利用詞性標(biāo)注和N元統(tǒng)計(jì)語言模型抽取感性情感詞和產(chǎn)品特征詞,分析兩者關(guān)系,以協(xié)助跨境物流服務(wù)的改進(jìn)[7]。賈丹萍等以產(chǎn)品評論為語料,利用深度學(xué)習(xí)的方法擴(kuò)充生成領(lǐng)域用戶感性情感詞典和產(chǎn)品特征詞表,并進(jìn)行用戶情感分析上的細(xì)化和量化[8]。Wang等利用WordNet詞表生成了通用感性情感詞典,并將之用于挖掘玩具產(chǎn)品評論中的用戶需求[1]。劉征宏等通過構(gòu)建RKE模型獲得感性詞匯,并結(jié)合用戶需求感性值等匹配用戶需求和設(shè)計(jì)方案[9]。李少波等以產(chǎn)品評論數(shù)據(jù)和產(chǎn)品參數(shù)數(shù)據(jù)作為語料,抽取用戶感性詞,同時,利用詞聚類方法計(jì)算感性評價值并構(gòu)建了映射模型[10]。
從以上的相關(guān)研究成果可以看出,目前相關(guān)學(xué)者已經(jīng)在結(jié)合在線評論的感性工學(xué)研究中取得了一定的成果,但是在感性情感種子詞的選取中,大多學(xué)者運(yùn)用通用詞典或者依賴于以往文獻(xiàn),較少學(xué)者考慮了從在線評論中挖掘感性情感種子詞。
本文的研究內(nèi)容是借助感性工學(xué)的思想,通過在線評論挖掘產(chǎn)品標(biāo)準(zhǔn)的感性需求挖掘。利用LDA主題模型挖掘在線評論,確定基本產(chǎn)品特征詞詞典,利用依存句法分析提取在線評論中的關(guān)鍵意見,通過計(jì)算語義相似度將關(guān)鍵意見中的名詞映射擴(kuò)充,得到完備的產(chǎn)品特征詞詞典。采用TextRank方法提取每個產(chǎn)品特征的關(guān)鍵感性情感即感性情感種子詞。最后為了更方便地描述感性需求,將產(chǎn)品特征與感性情感種子詞結(jié)合得到標(biāo)準(zhǔn)感性需求描述。研究框架如圖1所示。
圖1 論文研究框架
產(chǎn)品特征是用戶感性情感的客體,本文采用LDA主題模型對評論文本進(jìn)行主題挖掘,得到用戶評論中所提及的主要產(chǎn)品特征。固有的屬性體系可能會遺漏掉決策者需要的事物特征,LDA可以搜索出隱含的主題分布信息,適用于挖掘大量在線評論文本。本文通過LDA模型進(jìn)行主題提取,確定文本與主題的分布以及文本與詞語的分布,得到主題和詞語分布,找出每個主題下概率較高的詞語,通過計(jì)算一致性確定最優(yōu)主題數(shù)量,將得到的每個主題定義為產(chǎn)品特征,每個主題下的概率較高的詞語作為產(chǎn)品特征對應(yīng)的產(chǎn)品特征詞,構(gòu)造基礎(chǔ)的產(chǎn)品特征詞詞典。
然而,LDA提取的基礎(chǔ)產(chǎn)品特征詞詞典并不能覆蓋評論中所有的產(chǎn)品特征詞,需要根據(jù)在線評論搜集未被基礎(chǔ)產(chǎn)品特征詞詞典覆蓋的產(chǎn)品特征詞。感性情感詞的表達(dá)總是針對某一產(chǎn)品特征的,因此在線評論一般是由產(chǎn)品特征和產(chǎn)品特征的感性情感詞構(gòu)成,并且在句法上存在特定的語法搭配關(guān)系,比如對某款手機(jī)評價 “這部手機(jī)外觀好看”中“外觀好看”構(gòu)成主謂關(guān)系。因此本文利用依存句法分析每條在線評論中并輸出詞語的詞性和語法關(guān)系,最后根據(jù)提取規(guī)則獲得在線評論的關(guān)鍵意見,得到所有潛在的產(chǎn)品特征詞及其對應(yīng)的感性情感詞。其次,利用word2vec算法計(jì)算所有關(guān)鍵意見中的潛在產(chǎn)品特征詞分別,與每個基礎(chǔ)產(chǎn)品特征詞之間的余弦相似度,并根據(jù)語義閾值將語義相近的潛在特征詞映射到對應(yīng)的基本產(chǎn)品特征詞詞典中,擴(kuò)充得到完備的產(chǎn)品特征詞詞典。
用戶關(guān)于某一產(chǎn)品的感性需求一般指用戶對于產(chǎn)品特征的觀點(diǎn),會通過一系列感性情感詞表達(dá)出來。感性情感詞是用戶感性需求的一部分,然而感性情感詞的描述具有口語化、多樣化、相似性強(qiáng)等特點(diǎn),并且用戶對于一個產(chǎn)品特征可能會產(chǎn)生多種類型的感性情感,因此本文對每個產(chǎn)品特征的關(guān)鍵評價意見進(jìn)行關(guān)鍵感性情感詞提取,能夠快速提取在線評論種產(chǎn)品特征對應(yīng)的關(guān)鍵感性情感,并得到感性情感詞的標(biāo)準(zhǔn)化描述,為后續(xù)準(zhǔn)確描述用戶感性需求奠定基礎(chǔ)。
在本研究中,在線評論量相對較大、領(lǐng)域較為集中,因此本研究采用無監(jiān)督關(guān)鍵詞提取算法進(jìn)行感性種子詞的提取。由于本研究涉及的在線評論普遍偏短、文檔信息復(fù)雜,因此本文研究采用基于圖的TextRank算法提取關(guān)鍵感性情感詞[11],并通過人工篩選得出每個產(chǎn)品特征的感性情感種子詞。TextRank算法公式為:
獲取并篩選得到每個產(chǎn)品特征的感性情感種子詞之后,將產(chǎn)品特征與其對應(yīng)的感性情感種子詞結(jié)合,得到最終的標(biāo)準(zhǔn)感性需求描述。
京東是中國最著名的電子商務(wù)平臺之一,其數(shù)碼產(chǎn)品門類豐富,因此本文選取京東電子商務(wù)平臺中手機(jī)評論為研究對象,通過網(wǎng)絡(luò)爬蟲,獲得38000余條用戶在線評論,并對文本進(jìn)行預(yù)處理,刪除無效評論、字符小于10的評論等,最終得到34000余條在線評論。
采用LDA主題模型進(jìn)行訓(xùn)練,計(jì)算各個主題數(shù)下的一致性,得到效果最佳的主題數(shù)為7,人為歸納出手機(jī)的產(chǎn)品特征,然后通過依存句法分析對在線評論進(jìn)行提取,得到每條在線評論中的關(guān)鍵意見,即名詞形容詞對。其中名詞為潛在的產(chǎn)品特征詞,對關(guān)鍵意見中的名詞進(jìn)行相似度計(jì)算,并設(shè)定語義閾值p=0.6,擴(kuò)充得到產(chǎn)品特征詞詞典,如表1所示。
表1 產(chǎn)品特征詞詞典示例
提取同一產(chǎn)品特征的關(guān)鍵意見,然后通過TextRank算法對每個產(chǎn)品特征的在線評論關(guān)鍵意見分析篩選得到感性情感種子詞,將產(chǎn)品特征與其對應(yīng)的感性情感種子詞結(jié)合得到最終的標(biāo)準(zhǔn)感性需求描述,即:價格-便宜、電池-耐用、內(nèi)存-流暢、功能-清晰、售后-快速、售后-耐心、外觀-漂亮、外觀-輕薄、網(wǎng)絡(luò)-順暢。
本文在感性工學(xué)的視角下提出一種挖掘用戶感性需求的方法。該方法利用LDA主題模型獲取基礎(chǔ)產(chǎn)品特征詞詞典,并與word2vec算法相結(jié)合,擴(kuò)充得到產(chǎn)品特征詞詞典,利用TextRank算法獲取每個產(chǎn)品特征的感性情感種子詞,以實(shí)現(xiàn)用戶感性需求的標(biāo)準(zhǔn)化描述。最后本文通過實(shí)例分析驗(yàn)證了模型的可行性。從理論上看,本文提出了一種獲取標(biāo)準(zhǔn)感性需求的方法,這能夠幫助產(chǎn)品設(shè)計(jì)者更有針對性地進(jìn)行產(chǎn)品優(yōu)化,并輔助企業(yè)制定更為合理的營銷策略,真正實(shí)現(xiàn)以用戶為中心的產(chǎn)品設(shè)計(jì)與服務(wù)。
然而,本文也存在一定局限。本文側(cè)重于前期評論者意見的表達(dá),可以進(jìn)一步考慮引入kano模型識別感性需求的類型,因?yàn)槊總€需求的類型不同,他們的重要度也各不相同,需求類型決定他們的改進(jìn)迫切程度,以此形成更為全面準(zhǔn)確的用戶感性需求方案。