申 彥,劉春華
(1.江蘇大學(xué) 信息管理與信息系統(tǒng)系,江蘇 鎮(zhèn)江 212013;2.江蘇大學(xué) 計算機科學(xué)與通信工程學(xué)院,江蘇 鎮(zhèn)江 212013)
隨著社會的快速發(fā)展與技術(shù)的不斷進步,產(chǎn)品迭代更新周期越來越短,用戶需求也在快速發(fā)生變化。企業(yè)要想在不斷變化的市場中占據(jù)優(yōu)勢,就必須深刻理解和把握用戶的需求,并將其作為產(chǎn)品改進和提升的依據(jù),快速響應(yīng)動態(tài)變化的用戶需求。
互聯(lián)網(wǎng)時代的到來,催生了大量的社交平臺。為了聚焦品牌,維護客戶關(guān)系管理,企業(yè)紛紛創(chuàng)建了自身品牌專屬的社交平臺即在線品牌社區(qū)。從在線品牌社區(qū)中的海量用戶及其評論信息中快速捕獲用戶關(guān)鍵需求成為了企業(yè)新的挑戰(zhàn)與機遇。
KANO模型是根據(jù)馬斯洛需求層次理論,研究需求與滿意度的經(jīng)典模型,然而其需求挖掘過程融入了過多調(diào)查人員的主觀性[1-2]。在線品牌社區(qū)中的海量評論是用戶關(guān)切的重要表達,已成為用戶關(guān)鍵需求獲取的重要渠道,彌補了KANO模型主觀性強的不足。因此,該文從“雙關(guān)鍵性”即用戶的關(guān)鍵性和需求的關(guān)鍵性雙角度出發(fā),提出了一種基于在線品牌社區(qū)意見領(lǐng)袖的用戶關(guān)鍵需求挖掘方法(Users’ Key Demands Mining Based on the Opinion Leaders in Online Band Community),簡稱KEY-DEMANDS-OL,快速捕獲用戶關(guān)鍵需求,其主要貢獻如下:
(1)克服KANO模型主觀性較強的不足,利用客觀評論大數(shù)據(jù)獲取用戶需求。
(2)構(gòu)建了在線品牌社區(qū)意見領(lǐng)袖識別指標體系,通過意見領(lǐng)袖評論大數(shù)據(jù)獲取用戶關(guān)鍵需求。
(3)在貝葉斯情感極性分類時考慮了程度副詞的語義,進一步精確了用戶評論情感極性的分類。
現(xiàn)有用戶需求挖掘方法可依據(jù)是否考慮了需求類別劃分為兩類[3]。
未考慮需求類別的用戶需求挖掘方法一般會將關(guān)注度高、情感程度低的產(chǎn)品特征直接作為用戶需求。李賀等[4]對在線手機評論進行評論主題及產(chǎn)品特征挖掘,有效識別了用戶需求要素。吳東勝等[5]結(jié)合觀點值和關(guān)注值構(gòu)建了產(chǎn)品的需求挖掘模型。紀雪等[6]則根據(jù)產(chǎn)品屬性的平均滿意程度來輔助確定新產(chǎn)品的開發(fā)需求。鄧昭等[7]依據(jù)關(guān)鍵詞的權(quán)重排序來輔助汽車儀表盤的設(shè)計。此外,張國方等[8]使用BERT模型對汽車之家在線口碑進行了情感分析,挖掘出了用戶的需求。
考慮了需求類別的用戶需求挖掘方法是將各產(chǎn)品特征的情感值與KANO模型中的各需求類型進行匹配,分類別挖掘用戶需求。白濤等[9]提出了一種利用模糊KANO模型來進行用戶需求分類和重要性統(tǒng)計的方法,并驗證了方法有效性。Wu等[10]利用改進的模糊KANO問卷對用戶需求進行了優(yōu)先級排序。胡東方等[11]提出了基于KANO的工程特征映射模型和基于人工免疫系統(tǒng)的產(chǎn)品設(shè)計模型,設(shè)計滿足顧客需求的產(chǎn)品方案。徐海麗等[12]利用文本挖掘,建立屬性情感值與KANO模型的聯(lián)系,獲得用戶的需求類別。Shwetank等[13]將KANO模型和QFD方法整合,對用戶需求進行了分類。
通過梳理可發(fā)現(xiàn),大多數(shù)研究仍采用的是主觀性較強的KANO問卷,亟需研究出一種能夠自動整合用戶生成內(nèi)容和KANO模型進行需求分類的高效用戶需求挖掘方法,為企業(yè)提供決策支持。
在數(shù)據(jù)源方面,KEY-DEMANDS-OL沒有使用主觀性較強的KANO問卷,而選擇了在線品牌社區(qū)的海量用戶評論;在初始改進率方面,KEY-DEMANDS-OL在考慮情感極性的同時,增加了情感程度,豐富了需求分類語義,具體步驟如下所示。
2.1.1 識別指標體系構(gòu)建
借鑒原欣偉等[14]、Li Y Y等[15]、祝琳琳等[16]的研究,經(jīng)過對當(dāng)前在線品牌社區(qū)特征的分析,從用戶的行為特征和內(nèi)容特征兩個角度,KEY-DEMANDS-OL最終確立了5項一級指標和14項二級指標,具體如表1所示。
表1 意見領(lǐng)袖識別指標
2.1.2 意見領(lǐng)袖識別方法
(1)基于熵權(quán)法的指標權(quán)重確定。
假設(shè)被評價對象如用戶共M個,其中每個被評價對象的評價指標共有N個,則指標數(shù)據(jù)集可以用矩陣L表示,其中L=(L1,L2,…,Lm,…,LM),每個被評價對象可以表示為Lm=(lm1,lm2,…,lmn,…,lmN)。其中m=1,2,…,M,n=1,2,…,N。
(a)對數(shù)據(jù)進行標準化處理,如式1。
(1)
(b)分別對各指標下各個被評價主體指標值的占比pmn進行計算,如式2所示。
(2)
利用式3和式4計算第n個指標的熵值Hn。p表示指標的信息熵系數(shù)。
(3)
(4)
(c)計算得出第n個指標的熵權(quán)值,如式5。
(5)
其中,ω(n)表示第n個指標的權(quán)重系數(shù)。n個指標的權(quán)重滿足式6。
(6)
(2)基于灰色關(guān)聯(lián)分析的意見領(lǐng)袖影響力計算。
設(shè)X0表示意見領(lǐng)袖代表的理想指標序列,為參考序列,Xi表示用戶的實際指標數(shù)列:
(a)對參考序列X0和比較序列Xi進行確定。設(shè)原始數(shù)據(jù)集合X如式7所示。
(7)
其中,m為用戶總數(shù),n為指標總數(shù)。參考序列為X0=(X01,X02,…,X0j,…,X0n),比較序列為Xi=(Xi1,Xi2,…,Xij,…,Xin),i=1,2,…,m;j=1,2,…,n。
(b)原始數(shù)據(jù)集進行無量綱標準化處理,如式1所示。得到的標準化后的數(shù)據(jù)集合X'如式8所示。
(8)
(c)根據(jù)標準化后的指標集合和參考序列X0進行絕對差值計算,如式9所示。
(9)
(d)對灰色關(guān)聯(lián)系數(shù)進行計算,如式10所示。
(10)
(e)計算各個指標的加權(quán)灰色關(guān)聯(lián)度。用到灰色關(guān)聯(lián)度將分散的灰色關(guān)聯(lián)系數(shù)ξij綜合到一個數(shù)值上以便比較。具體計算如式11所示。
(11)
(12)
其中,ω(j)表示第j個指標的權(quán)重,指標的權(quán)重和滿足式12。
根據(jù)熵權(quán)法和灰色關(guān)聯(lián)分析法計算每個用戶的灰色關(guān)聯(lián)度,確定用戶影響力,識別出意見領(lǐng)袖。
2.2.1 用戶需求特征提取
評論中詞語的詞性和詞語的頻率決定了該詞能否成為關(guān)鍵詞。此外,名詞和動詞更能表達句子的核心含義,應(yīng)作為核心關(guān)鍵詞;副詞表示程度,可用于情感程度的計算。因此,詞頻統(tǒng)計以及詞性識別是根據(jù)用戶評論挖掘用戶需求的關(guān)鍵。
在識別在線品牌社區(qū)意見領(lǐng)袖的基礎(chǔ)上,對其發(fā)表的評論進行詞頻的統(tǒng)計與詞性的識別。保留其中的名詞n、動詞v以及副詞adv并且統(tǒng)計其詞頻,代表該評論的核心關(guān)鍵,作為意見領(lǐng)袖代表的需求特征。經(jīng)過處理的意見領(lǐng)袖的評論輸入情感分析模塊,進行基于貝葉斯的需求滿足度計算。
2.2.2 基于貝葉斯的需求滿足度計算
用戶的評論實際上反映了用戶對產(chǎn)品需求的滿足程度,因此,用戶的實際需求可以通過對用戶評論的分析來挖掘,用戶的需求滿足度也可通過對評論的情感極性判斷和情感程度的計算獲得。詳細計算過程如下:
(1)基于貝葉斯的需求極性計算。
采用貝葉斯模型判斷極性,具體的計算方法如下:
根據(jù)全概率公式進一步化簡上式可得:
(13)
(2)情感程度計算。
采用哈工大的情感程度詞表,依據(jù)副詞表達的情感強烈程度,將情感程度劃分成5個等級,詳細內(nèi)容如表2所示。在對意見領(lǐng)袖評論的情感程度進行計算時,依據(jù)其需求特征提取時保留的副詞所對應(yīng)的程度等級對滿足度進行加權(quán),詳細計算過程如式14所示。
表2 情感程度量化
(14)
(15)
2.2.3 需求分類
KANO模型將需求分為了期望型、魅力型、基本型、無關(guān)型和反向型五類。當(dāng)前在實際的生產(chǎn)運營過程中通常只考慮用戶的期望型需求、魅力型需求、基本型需求和無關(guān)型需求四種[19-20]。
所提KEY-DEMANDS-OL方法在傳統(tǒng)用戶需求分類挖掘方法的基礎(chǔ)上進行了改進,沒有利用主觀設(shè)計的調(diào)查問卷,而是利用在線品牌社區(qū)中海量的用戶評論數(shù)據(jù),識別代表性用戶即意見領(lǐng)袖,利用算法自動整合意見領(lǐng)袖的評論和KANO模型。此外,修正了用戶需求的初始改進率,增加考慮了情感程度,對用戶關(guān)鍵需求進行自動化的分類挖掘,詳細的計算過程如下:
(16)
(17)
(18)
(19)
(20)
(21)
(22)
最后,計算用戶需求特征fk的重要性Ifk,詳細的計算公式如下:
(23)
至此,可按計算所得的用戶需求特征的重要性排序Ifk獲得用戶關(guān)鍵需求。
采用八爪魚對華為在線品牌社區(qū)——花粉俱樂部中的華為Mate40板塊進行數(shù)據(jù)采集。經(jīng)過去除無效信息、去除重復(fù)信息等預(yù)處理后,最終得到包含1 000個用戶的22 572條評論與討論信息。KEY-DEMANDS-OL算法采用Python實現(xiàn)。
3.2.1 意見領(lǐng)袖識別結(jié)果
指標權(quán)重系數(shù)、關(guān)聯(lián)系數(shù)和意見領(lǐng)袖識別結(jié)果如表3~表5所示。實驗中,參考文獻[19-20],并依據(jù)帕累托法則,將影響力排名前20%的用戶作為意見領(lǐng)袖。
表3 指標權(quán)重系數(shù)
表4 指標相關(guān)系數(shù)
表5 意見領(lǐng)袖識別結(jié)果(Top10)
3.2.2 用戶關(guān)鍵需求分析
該步驟的數(shù)據(jù)來自于意見領(lǐng)袖的評論和討論信息。經(jīng)過詞頻統(tǒng)計、詞性分析與詞語相似度檢驗,結(jié)合在線品牌社區(qū)評論組織結(jié)構(gòu)及分類得到的用戶需求特征如表6所示。
表6 用戶需求特征
通過對情感極性以及基于貝葉斯的需求滿足程度的計算,結(jié)合KANO模型確定的用戶需求類別和重要性排列順序如圖1和表7所示。
圖1 關(guān)鍵需求分類結(jié)果
表7 用戶關(guān)鍵需求排序結(jié)果
從表7可以看出,分析得到的需求排序結(jié)果為:“外觀”“價格”“娛樂”“內(nèi)存”“拍照”“電池”“屏幕”“系統(tǒng)”“安全”“配件”“網(wǎng)絡(luò)通訊”。結(jié)合KANO模型,從圖1可知,在11個用戶需求項中,魅力型需求一共有3個,包括“外觀”“價格”“娛樂”;期望型需求2個,包括“拍照”以及“內(nèi)存”;基本型需求一共有6個,依次為“電池”“屏幕”“系統(tǒng)”“安全”“配件”和“網(wǎng)絡(luò)通訊”。根據(jù)表7中的用戶需求重要性排序及KANO模型可知,在進行產(chǎn)品改進時的先后順序依次應(yīng)為:“電池”“屏幕”“系統(tǒng)”“安全”“配件”“網(wǎng)絡(luò)通訊”“拍照” “內(nèi)存”“外觀”“價格”“娛樂”。
KEY-DEMANDS-OL捕獲的用戶關(guān)鍵需求對企業(yè)優(yōu)化產(chǎn)品具有重要的啟示與指導(dǎo)。華為在推出Mate40時,提出了該款手機具有六大優(yōu)勢即非凡性能、非凡設(shè)計、非凡影像、非凡快充、非凡體驗和非凡安全。針對此產(chǎn)品的基于在線品牌社區(qū)意見領(lǐng)袖的用戶關(guān)鍵需求挖掘結(jié)果的啟示及建議如下。
(1)魅力型需求包含了“外觀”“價格”和“娛樂”。這說明用戶對該款手機在這些方面的表現(xiàn)感到非常滿意,符合Mate40手機預(yù)設(shè)。魅力型需求是進一步吸引用戶,提升用戶滿意度和忠誠度的關(guān)鍵,企業(yè)在資源允許的條件下,應(yīng)全力滿足用戶的魅力型需求,提高品牌競爭力。
(2)用戶的期望型需求包含了“拍照”和“內(nèi)存”。這說明了“拍照”盡管是該款手機的賣點之一,但很多用戶在拍照時對相應(yīng)的拍攝功能并不了解,沒有拍攝出應(yīng)有的出色效果,造成了很多用戶的滿意度較低,使得該特征成為了用戶的期望型需求。此外,用戶期待非凡的體驗,需要手機大容量內(nèi)存的支持,但當(dāng)前產(chǎn)品內(nèi)存提供仍顯得不足,“內(nèi)存”亦是期望型需求之一。期望型需求是用戶需求的“癢處”,企業(yè)下一步急需對“拍照”這一功能加入新手指導(dǎo)模塊或者在拍攝過程中給與更多快捷方式的支持。同時,相比競品,進一步增大手機內(nèi)存,促進其轉(zhuǎn)化為魅力型需求,提升用戶的滿意度。
(3)用戶的基本型需求包含了“電池”“屏幕”“系統(tǒng)”“安全”“配件”和“網(wǎng)絡(luò)通訊”。這說明了對于該款手機提出的非凡安全和非凡快充兩大亮點所對應(yīng)的“安全”和“電池”兩個特征,并沒有讓用戶滿意,成為了基本型需求。其主要原因是該款手機的安全模式雖功能強大,但使用繁瑣。電池雖支持快充,性能優(yōu)異但充電時發(fā)熱嚴重。此外,該款手機雖然采用了好看的瀑布屏設(shè)計、啟用最新的EMUI系統(tǒng)、贈品較多、支持5G信號,但也存在著屏幕綠屏嚴重、系統(tǒng)更新慢、贈品領(lǐng)取扣費和WIFI信號不穩(wěn)定的問題,使得“屏幕”“系統(tǒng)”“配件”和“網(wǎng)絡(luò)通訊”四個特征成為了用戶的基本型需求?;拘托枨笫怯脩粜枨蟮摹巴袋c”,當(dāng)需求被滿足時,用戶不會感到滿意,但當(dāng)不被滿足時,用戶會很不滿意。因此,企業(yè)在追求極致功能的同時,也要時刻關(guān)注用戶的基本型需求,針對其不滿意點不斷進行產(chǎn)品優(yōu)化和改進,促使其向期望型需求進行轉(zhuǎn)化。
對比KEY-DEMANDS-OL和挖掘所有用戶信息的傳統(tǒng)方法的運行效率,記錄下兩種方法從載入數(shù)據(jù)到分析完成的時間,共10次,計算其平均值。因算法執(zhí)行的絕對時間受計算機CPU及內(nèi)存等性能參數(shù)影響,不同設(shè)備執(zhí)行時間并不一致,為了更好體現(xiàn)所提方法優(yōu)勢,同時給出了本次實驗不同方法運行時間的相對比值以及絕對值,如圖2所示。
圖2 運行時間對比
為驗證基于在線品牌社區(qū)意見領(lǐng)袖的用戶關(guān)鍵需求挖掘方法(KEY-DEMANDS-OL)的有效性,與挖掘所有用戶評論信息的傳統(tǒng)方法進行了對比分析,如表8所示。
表8 與傳統(tǒng)方法的對比分析
從表8中可以看出,在基于所有用戶評論挖掘的用戶需求重要性排名中,僅有“內(nèi)存”“拍照”“娛樂”和“價格”4個需求與基于意見領(lǐng)袖挖掘的用戶需求重要性排序有所差異,但相差不超過1。而其余7個需求的重要性排名與基于意見領(lǐng)袖挖掘的需求重要性排名相同。實例分析的結(jié)果再次驗證了帕累托法則,即約20%的意見領(lǐng)袖代表了約80%的用戶關(guān)鍵需求,可通過意見領(lǐng)袖的識別,捕獲用戶關(guān)鍵需求。更為重要的是,KEY-DEMANDS-OL方法在進行需求挖掘時所需處理的數(shù)據(jù)量大幅降低,提高了用戶需求挖掘的時效性,且可以幫助企業(yè)從紛繁復(fù)雜,無代表性的海量用戶需求中解脫出來,通過意見領(lǐng)袖的代表性,聚焦用戶的關(guān)鍵需求,以精準優(yōu)化產(chǎn)品。例如,在挖掘所有用戶評論獲取的前50大需求中,有諸如“首發(fā)處理器”“多用戶”“奢華”等長尾小眾需求。當(dāng)然,小眾需求并不是不重要,而是主流關(guān)鍵需求須首先滿足。在這個前提之下,再在后續(xù)產(chǎn)品或者特色產(chǎn)品中考慮小眾需求。而KEY-DEMANDS-OL方法僅挖掘獲取意見領(lǐng)袖代表的主流關(guān)鍵需求,是當(dāng)下產(chǎn)品要盡快解決的問題以及須改進的地方,因此能更加聚焦,快速發(fā)現(xiàn)用戶關(guān)鍵需求。
由實驗結(jié)果可知,KEY-DEMANDS-OL方法僅需分析約20%的意見領(lǐng)袖的信息,便可發(fā)現(xiàn)當(dāng)下用戶的主流需求,大幅提高了用戶關(guān)鍵需求挖掘的執(zhí)行效率,更加適合在當(dāng)前產(chǎn)品迭代更新飛快、用戶需求多變的情況下對用戶關(guān)鍵需求進行快速追蹤。
從意見領(lǐng)袖和用戶關(guān)鍵需求著手,采用熵權(quán)法和灰色關(guān)聯(lián)分析法對意見領(lǐng)袖進行了識別,進而采用文本挖掘、情感分析以及KANO模型對用戶需求進行分類和排序,挖掘出代表性用戶的關(guān)鍵需求。針對實際案例對提出的方法進行了驗證,表明了所提KEY-DEMANDS-OL方法的實用性與有效性。該文為相關(guān)研究提供了一個用戶關(guān)鍵需求快速挖掘的方法,對產(chǎn)品的研發(fā)與改進提供了重要的定量參考與決策支持。此外,隨著在線品牌社區(qū)的更迭,在KEY-DEMANDS-OL方法的后續(xù)使用中,主體框架可保持不變,意見領(lǐng)袖識別指標體系可以進行調(diào)整,以適應(yīng)不同的業(yè)務(wù)領(lǐng)域。誠然,KEY-DEMANDS-OL方法取得了一定的進展,但仍存不足,如在進行海量用戶評論處理時沒有很好地利用分布式計算框架,評論處理效率有待進一步提升。此外,在進行評論分析時上下文關(guān)聯(lián)語義考慮不足。筆者將在后續(xù)研究中持續(xù)關(guān)注,力求有新突破。