高學(xué)東, 王 艾
(北京科技大學(xué) 東凌經(jīng)濟(jì)管理學(xué)院,北京100083)
網(wǎng)絡(luò)輿情作為新媒體環(huán)境下網(wǎng)絡(luò)用戶對(duì)于特定社會(huì)現(xiàn)象所持有的不同觀點(diǎn)、態(tài)度、情緒和行為傾向的總和,隨著社交網(wǎng)絡(luò)用戶數(shù)量的激增而呈現(xiàn)出內(nèi)容自由度高、傳播速度快、覆蓋范圍廣等特征,并在我國(guó)經(jīng)濟(jì)社會(huì)的生產(chǎn)、生活中扮演著日益重要的角色[1,2]。
網(wǎng)絡(luò)輿情監(jiān)測(cè)問(wèn)題一直是政府相關(guān)管理部門和企業(yè)相關(guān)組織機(jī)構(gòu)的研究熱點(diǎn)之一[3]。政府監(jiān)測(cè)網(wǎng)絡(luò)輿情的目的是對(duì)網(wǎng)絡(luò)輿情進(jìn)行引導(dǎo)或干預(yù),避免負(fù)面網(wǎng)絡(luò)輿情的病毒式傳播[4,5];而企業(yè)監(jiān)測(cè)網(wǎng)絡(luò)輿情的目的是在激烈的市場(chǎng)競(jìng)爭(zhēng)中快速獲取競(jìng)爭(zhēng)情報(bào)、擴(kuò)大企業(yè)優(yōu)勢(shì)[6]。
現(xiàn)有企業(yè)網(wǎng)絡(luò)輿情的研究工作主要集中于輿情的預(yù)警機(jī)制設(shè)計(jì)、傳播過(guò)程識(shí)別、危機(jī)應(yīng)對(duì)策略分析等問(wèn)題[7~9],而關(guān)于企業(yè)如何利用網(wǎng)絡(luò)輿情來(lái)豐富原有客戶關(guān)系管理內(nèi)涵、并從而提升企業(yè)競(jìng)爭(zhēng)優(yōu)勢(shì)的研究較少。
本研究針對(duì)網(wǎng)絡(luò)輿情環(huán)境下的企業(yè)客戶關(guān)系管理問(wèn)題,利用文本挖掘技術(shù)和聚類方法,實(shí)現(xiàn)基于企業(yè)網(wǎng)絡(luò)輿情的客戶滿意度預(yù)測(cè),并根據(jù)預(yù)測(cè)結(jié)果為企業(yè)銷售戰(zhàn)略的制定提供決策支持。
在網(wǎng)絡(luò)輿情環(huán)境中,存在三個(gè)關(guān)鍵實(shí)體,即企業(yè)客戶、網(wǎng)絡(luò)用戶和企業(yè)網(wǎng)絡(luò)輿情[10]。企業(yè)客戶是指在現(xiàn)實(shí)社會(huì)中,購(gòu)買或體驗(yàn)過(guò)企業(yè)提供的產(chǎn)品(或服務(wù))的真實(shí)消費(fèi)者。因而,企業(yè)與客戶確立了以產(chǎn)品為中心的銷售關(guān)系。
網(wǎng)絡(luò)輿情的熱點(diǎn)話題深入到經(jīng)濟(jì)社會(huì)生產(chǎn)、生活的方方面面,例如國(guó)內(nèi)外政治經(jīng)濟(jì)局勢(shì)、社會(huì)突發(fā)事件、文化娛樂(lè)生活等[11]。企業(yè)網(wǎng)絡(luò)輿情特指以企業(yè)或企業(yè)所經(jīng)營(yíng)的具體業(yè)務(wù)為話題的網(wǎng)絡(luò)輿情,如產(chǎn)品網(wǎng)絡(luò)輿情等,它能夠直接影響企業(yè)的生產(chǎn)經(jīng)營(yíng)效益。所以,企業(yè)可以通過(guò)獲取與其主營(yíng)業(yè)務(wù)相關(guān)的網(wǎng)絡(luò)輿情,來(lái)改善經(jīng)營(yíng)現(xiàn)狀,特別是拓展與客戶互動(dòng)的渠道。
社交網(wǎng)絡(luò)平臺(tái)由于其自身使用便捷、信息傳播速度快等優(yōu)勢(shì),是企業(yè)網(wǎng)絡(luò)輿情傳播的重要渠道,如微博、微信朋友圈、QQ空間等[12]。網(wǎng)絡(luò)用戶作為社交網(wǎng)絡(luò)世界的締造者和參與者,其活躍度對(duì)企業(yè)網(wǎng)絡(luò)輿情的傳播產(chǎn)生重要影響。
(1)企業(yè)客戶與網(wǎng)絡(luò)用戶間的關(guān)系
DONG[13]在研究移動(dòng)社交網(wǎng)絡(luò)用戶對(duì)聯(lián)系人產(chǎn)品推薦信息反應(yīng)意象的影響因素中,明確了企業(yè)客戶與網(wǎng)絡(luò)用戶的關(guān)系。實(shí)證研究表明,網(wǎng)絡(luò)用戶一旦建立對(duì)企業(yè)產(chǎn)品或服務(wù)的購(gòu)買意愿,就轉(zhuǎn)化為企業(yè)客戶,且聯(lián)系人產(chǎn)品推薦模式對(duì)網(wǎng)絡(luò)用戶轉(zhuǎn)化為企業(yè)客戶起到較大的促進(jìn)作用。而企業(yè)客戶一旦在社交網(wǎng)絡(luò)平臺(tái)上發(fā)布或?yàn)g覽信息,就直接成為網(wǎng)絡(luò)用戶。所以,社交網(wǎng)絡(luò)平臺(tái)的發(fā)展使得企業(yè)客戶向網(wǎng)絡(luò)用戶的轉(zhuǎn)化速率快速提升,甚至對(duì)于銷售手機(jī)等同類電子產(chǎn)品的企業(yè),客戶就是網(wǎng)絡(luò)用戶。
因此,企業(yè)客戶與網(wǎng)絡(luò)用戶具有雙向可達(dá)聯(lián)系,并且隨著網(wǎng)絡(luò)基礎(chǔ)設(shè)施的普及、社交網(wǎng)絡(luò)平臺(tái)的完善,聯(lián)系將會(huì)向緊密化、穩(wěn)固化發(fā)展。
(2)網(wǎng)絡(luò)用戶與企業(yè)網(wǎng)絡(luò)輿情的關(guān)系
LI et al.[14]研究了面向輿情主題的微博用戶行為,明確了網(wǎng)絡(luò)用戶與企業(yè)網(wǎng)絡(luò)輿情的關(guān)系。實(shí)驗(yàn)結(jié)果表明,信息傳播中的網(wǎng)絡(luò)用戶存在三種類型,即一般關(guān)注型、主動(dòng)參與型、以及信息傳播型用戶。其中,主動(dòng)參與型用戶以自身為中心,向周圍聯(lián)系人主動(dòng)散播輿情信息,且用戶行為特征對(duì)輿情主題敏感。而信息傳播型用戶在企業(yè)網(wǎng)絡(luò)輿情傳播過(guò)程中活躍度最高,是重要輿情信息轉(zhuǎn)發(fā)、創(chuàng)造者,甚至是輿情領(lǐng)袖。所以,主動(dòng)參與型和信息傳播型網(wǎng)絡(luò)用戶均可以通過(guò)在社交網(wǎng)絡(luò)平臺(tái)上對(duì)企業(yè)產(chǎn)品進(jìn)行評(píng)論、意見反饋來(lái)營(yíng)造企業(yè)網(wǎng)絡(luò)輿情。同時(shí),企業(yè)網(wǎng)絡(luò)輿情又可以通過(guò)社交網(wǎng)絡(luò)平臺(tái)傳播并影響所有類型用戶。
因此,主動(dòng)參與型和信息傳播型用戶與企業(yè)網(wǎng)絡(luò)輿情具有雙向可達(dá)關(guān)系。
綜上,大量企業(yè)客戶已經(jīng)將其對(duì)于企業(yè)產(chǎn)品的意見主動(dòng)反饋到了社交網(wǎng)絡(luò)平臺(tái)上,甚至參與了該產(chǎn)品網(wǎng)絡(luò)輿情的構(gòu)建及傳播。這無(wú)形中開發(fā)出一條由客戶推動(dòng)的意見反饋渠道,為企業(yè)獲取產(chǎn)品情報(bào)、實(shí)踐客戶關(guān)系管理提供了新模式。
(3)網(wǎng)絡(luò)用戶-企業(yè)網(wǎng)絡(luò)輿情關(guān)系的穩(wěn)定性
GAO[15]在研究網(wǎng)絡(luò)輿情形成機(jī)理及信息受眾觀點(diǎn)測(cè)度中,進(jìn)一步明確了網(wǎng)絡(luò)用戶與企業(yè)網(wǎng)絡(luò)輿情的關(guān)系。依據(jù)網(wǎng)絡(luò)輿情場(chǎng)理論,將網(wǎng)絡(luò)輿情場(chǎng)內(nèi)信息受眾觀點(diǎn)測(cè)度分解為三個(gè)維度,即個(gè)體維度、群體維度、以及整體維度。個(gè)體維度觀測(cè)范圍為場(chǎng)域內(nèi)每一位網(wǎng)絡(luò)用戶,在實(shí)踐過(guò)程中面臨信息失真、個(gè)體行為滯后等問(wèn)題。群體維度觀測(cè)范圍為具有信息交互的同質(zhì)網(wǎng)絡(luò)用戶個(gè)體群落(類),網(wǎng)絡(luò)用戶類往往處于明晰場(chǎng)域中,并具有一定的魯棒性。整體維度觀測(cè)范圍為全部網(wǎng)絡(luò)用戶,測(cè)度的目的由網(wǎng)絡(luò)用戶本身轉(zhuǎn)向網(wǎng)絡(luò)輿情場(chǎng)的極性與強(qiáng)度。因此,由于網(wǎng)絡(luò)用戶群體行為具有魯棒性特征,只有主觀參與型和信息傳播型網(wǎng)絡(luò)用戶類到達(dá)企業(yè)網(wǎng)絡(luò)輿情的單向聯(lián)系具有穩(wěn)定性。
所以,本研究?jī)H考察主觀參與型和信息傳播型網(wǎng)絡(luò)用戶(簡(jiǎn)稱網(wǎng)絡(luò)用戶)類至企業(yè)網(wǎng)絡(luò)輿情的單向聯(lián)系。并且針對(duì)具有清晰話題的企業(yè)網(wǎng)絡(luò)輿情,網(wǎng)絡(luò)用戶與企業(yè)客戶在群體行為上具有等效性。
客戶滿意度作為反映企業(yè)競(jìng)爭(zhēng)力的重要因素,企業(yè)會(huì)根據(jù)自身所處行業(yè)、以及經(jīng)營(yíng)的產(chǎn)品或服務(wù)的特征,識(shí)別客戶滿意度的影響因素,從而構(gòu)建符合企業(yè)實(shí)際的客戶滿意度評(píng)價(jià)指標(biāo)體系[16]。進(jìn)而,依據(jù)評(píng)價(jià)指標(biāo)體系得到客戶滿意度的定量化結(jié)果后,通常采用主觀設(shè)定閾值的方式,將客戶滿意度劃分為3~7個(gè)不同的等級(jí),例如不滿意、一般、滿意等[17]。
現(xiàn)有客戶滿意度指標(biāo)體系數(shù)據(jù)來(lái)源往往還是依靠對(duì)企業(yè)客戶展開抽樣滿意度調(diào)查的方法,例如借助客戶投訴系統(tǒng)、客戶滿意度調(diào)查問(wèn)卷等,在現(xiàn)實(shí)環(huán)境中人為設(shè)置數(shù)據(jù)采集點(diǎn)[18]。企業(yè)不僅需要承擔(dān)較高的調(diào)研和數(shù)據(jù)統(tǒng)計(jì)分析成本,也無(wú)法準(zhǔn)確掌握開展客戶滿意度分析工作的時(shí)機(jī)。
然而,由于社交網(wǎng)絡(luò)平臺(tái)的出現(xiàn),企業(yè)客戶已經(jīng)將涵蓋滿意度信息的文本評(píng)論發(fā)布到了網(wǎng)絡(luò)環(huán)境中,即客戶推動(dòng)式意見反饋渠道,企業(yè)可以直接獲取相關(guān)評(píng)論數(shù)據(jù),并通過(guò)文本挖掘的方式得到最終的客戶滿意度。
不同于具有清晰空格分隔的英文句法結(jié)構(gòu),中文文本因其自身復(fù)雜性,往往需要參考中文情感詞典或中文情感預(yù)料庫(kù)來(lái)實(shí)現(xiàn)文本情感極性分類[19,22]?,F(xiàn)有研究中,中文文本情感分析方法日趨成熟,除文本數(shù)據(jù)外,社交網(wǎng)絡(luò)評(píng)論中常見的表情符號(hào)也是研究熱點(diǎn)之一,已有大量研究探索利用表情符號(hào)提升情感分類效果[20,21]。
相較于現(xiàn)實(shí)環(huán)境,網(wǎng)絡(luò)環(huán)境具有更高的開放度、包容度,用戶可以更加自由地在網(wǎng)絡(luò)平臺(tái)上進(jìn)行信息交流、意見表達(dá)。所以,網(wǎng)絡(luò)評(píng)論文本除了能夠反映用戶對(duì)某一具體產(chǎn)品、服務(wù)的意見、滿意程度之外,還會(huì)流露更多個(gè)性化信息,如近期關(guān)注熱點(diǎn)、興趣愛(ài)好等,可以為企業(yè)制定銷售戰(zhàn)略提供具有較高參考價(jià)值的有利信息。
針對(duì)網(wǎng)絡(luò)輿情環(huán)境下的企業(yè)客戶關(guān)系管理問(wèn)題,現(xiàn)有研究的不足主要表現(xiàn)為沒(méi)有將企業(yè)產(chǎn)品(或服務(wù))的真實(shí)消費(fèi)者與社交網(wǎng)絡(luò)用戶之間建立關(guān)聯(lián),忽略了企業(yè)客戶自發(fā)建立的意見反饋網(wǎng)絡(luò)渠道,因而無(wú)法真正發(fā)揮企業(yè)網(wǎng)絡(luò)輿情在客戶關(guān)系管理中的價(jià)值。
歷史研究成果對(duì)本研究的理論支撐主要體現(xiàn)在:①在具有清晰主題的企業(yè)網(wǎng)絡(luò)輿情約束下,企業(yè)客戶與網(wǎng)絡(luò)用戶在群體行為上等效;②對(duì)于與企業(yè)產(chǎn)品或服務(wù)相關(guān)的文本評(píng)論內(nèi)容,情感分析結(jié)果能夠得到網(wǎng)絡(luò)用戶滿意度;③文本評(píng)論內(nèi)容中蘊(yùn)含大量企業(yè)銷售戰(zhàn)略制定過(guò)程中期望參考的個(gè)性化信息。
傳統(tǒng)企業(yè)運(yùn)營(yíng)過(guò)程中,企業(yè)通過(guò)生產(chǎn)經(jīng)營(yíng)產(chǎn)品并銷往客戶,形成了經(jīng)典的“企業(yè)-客戶”產(chǎn)銷業(yè)務(wù)渠道。隨著社交網(wǎng)絡(luò)平臺(tái)的快速發(fā)展,網(wǎng)絡(luò)用戶在平臺(tái)上主動(dòng)對(duì)企業(yè)提供的產(chǎn)品進(jìn)行評(píng)論、意見反饋,進(jìn)而產(chǎn)生以產(chǎn)品為話題的網(wǎng)絡(luò)輿情。多數(shù)企業(yè)已經(jīng)意識(shí)到網(wǎng)絡(luò)輿情的價(jià)值,并設(shè)立輿情監(jiān)測(cè)部門或崗位,通過(guò)監(jiān)測(cè)、獲取企業(yè)網(wǎng)絡(luò)輿情,嘗試挖掘競(jìng)爭(zhēng)情報(bào)、擴(kuò)大企業(yè)優(yōu)勢(shì),這同時(shí)也建立了“網(wǎng)絡(luò)用戶-企業(yè)”信息傳播渠道。此時(shí),產(chǎn)銷業(yè)務(wù)渠道與信息傳播渠道表現(xiàn)為以企業(yè)為核心的單向串行結(jié)構(gòu)。
然而,本研究通過(guò)第1.1節(jié)分析結(jié)果,發(fā)現(xiàn)企業(yè)客戶與網(wǎng)絡(luò)用戶在企業(yè)網(wǎng)絡(luò)輿情和群體測(cè)度兩個(gè)約束條件下,能夠形成行為等價(jià)關(guān)系,由此提出企業(yè)客戶推動(dòng)式信息反饋模型(圖1)。企業(yè)客戶與網(wǎng)絡(luò)用戶的等價(jià)關(guān)系一旦建立,網(wǎng)絡(luò)用戶關(guān)于企業(yè)產(chǎn)品的態(tài)度、情緒、意見就等效于客戶的態(tài)度、情緒、意見,只是通過(guò)文本評(píng)論的方式表達(dá)出來(lái)??梢姡撃P统尸F(xiàn)為一個(gè)具有穩(wěn)定性的閉環(huán)結(jié)構(gòu)。
依據(jù)企業(yè)客戶推動(dòng)式信息反饋模型,企業(yè)若想獲取反映企業(yè)競(jìng)爭(zhēng)力的客戶滿意度情報(bào),除了傳統(tǒng)方式進(jìn)行客戶滿意度實(shí)地調(diào)查外,又增添了新的渠道,即相關(guān)文本評(píng)論的情感分析。
所以,本研究的主要任務(wù)是建立企業(yè)網(wǎng)絡(luò)輿情約束和群體測(cè)度約束的求解方法,以利用網(wǎng)絡(luò)用戶與企業(yè)用戶的等價(jià)關(guān)系來(lái)實(shí)現(xiàn)客戶滿意度預(yù)測(cè)。
圖1 企業(yè)客戶推動(dòng)式信息反饋模型
分析企業(yè)客戶推動(dòng)式信息反饋模型發(fā)現(xiàn),網(wǎng)絡(luò)用戶與企業(yè)和客戶均具有可達(dá)關(guān)系。
企業(yè)網(wǎng)絡(luò)輿情約束對(duì)網(wǎng)絡(luò)用戶的具體要求為:①網(wǎng)絡(luò)用戶必須真實(shí)參與了企業(yè)網(wǎng)絡(luò)輿情的傳播過(guò)程;②網(wǎng)絡(luò)用戶的觀點(diǎn)、態(tài)度具有準(zhǔn)確性,即與輿情內(nèi)容相符合。群體測(cè)度約束對(duì)網(wǎng)絡(luò)用戶的具體要求為:①以網(wǎng)絡(luò)用戶群體(類)為研究對(duì)象;②網(wǎng)絡(luò)用戶群體(類)應(yīng)具有明顯特征,以便實(shí)現(xiàn)銷售決策支持。
根據(jù)上述要求,確立本研究的技術(shù)路線(圖2)。首先,構(gòu)建網(wǎng)絡(luò)用戶輿情敏感性指數(shù)來(lái)實(shí)現(xiàn)輿情檢驗(yàn)工作,從而得到初始網(wǎng)絡(luò)用戶。其次,提出變尺度聚類算法,通過(guò)廣度尺度變換,完成關(guān)鍵網(wǎng)絡(luò)用戶識(shí)別;通過(guò)深度尺度變換,完成用戶—客戶關(guān)系建立。最后,針對(duì)不同客戶群體(類)的客戶滿意度預(yù)測(cè)結(jié)果匹配最佳銷售戰(zhàn)略,并結(jié)合客戶群體的特征制定銷售戰(zhàn)術(shù)。(具體研究方法見第3節(jié))
圖2 研究框架
“尺”是所有可能用于觀測(cè)對(duì)象的角度、“度”是對(duì)象在尺上的所有可能取值,“尺度”共同構(gòu)成了丈量事物的客觀準(zhǔn)則。尺度是人的一種先驗(yàn)知識(shí),與其被用于觀測(cè)的對(duì)象無(wú)關(guān)。只有當(dāng)尺度被用于衡量具體對(duì)象后,才會(huì)形成包含對(duì)象、屬性的數(shù)據(jù)結(jié)構(gòu),并實(shí)現(xiàn)數(shù)據(jù)存儲(chǔ)。
“尺度變換”是為滿足某種對(duì)于特定對(duì)象的觀測(cè)需求,如獲取對(duì)象特征,通過(guò)調(diào)整、選取合適的尺度來(lái)得到期望數(shù)據(jù)的過(guò)程。這種觀測(cè)需求既可能是初始明確的,也可能是初始模糊而在尺度變換過(guò)程中逐漸清晰的。尺度變換則與被觀測(cè)對(duì)象有著緊密關(guān)聯(lián),主觀人為尺度變換也正是人類智能的重要體現(xiàn)。
傳統(tǒng)聚類算法是在單一尺度上的挖掘過(guò)程,即在一次完整的聚類任務(wù)中,初始數(shù)據(jù)集不發(fā)生任何變化[24]。尺度本身就體現(xiàn)類結(jié)果的特征。由于初始數(shù)據(jù)的尺度并不一定是最佳觀測(cè)尺度,且同一組尺度應(yīng)用于不同數(shù)據(jù)集的結(jié)果表現(xiàn)往往不同,所以傳統(tǒng)聚類算法在實(shí)踐應(yīng)用中經(jīng)常會(huì)出現(xiàn)只有少部分類的特征較為明顯的問(wèn)題,并隨著數(shù)據(jù)量增大而問(wèn)題加劇。
在問(wèn)題求解理論中,尺度通常是以概念的形式存在于人的知識(shí)體系中[25]。由于概念間本身具有聯(lián)系,本研究將概念(尺度)間的擴(kuò)展聯(lián)系引入聚類分析方法中,提出概念空間模型(圖3)。
圖3 概念空間
概念空間由概念鏈和值空間兩部分構(gòu)成,概念空間的層次結(jié)構(gòu)具有特征:①低層級(jí)概念偏序于高層級(jí)概念,即CHi?CH(i+1)(i∈N);②每一個(gè)概念都可決定同層級(jí)的值空間取值;即Vij∈CHi(j∈N+);③同層級(jí)的值空間取值遵循該概念鏈的偏序關(guān)系,即CHi?CHk→(j∈N+)。
依據(jù)概念空間模型,尺度變換分為兩個(gè)類型:①深度尺度變換,以概念鏈中的概念為觀測(cè)尺(屬性)、以此概念所對(duì)應(yīng)的同層值空間取值為觀測(cè)度。深度尺度變換過(guò)程中,觀測(cè)度隨觀測(cè)尺的層級(jí)變化而變化,也被視為同步尺度變換模式;②廣度尺度變換,以值空間中的取值為觀測(cè)尺(屬性),以對(duì)象與觀測(cè)尺的范數(shù)關(guān)系為觀測(cè)度。廣度尺度變換過(guò)程中,不同觀測(cè)尺可以處于不同的層級(jí),也被視為異步尺度變換模式。
依據(jù)粗糙集理論中的決策表結(jié)構(gòu)[26],定義深度、廣度尺度變換的多尺度數(shù)據(jù)集。
定義1(多尺度數(shù)據(jù)集)對(duì)于任一數(shù)據(jù)集D=DO=(U,AO,VO,f O),多尺度數(shù)據(jù)集DS=(U,AT,VT,f T),其中,U是DO和DS的共同論域,AO是D的原始屬性(原始尺度),AT是D的目標(biāo)尺度,且AO?AT,AT={t|(a∈A0)∧(t=CH(a))}。對(duì)于深度多尺度數(shù)據(jù)集,CH(a)是屬性a的概念鏈中任一概念;對(duì)于廣度多尺度數(shù)據(jù)集,CH(a)是屬性a的值空間中任一取值。
由于概念空間的離散特征,深度多尺度數(shù)據(jù)集較為常見且屬性均為分類屬性。而廣度尺度變換數(shù)據(jù)集較為特殊,文本挖掘中的詞袋模型就是一種廣度多尺度數(shù)據(jù)集,本研究中僅考慮所有的屬性均為二值屬性的廣度多尺度數(shù)據(jù)集。
定義1表明,尺度變換就是針對(duì)某一數(shù)據(jù)集D,依據(jù)概念空間中屬性的偏序關(guān)系,將原始尺度AO轉(zhuǎn)化為目標(biāo)尺度AT的過(guò)程。
定義2(尺度變換率) 尺度變換率用于度量尺度變換所引起的數(shù)據(jù)分布變化:
其中,U/AO={,…,},U/AT={,…,}。
傳統(tǒng)聚類結(jié)果有效性評(píng)價(jià)指標(biāo)[27]均是從聚類結(jié)果的整體出發(fā),得到所有類表現(xiàn)的一個(gè)綜合評(píng)價(jià)值,并不適用于關(guān)注個(gè)體類表現(xiàn)的變尺度聚類算法。
定義3(粒度偏差)令CI代表一個(gè)含有n個(gè)對(duì)象、m個(gè)屬性的類(xij∈CI),a是CI中的一個(gè)屬性,粒度偏差為:
其中,對(duì)于由分類屬性構(gòu)成的深度多尺度數(shù)據(jù)集,x Ij為類CI在每個(gè)屬性中的眾數(shù);對(duì)于由二值屬性構(gòu)成的廣度多尺度數(shù)據(jù)集,只有全0屬性時(shí)x Ij=0,其他情況x Ij=1。如果xij=x Ij,δ(xij,x Ij)=0,否則δ(xij,x Ij)=1。G(U/a)是商U/a的知識(shí)粒度。
粒度偏差GrD(CI)度量了類CI的離散程度,GrD(CI)取值的減小代表類內(nèi)對(duì)象xij間相似度的提升。給定某一觀測(cè)尺度上的閾值R0,只有當(dāng)GrD(CI)≤R0,表明類CI滿足質(zhì)量要求、結(jié)果可接受。
本研究假設(shè)每一次變尺度聚類過(guò)程只實(shí)現(xiàn)單一屬性的尺度變換。
依據(jù)假設(shè),深度尺度變換是將一個(gè)原始觀測(cè)尺轉(zhuǎn)化為一個(gè)目標(biāo)觀測(cè)尺,而廣度尺度變換是將多個(gè)原始觀測(cè)尺轉(zhuǎn)化為一個(gè)目標(biāo)觀測(cè)尺。
雖然深度與廣度尺度變換在多尺度數(shù)據(jù)集和粒度偏差評(píng)價(jià)度量上存在差異,但其尺度變換本質(zhì)相同。由此,提出面向廣度和深度尺度變換的變尺度聚類算法:
輸入:多尺度數(shù)據(jù)集D,概念空間CS,尺度變換率閾值S0,初始聚類參數(shù)k;
輸出:滿意類Cj及其尺度Aj。
Step 1對(duì)于初始數(shù)據(jù)集D,應(yīng)用聚類參數(shù)k進(jìn)行初始聚類。
Step 2主觀判定出滿意類Ci,將Ci及其尺度Ai輸出,同時(shí)在數(shù)據(jù)集D中刪除Ci中包含的所有對(duì)象。
Step 3計(jì)算Step 2中所有滿意類的粒度偏差GrD(Ci),并將最大粒度偏差作為閾值R0。
Step 4選取屬性Aj進(jìn)行尺度變換,若尺度轉(zhuǎn)化率STR(Aj,CH(Aj))<S0成立,則更新多尺度數(shù)據(jù)集D,用CH(Aj)替代Aj。
Step 5更新閾值R0,計(jì)算上一次聚類結(jié)果中最小未滿意類Cj在新尺度CH(Aj)的粒度偏差,取GrD(Cj)與R0的較大值。
Step 6對(duì)于當(dāng)前數(shù)據(jù)集D,應(yīng)用參數(shù)k與上一次輸出的滿意類個(gè)數(shù)的差值進(jìn)行聚類。
Step 7計(jì)算所有類的粒度偏差,小于R0的類作為滿意類,連同當(dāng)前尺度一起輸出,并在數(shù)據(jù)集D刪除輸出類的所有對(duì)象。
Step 8重復(fù)Step 4,直到數(shù)據(jù)集D為空。
變尺度聚類算法的時(shí)間復(fù)雜度為O(nmkt),其中n為對(duì)象個(gè)數(shù),m為屬性個(gè)數(shù),k是類個(gè)數(shù),t是迭代次數(shù)。
本實(shí)驗(yàn)?zāi)康脑谟谕暾故酒髽I(yè)利用網(wǎng)絡(luò)輿情來(lái)獲取客戶滿意度情報(bào),從而提升客戶關(guān)系管理水平的全過(guò)程。同時(shí),驗(yàn)證變尺度聚類算法在處理高維度、稀疏、大量數(shù)據(jù)時(shí)的準(zhǔn)確性和運(yùn)算效率。實(shí)驗(yàn)設(shè)計(jì)見圖4。
本實(shí)驗(yàn)共包含5個(gè)實(shí)驗(yàn)環(huán)節(jié),即數(shù)據(jù)采集及預(yù)處理、網(wǎng)絡(luò)用戶群體識(shí)別、網(wǎng)絡(luò)用戶輿情敏感性評(píng)價(jià)、企業(yè)客戶滿意度預(yù)測(cè)、以及企業(yè)銷售戰(zhàn)略戰(zhàn)術(shù)制定;7種數(shù)據(jù)分析方法和技術(shù),即網(wǎng)絡(luò)爬蟲、文本分詞、情感分析、輿情監(jiān)測(cè)、廣度尺度變換聚類算法、輿情敏感性指數(shù)、深度尺度變換聚類算法;以及2個(gè)目標(biāo)數(shù)據(jù)輸出結(jié)果,即企業(yè)客戶分類結(jié)果、以及銷售戰(zhàn)略和戰(zhàn)術(shù)。
由于數(shù)據(jù)采集及預(yù)處理并不是本研究的重點(diǎn),所以直接采用成熟的方法和軟件實(shí)現(xiàn)(本文第4.2節(jié)詳述)。
網(wǎng)絡(luò)用戶群體識(shí)別和網(wǎng)絡(luò)用戶輿情敏感性評(píng)價(jià),分別用戶實(shí)現(xiàn)企業(yè)客戶推動(dòng)式信息反饋模型(圖1)中的群體測(cè)度約束、以及企業(yè)網(wǎng)絡(luò)輿情約束。
網(wǎng)絡(luò)用戶輿情敏感性評(píng)價(jià)的基本思想為將企業(yè)網(wǎng)絡(luò)輿情的關(guān)鍵詞熱度排序轉(zhuǎn)化為詞語(yǔ)權(quán)重,結(jié)合網(wǎng)絡(luò)用戶文本分詞結(jié)果中的詞頻數(shù),計(jì)算每個(gè)用戶的輿情表現(xiàn)得分,從而判斷網(wǎng)絡(luò)用戶的輿情敏感度。由此,定義網(wǎng)絡(luò)用戶輿情敏感度指數(shù):
其中,tfik為網(wǎng)絡(luò)用戶xi的文本內(nèi)容中出現(xiàn)第k個(gè)詞語(yǔ)的頻數(shù),Hk為第k個(gè)詞語(yǔ)在某特定網(wǎng)絡(luò)輿情環(huán)境的權(quán)重,可以通過(guò)熱度數(shù)值標(biāo)準(zhǔn)化來(lái)求得。
圖4 實(shí)驗(yàn)設(shè)計(jì)
(1)數(shù)據(jù)采集
本實(shí)驗(yàn)選取7天內(nèi)新浪微博上所有個(gè)人認(rèn)證用戶發(fā)布的關(guān)于“iPhone X”的原創(chuàng)微博作為數(shù)據(jù)源,利用Python中的網(wǎng)絡(luò)爬蟲框架Scrapy,總共采集到4350條符合表1中數(shù)據(jù)采集要求的文本數(shù)據(jù)。
企業(yè)客戶數(shù)據(jù)來(lái)源于一個(gè)電子產(chǎn)品銷售公司營(yíng)業(yè)部(含手機(jī)),隨機(jī)抽取625條真實(shí)客戶數(shù)據(jù)作為分析樣本,其數(shù)據(jù)結(jié)構(gòu)能夠匹配表1中企業(yè)客戶滿意度預(yù)測(cè)環(huán)節(jié)的網(wǎng)絡(luò)用戶數(shù)據(jù)結(jié)構(gòu)。
圖5 輿情關(guān)鍵詞及熱度
此外,利用公開網(wǎng)絡(luò)輿情監(jiān)測(cè)軟件,得到了“iPhone X”在表1研究時(shí)段的網(wǎng)絡(luò)輿情關(guān)鍵詞及熱度排序(圖5)。
(2)數(shù)據(jù)預(yù)處理
數(shù)據(jù)清洗是通過(guò)限定原創(chuàng)微博的最低點(diǎn)贊數(shù)、評(píng)論數(shù)、轉(zhuǎn)發(fā)數(shù)來(lái)去除掉信息價(jià)值較低微博,如手機(jī)營(yíng)銷廣告、手機(jī)功能介紹等。本研究中,設(shè)定最低點(diǎn)贊數(shù)為12、評(píng)論數(shù)為8、轉(zhuǎn)發(fā)數(shù)為6(三者滿足其一即可),最終保留微博580條。
用戶過(guò)濾是通過(guò)微博影響力指數(shù)[28]來(lái)為研究時(shí)段內(nèi)發(fā)布多條原創(chuàng)微博的用戶擇一代表。原創(chuàng)微博影響力指數(shù)為點(diǎn)贊數(shù)、評(píng)論數(shù)、轉(zhuǎn)發(fā)數(shù)、新鮮度(發(fā)布時(shí)長(zhǎng))的綜合表現(xiàn)。最終,得到了300條原創(chuàng)微博,分別對(duì)應(yīng)了300個(gè)不同的網(wǎng)絡(luò)用戶。
情感分析是將每條微博(網(wǎng)絡(luò)用戶)的情感強(qiáng)度劃分為與目標(biāo)客戶滿意度相一致的等級(jí)分布,如“滿意、一般、不滿意”。本情感分析工作得到積極情感類(滿意)網(wǎng)絡(luò)用戶160個(gè)、中立類(一般)網(wǎng)絡(luò)用戶69個(gè)、消極情感類網(wǎng)絡(luò)用戶(不滿意)71個(gè)。
文本分詞是將各類用戶的微博內(nèi)容進(jìn)行細(xì)粒度切分,并構(gòu)建詞袋模型。最終,得到滿意類用戶研究時(shí)段內(nèi)的熱點(diǎn)關(guān)注原始詞1404個(gè)、一般類用戶研究時(shí)段內(nèi)的熱點(diǎn)關(guān)注原始詞719個(gè)、不滿意類用戶研究時(shí)段內(nèi)的熱點(diǎn)關(guān)注原始詞515個(gè)。
表1 網(wǎng)絡(luò)用戶數(shù)據(jù)采集要求
至此,完成全部數(shù)據(jù)預(yù)處理工作,結(jié)果見表2。
表2 數(shù)據(jù)預(yù)處理結(jié)果
網(wǎng)絡(luò)用戶群體識(shí)別是利用廣度尺度變換聚類算法,對(duì)網(wǎng)絡(luò)用戶進(jìn)行群體劃分,即得到具有明顯特征的網(wǎng)絡(luò)用戶類(圖6)。
圖6中,每一個(gè)矩形色塊代表一個(gè)用戶類,矩形在類坐標(biāo)橫軸上的寬度代表該類中的用戶數(shù)量,矩形在尺度縱軸上的長(zhǎng)度代表用于觀測(cè)該類的觀測(cè)尺個(gè)數(shù)。矩形對(duì)應(yīng)粒度偏差橫軸上的數(shù)值代表該類在當(dāng)前尺度下的粒度偏差。
可見,廣度尺度聚類變換是在保證結(jié)果有效性的前提下的一個(gè)觀測(cè)尺逐漸遞減的過(guò)程。網(wǎng)絡(luò)用戶群體識(shí)別環(huán)節(jié)一共得到了7個(gè)滿意用戶類、6個(gè)一般用戶類和2個(gè)不滿意用戶類。
圖6(a) 滿意類網(wǎng)絡(luò)用戶聚類結(jié)果
網(wǎng)絡(luò)用戶輿情敏感性評(píng)價(jià)是通過(guò)計(jì)算網(wǎng)絡(luò)用戶輿情敏感性指數(shù),在每一個(gè)網(wǎng)絡(luò)用戶類中篩選出真正參與企業(yè)網(wǎng)絡(luò)輿情傳播過(guò)程的關(guān)鍵網(wǎng)絡(luò)用戶。
圖6中,具有加粗邊框的色塊代表該類中含有一個(gè)通過(guò)輿情檢驗(yàn)的用戶。網(wǎng)絡(luò)用戶輿情敏感性評(píng)價(jià)最終得到6個(gè)關(guān)鍵滿意用戶、1個(gè)關(guān)鍵一般用戶和2個(gè)關(guān)鍵不滿意用戶。
企業(yè)客戶滿意度預(yù)測(cè)正式將這些關(guān)鍵網(wǎng)絡(luò)用戶與企業(yè)客戶進(jìn)行深度尺度變換聚類,建立網(wǎng)絡(luò)用戶與企業(yè)客戶的相似關(guān)系,從而能夠?qū)⒕W(wǎng)絡(luò)用戶的情感分類及尺度特征賦值給屬于同一類的企業(yè)客戶,實(shí)現(xiàn)客戶滿意度預(yù)測(cè)。
圖6(b) 一般類網(wǎng)絡(luò)用戶聚類結(jié)果
圖6(c) 不滿意類網(wǎng)絡(luò)用戶聚類結(jié)果
表3 企業(yè)銷售決策支持
因此,企業(yè)可以根據(jù)表3中3種不同的企業(yè)客戶滿意度等級(jí),匹配不同的銷售戰(zhàn)略。然后,在每一種銷售戰(zhàn)略下,結(jié)合每一個(gè)企業(yè)客戶類的具體特征,制定更具有針對(duì)性的銷售戰(zhàn)術(shù),從而提升企業(yè)的客戶關(guān)系管理水平。
隨著社交網(wǎng)絡(luò)平臺(tái)的迅速發(fā)展,網(wǎng)絡(luò)輿情在我國(guó)經(jīng)濟(jì)社會(huì)的生產(chǎn)、生活中扮演著日益重要的角色,企業(yè)更是期望通過(guò)挖掘網(wǎng)絡(luò)輿情來(lái)獲取有價(jià)值的信息情報(bào),使其在激烈的市場(chǎng)競(jìng)爭(zhēng)中擴(kuò)大企業(yè)優(yōu)勢(shì)。由此,本文針對(duì)網(wǎng)絡(luò)輿情環(huán)境下的企業(yè)客戶關(guān)系管理問(wèn)題展開深入研究,通過(guò)識(shí)別企業(yè)客戶、網(wǎng)絡(luò)用戶、企業(yè)網(wǎng)絡(luò)輿情間的關(guān)系,梳理出一條廣泛存在與網(wǎng)絡(luò)社交平臺(tái)上的、由企業(yè)客戶推動(dòng)的意見反饋渠道,為企業(yè)提供了一種成本更低、效率更高的獲取客戶滿意度的方法。
本研究最后通過(guò)數(shù)據(jù)實(shí)驗(yàn),從數(shù)據(jù)采集與預(yù)處理、網(wǎng)絡(luò)用戶群體識(shí)別、網(wǎng)絡(luò)用戶輿情敏感性評(píng)價(jià)、企業(yè)客戶滿意度預(yù)測(cè)、以及企業(yè)銷售戰(zhàn)略戰(zhàn)術(shù)制定這五個(gè)環(huán)節(jié),完整展示了企業(yè)如何利用網(wǎng)絡(luò)輿情實(shí)現(xiàn)客戶滿意度等級(jí)分類,并依據(jù)變尺度聚類結(jié)果實(shí)現(xiàn)銷售決策支持。
本研究的理論價(jià)值主要體現(xiàn)在:
(1)構(gòu)建企業(yè)客戶推動(dòng)式信息反饋模型。該模型表明,在企業(yè)網(wǎng)絡(luò)輿情和群體測(cè)度的約束下,網(wǎng)絡(luò)用戶與企業(yè)客戶具有等價(jià)關(guān)系,為深入研究網(wǎng)絡(luò)輿情的運(yùn)作機(jī)理提供理論基礎(chǔ)。
(2)提出變尺度聚類算法。該算法將尺度變換理論引入聚類研究中,將傳統(tǒng)聚類方法的求解過(guò)程由單一尺度分析擴(kuò)展到多尺度分析,克服了實(shí)際數(shù)據(jù)聚類應(yīng)用過(guò)程中的聚類結(jié)果特征不顯著問(wèn)題,具有較高的實(shí)際應(yīng)用價(jià)值。
(1)企業(yè)可以利用文本挖掘技術(shù),通過(guò)獲取與其主營(yíng)業(yè)務(wù)相關(guān)網(wǎng)絡(luò)輿情,預(yù)測(cè)當(dāng)前客戶的滿意度,減少傳統(tǒng)求取客戶滿意度時(shí)的實(shí)地調(diào)研成本。
(2)企業(yè)可以通過(guò)檢測(cè)網(wǎng)絡(luò)輿情的變化情況,依據(jù)輿情本身的傳播學(xué)特征,確立開展客戶滿意度預(yù)測(cè)工作的最佳時(shí)點(diǎn),并判斷現(xiàn)有客戶滿意度結(jié)果的有效性,而非完全依賴于領(lǐng)導(dǎo)的主觀經(jīng)驗(yàn)判斷。
(3)企業(yè)可以利用變尺度聚類技術(shù),在客戶劃分的過(guò)程中,保證對(duì)聚類結(jié)果質(zhì)量要求的同時(shí),獲取到與當(dāng)前類最匹配的尺度特征,利用尺度為銷售策略制定提供決策支持。