郭凌云 羅宇婷 劉昕鑫
隨著經(jīng)濟(jì)的快速發(fā)展,人民生活水平不斷提高,民宿作為一種新型住宿業(yè)態(tài),受到了大量游客的青睞。但目前民宿行業(yè)仍然面臨著諸多困境,其經(jīng)營規(guī)范性、安全性等問題日益凸顯。同時,在設(shè)施、衛(wèi)生和安全等方面的運(yùn)營管理也飽受爭議。因此,如何有效提高用戶滿意度和增加用戶黏性成為當(dāng)前民宿行業(yè)發(fā)展的重要問題。
越來越多的在線預(yù)定平臺如雨后春筍般快速成長,同時消費(fèi)者在購買商品后被鼓勵在網(wǎng)站上發(fā)布關(guān)于產(chǎn)品的在線評論信息。這些信息會通過網(wǎng)絡(luò)的快速傳播特性影響潛在消費(fèi)者的態(tài)度,進(jìn)而影響在線民宿的預(yù)訂量。因此,營銷者需綜合考慮用戶偏好及體驗,為平臺和商家提供有效的管理策略。然而,民宿領(lǐng)域的用戶滿意度研究相對較少,現(xiàn)有研究大多基于問卷調(diào)查,缺乏準(zhǔn)確高效的分析方法。并且針對民宿領(lǐng)域用戶滿意程度的評價與細(xì)致劃分的相關(guān)研究較為匱乏,同時也尚未考慮不同文化背景下用戶文化差異的影響。
基于此,本文運(yùn)用文本挖掘和多屬性決策相結(jié)合的方法對在線評論數(shù)據(jù)進(jìn)行研究,深入探索民宿用戶滿意度影響因素的重要性排序問題。本文旨在通過LDA主題模型和Word2Vec模型,實現(xiàn)對民宿領(lǐng)域特征指標(biāo)的擴(kuò)充與豐富;通過情感分析評價用戶滿意程度,構(gòu)建評價標(biāo)度;借助隨機(jī)占優(yōu)準(zhǔn)則,對比中國和美國民宿用戶的滿意度影響因素排序,提升消費(fèi)者滿意度,從而為促進(jìn)民宿行業(yè)的發(fā)展提出建議。
用戶滿意度是指用戶在購買產(chǎn)品和服務(wù)后,對產(chǎn)品和服務(wù)所提供的各個屬性的主觀感受,其根據(jù)自身的需求是否得到滿足而做出評價。
隨著文本挖掘技術(shù)不斷進(jìn)步,越來越多的學(xué)者選擇通過文本挖掘技術(shù)來研究用戶的滿意度。近年來國內(nèi)外眾多學(xué)者通過數(shù)據(jù)挖掘技術(shù)對用戶滿意度進(jìn)行了研究,其中大多數(shù)研究是從用戶滿意度影響因素分析。也有部分學(xué)者利用情感分析方法量化了虛擬社區(qū)中在線評論對用戶滿意度的影響。而針對民宿領(lǐng)域探討在線評論對用戶滿意度影響的研究仍較為匱乏。為此,本文以在線短租平臺的用戶評論數(shù)據(jù)為研究對象,利用文本挖掘和隨機(jī)占優(yōu)準(zhǔn)則方法,對中美民宿用戶的滿意度影響因素進(jìn)行排序研究,使平臺與商家能夠及時了解商品或服務(wù)的優(yōu)缺與用戶的偏好,進(jìn)而幫助平臺實現(xiàn)精準(zhǔn)營銷。
本研究綜合考慮了中國和美國民宿預(yù)定平臺的熱度和平臺用戶評論數(shù)據(jù)量,以及數(shù)據(jù)獲取的可行性,最終確定從途家網(wǎng)和攜程網(wǎng)上獲取中國民宿的用戶評論數(shù)據(jù),從Airbnb網(wǎng)站和繽客網(wǎng)上爬取美國民宿的用戶評論數(shù)據(jù)?;谥袊尘斑x取了北京、成都、麗江、三亞、廈門五所城市的民宿數(shù)據(jù)進(jìn)行爬取,基于美國背景選取華盛頓、波士頓、舊金山、圣地亞哥和芝加哥五所城市。對用戶名、民宿地點、民宿名稱、評級、評論時間和評論內(nèi)容六方面進(jìn)行數(shù)據(jù)采集,評論數(shù)據(jù)的時間跨度為2019—2022年??傆嫬@得中國用戶評論數(shù)據(jù)36330條,美國用戶評論數(shù)據(jù)27560條。采用Python對清洗后的數(shù)據(jù)進(jìn)行分詞、去停用詞等預(yù)處理工作。
對完成預(yù)處理后的數(shù)據(jù)進(jìn)行主題聚類,本文采用LDA主題模型進(jìn)行聚類。首先,通過計算困惑度來評價模型。在本研究中,中文數(shù)據(jù)主題數(shù)取22時,困惑度的值最低,聚類效果較好,因此中文評論數(shù)據(jù)的最優(yōu)主題個數(shù)取22個。英文數(shù)據(jù)主題個數(shù)取25時,困惑度的值最低,聚類效果較好,所以英文評論數(shù)據(jù)的最優(yōu)主題個數(shù)為25個。確定最佳主題個數(shù)后,進(jìn)行LDA主題分析?;贚DA主題聚類結(jié)果,并結(jié)合現(xiàn)有的研究成果,本文將中英文數(shù)據(jù)處理結(jié)果中相似的主題進(jìn)行合并整理,最終歸納得到設(shè)施、設(shè)備、客房用品、服務(wù)接待、餐飲、推薦解答、地理位置、周邊環(huán)境、交通出行、衛(wèi)生舒適、房屋風(fēng)格、誠信態(tài)度、價格、人身安全、財產(chǎn)安全、隱私安全十六個主題。結(jié)合相關(guān)專家意見,通過定性分析將設(shè)施、設(shè)備、客房用品歸為設(shè)施設(shè)備一類;將服務(wù)接待、餐飲、推薦解答歸為服務(wù)一類;將地理位置、周邊環(huán)境、交通出行歸為位置一類;將人身安全、財產(chǎn)安全和隱私安全歸為安全一類。最終得到八個一類主題。在此基礎(chǔ)上,借助機(jī)器學(xué)習(xí)的方法訓(xùn)練語料集,獲取每個主題的高頻相詞。
根據(jù)已確定的主題對評論內(nèi)容進(jìn)行細(xì)粒度的情感分析。首先根據(jù)主題-特征關(guān)鍵詞表對評論進(jìn)行分句。分句將長句拆分為短句,并提取出來每個短句中的關(guān)鍵詞,將短句根據(jù)關(guān)鍵詞進(jìn)行主題歸類,最終篩選得到中文評論133003條特征句,英文評論54365條特征句。借助情感詞典對分句后的文本進(jìn)行情感打分,正數(shù)代表積極情感、負(fù)數(shù)代表消極情感,0代表中性情感。
在情感打分的基礎(chǔ)上將短句進(jìn)行情感極性分類,進(jìn)一步對積極和消極短句進(jìn)行詞頻統(tǒng)計。其中,中文的“干凈”“整潔”和英文的“clean”“comfortable”等詞直接表達(dá)國內(nèi)外用戶對于民宿衛(wèi)生舒適狀況的滿意程度,中文的“衛(wèi)生間”“裝修”“位置”和英文的“place”“l(fā)ocation”等詞反映國內(nèi)外用戶對于民宿提供的某些特征的滿意程度。借助Python的pandas包對中英文評論數(shù)據(jù)針對特征級的情感打分短句進(jìn)行匯總,最終得到中文和英文情感得分矩陣。
首先,將一類主題作為用戶對民宿滿意度的影響因素進(jìn)行研究。根據(jù)特征主題的確定,獲得了設(shè)施設(shè)備、服務(wù)、位置、衛(wèi)生舒適、房屋風(fēng)格、誠信態(tài)度、價格和安全八個一類主題,此時N=8,按照書寫順序與編號一一對應(yīng)。將每個主題 作為與之對應(yīng)的民宿用戶滿意度影響因素 ,通過計算中美兩國間各影響因素下針對不同評價標(biāo)度的概率分布。其次,計算不同商品類別中各影響因素針對滿意度的評價標(biāo)度的累積概率分布函數(shù)。然后分別構(gòu)建不同國家類別中各影響因素評價標(biāo)度的期望向量。根據(jù)隨機(jī)占優(yōu)準(zhǔn)則構(gòu)建中國k1和美國k2中兩兩影響因素間的隨機(jī)占優(yōu)關(guān)系矩陣。最終計算不同國家類別的偏好閾值分別為:
接下來,構(gòu)建不同商品類別中的影響因素隨機(jī)占優(yōu)程度矩陣。最后,可得不同國家類別中各影響因素的排序值,如表1所示。
表1 中美兩國間用戶滿意度影響因素的排序值
若排序值 越大,則其對應(yīng)的影響因素 的滿意度越高,根據(jù) 的數(shù)值大小,可得國家類別 下各影響因素滿意度的排序結(jié)果,如表2所示,并作相應(yīng)的折線圖。
表2 中美兩國間民宿用戶滿意度影響因素的排序結(jié)果
由圖1可知,由于各個國家的文化不同,用戶的需求也不盡相同,中美兩國間用戶對各影響因素的滿意程度是不同的。在中國,用戶滿意度最高的影響因素是誠信態(tài)度、位置和房屋風(fēng)格,而滿意度最低的影響因素是設(shè)施設(shè)備、安全和價格,在服務(wù)和衛(wèi)生舒適的滿意度處于中等偏低。在美國,用戶滿意度最高的影響因素是衛(wèi)生舒適、誠信態(tài)度和房屋風(fēng)格,而滿意度最低的影響因素是服務(wù)、價格和設(shè)施設(shè)備,在位置和安全方面的滿意度處于中等偏低。
圖1 中美兩國間民宿用戶滿意度影響因素排序可視化結(jié)果
本研究提出的框架豐富了傳統(tǒng)的用戶滿意度研究視角,主要研究結(jié)果如下:
(1)獲取了在線民宿的特征指標(biāo),將特征指標(biāo)作為用戶滿意度影響因素。
(2)通過基于情感詞典的情感分析方法對用戶滿意度進(jìn)行評價。利用外部詞典和擴(kuò)展詞典,對數(shù)據(jù)進(jìn)行細(xì)粒度的情感程度分析。
(3)利用隨機(jī)占優(yōu)準(zhǔn)則對用戶滿意度影響因素進(jìn)行排序研究,研究結(jié)果發(fā)現(xiàn)中美兩國間的用戶滿意度存在顯著不同,其與兩國間的文化差異有關(guān)。
本文通過對民宿用戶的在線評論文本進(jìn)行分析,豐富了傳統(tǒng)的用戶滿意度分析視角,首次創(chuàng)新性對比研究了不同國家間的民宿用戶滿意度影響因素。本文利用文本挖掘的相關(guān)技術(shù),并與定性分析方法相結(jié)合,分析結(jié)果豐富和擴(kuò)展了民宿領(lǐng)域相關(guān)研究的評價指標(biāo)。同時將隨機(jī)占優(yōu)準(zhǔn)則應(yīng)用于民宿領(lǐng)域,對比分析中美兩國的民宿用戶滿意度影響因素的重要性排序。研究結(jié)果,為民宿領(lǐng)域中文化差異的相關(guān)研究提供了管理啟示。本研究所提出的方法,為民宿領(lǐng)域的用戶滿意度研究提供了新思路,也為其他產(chǎn)品或服務(wù)的用戶滿意度分析提供了參考和支撐。
本研究為在線民宿預(yù)定平臺提供了啟示,通過對在線評論的文本挖掘,研究中國和美國的民宿用戶滿意度影響因素的重要性排序,幫助平臺更加準(zhǔn)確清晰地了解用戶對民宿各方面的滿意情況,促使兩國的民宿預(yù)定平臺能夠因地制宜,做出合理改進(jìn)。并且預(yù)定平臺可以將用戶滿意度高的特征顯性地表現(xiàn)出來,幫助消費(fèi)者及時了解民宿不同特征的滿意情況。
本研究為民宿商家對于民宿的優(yōu)化與改進(jìn)具有一定的管理啟示。通過對用戶滿意度影響因素的研究,為商家對民宿的優(yōu)化與改進(jìn)提供了參考。商家可以根據(jù)民宿所處的國家,有針對性地改進(jìn)自家民宿所提供的服務(wù)特征,改善滿意度低的特征,保持并優(yōu)化滿意度高的特征,以提升民宿的整體滿意度,從而幫助商家提高民宿的質(zhì)量和服務(wù)水平。
當(dāng)然,本文也存在一定的局限性。首先,本文收集的數(shù)據(jù)范圍有限,只針對兩個國家進(jìn)行對比研究;其次,本研究只針對評論內(nèi)容進(jìn)行分析,并未考慮圖片和視頻等的影響;此外,情感詞典的情感分析雖然適用性較強(qiáng),但是過于機(jī)械,準(zhǔn)確率有待提高。對此,在未來研究中可以進(jìn)一步探索。