董麗穎
(1.北京外國語大學(xué) 國際商學(xué)院,北京 100089;2.浙江海洋大學(xué) 外國語學(xué)院,浙江 舟山 316022)
在新冠疫情沖擊之下,我國酒店業(yè)面臨著史無前例的考驗(yàn),預(yù)期的短期沖擊悄然改寫著行業(yè)形態(tài),為應(yīng)對變局,酒店管理者比以往更迫切地需要厘清市場引流背后的邏輯。根據(jù)邁點(diǎn)研究院發(fā)布的《2021 年12月酒店品牌影響力(MBI)100 強(qiáng)榜單》[1]解析,如今消費(fèi)者個(gè)性化需求呈現(xiàn)增勢,行業(yè)內(nèi)酒店同質(zhì)化現(xiàn)象卻非常嚴(yán)重,加之新冠疫情帶來的動(dòng)蕩,導(dǎo)致客房收入銳減,酒店行業(yè)有必要拓展業(yè)務(wù)場景,通過非客房收入的提升價(jià)值引入更多客群流量,實(shí)現(xiàn)相對于傳統(tǒng)酒店而言的價(jià)值重構(gòu)。反觀業(yè)內(nèi),在新冠疫情挑戰(zhàn)和市場需求變化疊加的行業(yè)背景下,打造文化主題酒店成為風(fēng)潮,眾多酒店管理者對文化的追逐是否理性,是否能夠吸引客群流量,成為酒店業(yè)價(jià)值重構(gòu)的一條創(chuàng)新路徑,這是酒店管理者和業(yè)內(nèi)專家都在思考并期待求證的課題。鑒于此,筆者嘗試通過顧客在線評論開展實(shí)證分析,評測我國酒店將中國文化納入產(chǎn)品設(shè)計(jì)體系是否會提升酒店的客群吸引力。
隨著網(wǎng)絡(luò)社區(qū)化在酒店場景中的全面滲透,使用傳統(tǒng)工具存儲、處理和分析大量文本數(shù)據(jù)成為酒店行業(yè)面臨的挑戰(zhàn),而文本挖掘是分析和處理非結(jié)構(gòu)化數(shù)據(jù)的最關(guān)鍵方法之一,能夠從海量網(wǎng)評數(shù)據(jù)中提取有用的信息,為酒店管理者提供顧客知識。
應(yīng)用文本分析法開展酒店在線評論的研究很多,對本研究具有重要參考意義的研究有對顧客評論中的酒店服務(wù)屬性進(jìn)行識別和分值估計(jì)的算法探索,如ALRABABAH 等[2]提出一種基于多元組(N_gram)和觀點(diǎn)詞典并獨(dú)立于具體領(lǐng)域的方法,使用WordNet 中的詞典編纂器文件識別與特定領(lǐng)域產(chǎn)品密切相關(guān)的特定特征和屬性,實(shí)現(xiàn)特征提?。粚υ诰€文本進(jìn)行情感計(jì)算的相關(guān)研究,如GAO Yingying 等[3]提出了一種用于全面描述情感狀態(tài)的多組分情感模型,將文本級和段落級的情感狀態(tài)作為上下文特征,以擴(kuò)展句子級情感檢測的可用信息,提出一種從文本中提取情感狀態(tài)的方法。KUMAR 等[4]通過機(jī)器學(xué)習(xí)對顧客評論進(jìn)行意見挖掘和情感分析,分別使用樸素貝葉斯分類器、邏輯回歸和SentiWordNet 算法實(shí)現(xiàn)評論極性分類,結(jié)果顯示樸素貝葉斯分類器效率最優(yōu)。ZHAO Zhibin 等[5]提出了一個(gè)面向在線顧客評論的屬性挖掘和情感分析框架,通過使用京東網(wǎng)站上廣泛使用的小型情感和主觀性語料庫對該模型評估后發(fā)現(xiàn)性能良好。
在對文化主題酒店的研究方面,國內(nèi)學(xué)者開展的研究比較豐富,如王姝[6]以蘇州凱悅酒店為案例作分析研究,認(rèn)為酒店增加地域文化特色的設(shè)計(jì)元素能夠提升酒店的文化內(nèi)涵, 不僅可以展示當(dāng)?shù)氐奈幕卣?還可以間接提升酒店的經(jīng)濟(jì)效益。廖豐平[7]對西北隴東窯洞文化酒店開展案例分析研究, 深入探索地域文化特色在酒店室內(nèi)設(shè)計(jì)中的具體應(yīng)用, 倡導(dǎo)酒店室內(nèi)設(shè)計(jì)適當(dāng)融入地域特色, 幫助酒店在聲譽(yù)、品位及經(jīng)濟(jì)效益等方面取得成效。
與筆者研究相近的研究如段冰[8]以紹興市文化主題酒店咸亨酒店為樣本,通過問卷調(diào)查獲得數(shù)據(jù),構(gòu)建并分析顧客滿意度測評模型中各隱變量的路徑系數(shù),結(jié)果發(fā)現(xiàn)文化主題酒店顧客感知質(zhì)量對感知價(jià)值和顧客滿意度的直接正向影響顯著;顧翹楚[9]以蘇州地區(qū)的地域文化型主題酒店作為調(diào)查樣本,發(fā)現(xiàn)地域文化型主題酒店的主題文化表達(dá)與顧客主題氛圍體驗(yàn)、顧客感知價(jià)值和顧客行為傾向之間有正相關(guān)關(guān)系。田彩云等[10]對顧客進(jìn)行線上和線下問卷調(diào)查,研究了中國文化元素在酒店應(yīng)用的顧客感知維度,測算其對顧客感知價(jià)值的影響, 發(fā)現(xiàn)顧客對中國文化元素在酒店感知的維度體現(xiàn)為酒店的中國特色文化產(chǎn)品、中國文化建設(shè)、中式建筑及裝飾、中式服務(wù)和中國文化活動(dòng),以上各維度都對顧客感知的功能價(jià)值產(chǎn)生顯著的正向影響。
以上相近研究均采用傳統(tǒng)的問卷調(diào)查法收集數(shù)據(jù),再通過統(tǒng)計(jì)分析研究我國酒店行業(yè)提供的文化服務(wù)產(chǎn)品,而筆者以顧客生成內(nèi)容為研究數(shù)據(jù),使用文本分析法挖掘顧客購后體驗(yàn)中的重要信息,以求解我國酒店提供的文化體驗(yàn)服務(wù)與顧客情感的相關(guān)性。
筆者從TripAdvisor 網(wǎng)站采集了95 家中國本土中高端(三星級和四星級)酒店共7 575 條中文在線評論數(shù)據(jù),經(jīng)過疑似虛假評論剔除和預(yù)處理等過程,將制作好的在線評論文本語料庫按照三星級文化主題酒店、四星級文化主題酒店、三星級標(biāo)準(zhǔn)酒店和四星級標(biāo)準(zhǔn)酒店分成四個(gè)子語料庫進(jìn)行對比分析,并提出組間對比(文化主題酒店與標(biāo)準(zhǔn)酒店對比)和組內(nèi)屬性對比(文化主題酒店各服務(wù)屬性對比)理論假設(shè)如下:
假設(shè)一(H1):三星級文化主題酒店的顧客情感強(qiáng)度要顯著高于三星級標(biāo)準(zhǔn)酒店的顧客體驗(yàn)情感強(qiáng)度;
假設(shè)二(H2):四星級文化主題酒店的顧客情感強(qiáng)度要顯著高于四星級標(biāo)準(zhǔn)酒店的顧客體驗(yàn)情感強(qiáng)度;
假設(shè)三(H3):三星級文化主題酒店評論中,文化體驗(yàn)屬性觸發(fā)的情感強(qiáng)度要高于其他服務(wù)屬性的情感強(qiáng)度;
假設(shè)四(H4):四星級文化主題酒店評論中,文化體驗(yàn)屬性觸發(fā)的情感強(qiáng)度要高于其他服務(wù)屬性的情感強(qiáng)度。
筆者對文本評論實(shí)施了LDA(Latent Dirichlet Allocation)主題聚類過程,以挖掘顧客評論中關(guān)注的主題,即酒店服務(wù)屬性。在這一過程中,通過LDA 方法常用的困惑度確定最優(yōu)主題數(shù),見圖1。
圖1 LDA 主題數(shù)與困惑度關(guān)系圖
由圖1 可知,根據(jù)最低的困惑度能夠得到文本評論的最優(yōu)主題數(shù)為7,即筆者將選定7 個(gè)酒店服務(wù)屬性進(jìn)行后續(xù)分析。接下來,筆者為每個(gè)單獨(dú)的詞語賦予一個(gè)索引,并使用索引將文檔列表轉(zhuǎn)為文檔—主題(DT)矩陣,利用Gensim 提供的LDA 模型接口輸入DT 矩陣,使每一個(gè)詞項(xiàng)都賦予一個(gè)唯一索引鍵值對序列,建立索引到詞項(xiàng)的映射。然后再創(chuàng)建一個(gè) LDA 對象,輸入選定的最優(yōu)主題數(shù)7 和 DT 矩陣進(jìn)行模型訓(xùn)練,超參數(shù)由模型從訓(xùn)練語料中估計(jì)獲得。根據(jù)最佳主題數(shù)量7 對應(yīng)的LDA 生成模型輸出結(jié)果,每一行包含了主題詞編號和主題詞對應(yīng)關(guān)鍵詞的概率權(quán)重,具體見表1。
表1 LDA 主題模型輸出結(jié)果界面
筆者把輸出各主題下面的關(guān)鍵詞進(jìn)行整理,結(jié)合行業(yè)相關(guān)知識和專業(yè)表達(dá)實(shí)施分類,同時(shí)參考了數(shù)據(jù)源平臺TripAdvisor 提供的酒店服務(wù)分項(xiàng)及以往研究的常見劃分,[11-12]得出了對應(yīng)的主題聚類共7 個(gè)酒店服務(wù)屬性:“房間(room)”“位置(location)”“設(shè)施(facilities)”“員工與服務(wù)(staff & service)”“價(jià)值(value)”“餐飲(food)”以及本文研究對象“中國文化(Chinese culture)”。
通過調(diào)用前一步驟分析得到的酒店服務(wù)7 個(gè)屬性特征詞列表,筆者從制作好的酒店評論子語料庫中提取情感特征詞。為了實(shí)現(xiàn)全面而且盡可能細(xì)粒度的分析,得到每條評論中不同屬性的顧客情感傾向,筆者還需要在每條評論文本中找到情感特征詞對應(yīng)的情感詞,為情感特征的情感傾向計(jì)算做準(zhǔn)備。
一般情況下,情感對象詞對應(yīng)的情感詞可以通過詞性來判斷,根據(jù)語法,情感詞的詞性多為形容詞或者名詞,比如:在評論“酒店裝修很陳舊,但是交通很方便,酒店的服務(wù)也很好,總的來說可推薦”中涉及了多個(gè)服務(wù)屬性的評價(jià),包括“酒店裝修”“交通”“服務(wù)”三個(gè)方面,因此可以把這三者作為情感對象詞,而每個(gè)情感對象詞所對應(yīng)的情感詞分別為形容詞“陳舊”“方便”“好”,從而可識別出用戶對酒店裝修的負(fù)向情感和對酒店交通、服務(wù)的正向情感。為了能夠識別不同情感對象詞對應(yīng)的情感詞,筆者通過BIOES 進(jìn)行情感詞標(biāo)注,從而作為BERT+CRF 模型的標(biāo)簽(label)進(jìn)行模型訓(xùn)練,再通過已有的情感對象詞,使用情感對象詞—情感詞對應(yīng)算法將評論中的每個(gè)情感對象詞和識別出來的情感詞實(shí)施一一對應(yīng),調(diào)用大連理工中文情感詞匯本體詞典實(shí)現(xiàn)情感對象詞(通過特征詞實(shí)現(xiàn))和情感詞強(qiáng)度值的計(jì)算,計(jì)算過程綜合考慮了屬性下的每個(gè)特征詞的強(qiáng)度、出現(xiàn)的頻率,以及屬性下不同特征詞的數(shù)量,以便能夠更好更準(zhǔn)確地表達(dá)出屬性的強(qiáng)度。具體見表2。
表2 情感對象詞—情感詞對應(yīng)算法
通過上述步驟得到了顧客評論中最關(guān)注的酒店服務(wù)屬性和屬性情感強(qiáng)度后,筆者可以對比中國文化屬性與其他服務(wù)屬性下顧客情感強(qiáng)度的差異,以驗(yàn)證本研究的理論假設(shè)。
首先進(jìn)行酒店樣本組間對比驗(yàn)證性分析。筆者分別對文化主題酒店和標(biāo)準(zhǔn)酒店進(jìn)行顧客情感強(qiáng)度構(gòu)建,其中兩類酒店同時(shí)按三星級和四星級分別實(shí)施分析:
顧客的體驗(yàn)情感為顧客在“中國文化”“餐飲”“位置”“房間”“員工與服務(wù)”“設(shè)施”和“價(jià)值(性價(jià)比)”7個(gè)屬性下的情感強(qiáng)度,即attr中國文化、attr餐飲、attr位置、attr房間、attr員工與服務(wù)、attr設(shè)施和attr價(jià)值,針對每一個(gè)樣本,酒店都能夠通過特征詞、情感詞、情感詞的情感強(qiáng)度、特征詞的TF-IDF、去重特征詞出現(xiàn)的詞素來測量該酒店的七個(gè)屬性下的情感強(qiáng)度。
根據(jù)以上分析,分別得到中國文化主題酒店和標(biāo)準(zhǔn)酒店七個(gè)服務(wù)屬性下的情感強(qiáng)度。為了驗(yàn)證假設(shè)一,需要證明兩點(diǎn):(1)文化主題酒店和標(biāo)準(zhǔn)酒店的屬性情感強(qiáng)度是否有顯著性差異;(2)文化主題酒店的屬性情感強(qiáng)度是否顯著高于標(biāo)準(zhǔn)酒店。
筆者采用假設(shè)檢驗(yàn) (hypothesis testing)中的T 檢驗(yàn)來驗(yàn)證上述兩點(diǎn)假設(shè)。T 檢驗(yàn)是用于檢驗(yàn)兩組樣本量較小的連續(xù)性變量,通過t 分布來推斷差異發(fā)生的概率,以判定獨(dú)立樣本平均值是否具有顯著差異的方法。
第一步:拿到已有的兩組酒店的屬性情感強(qiáng)度數(shù)組。
第二步:提出假設(shè):假設(shè)文化主題酒店和標(biāo)準(zhǔn)酒店的屬性情感強(qiáng)度相同(零假設(shè)H0)。用1和2分別表示文化主題酒店和標(biāo)準(zhǔn)酒店的平均屬性情感強(qiáng)度,那么零假設(shè)可以表示為1-2= 0。
第三步:基于當(dāng)前零假設(shè)和當(dāng)前樣本,計(jì)算t-score 值,通過t-score 值比該數(shù)值最極端的值出現(xiàn)的概率來代表抽到目前這個(gè)樣本集更極端的樣本的概率。其計(jì)算公式為:
第四步:判斷當(dāng)前t 值和自由度為6 的t 值界限表,如果t 值大表示拒絕零假設(shè),說明兩個(gè)樣本有差異性,如果t 值小,說明兩個(gè)樣本沒有差異性。
同時(shí),可以通過查看兩組酒店的屬性情感強(qiáng)度分布,以及文化主題酒店的均值、標(biāo)準(zhǔn)差、最大值、最小值、二分位數(shù)、四分位數(shù)等,判斷文化主題酒店和標(biāo)準(zhǔn)酒店顧客情感強(qiáng)度的差異性。
通過上述過程計(jì)算和比較文化主題酒店和標(biāo)準(zhǔn)酒店的各屬性情感強(qiáng)度差異,可得到結(jié)果,具體見表3。
表3 文化主題酒店和標(biāo)準(zhǔn)酒店顧客情感強(qiáng)度差異
由表3 可知,假設(shè)三星級文化主題酒店的屬性情感強(qiáng)度均值與三星級標(biāo)準(zhǔn)酒店的屬性情感強(qiáng)度均值相同,經(jīng)過T 檢驗(yàn),結(jié)果為拒絕原假設(shè);同理,針對四星級文化主題酒店和四星級標(biāo)準(zhǔn)酒店評論屬性情感強(qiáng)度均值進(jìn)行分析,假設(shè)四星級文化主題酒店的屬性情感強(qiáng)度均值與四星級標(biāo)準(zhǔn)酒店的屬性情感強(qiáng)度均值相同,經(jīng)過T 檢驗(yàn),結(jié)果為拒絕原假設(shè)。
分別對中文評論數(shù)據(jù)集文化主題酒店和標(biāo)準(zhǔn)酒店的顧客情感強(qiáng)度作對比分析,先對比三星級文化主題酒店和標(biāo)準(zhǔn)酒店的屬性情感強(qiáng)度,發(fā)現(xiàn)對于三星級酒店樣本組來說,文化主題酒店顧客情感強(qiáng)度的均值標(biāo)準(zhǔn)差、最小值、四分之一分位數(shù)、二分之一分位數(shù)、四分之三分位數(shù)、最大值等均顯著高于標(biāo)準(zhǔn)酒店。再對比四星級文化主題酒店和標(biāo)準(zhǔn)酒店的屬性情感強(qiáng)度,同理對比均值標(biāo)準(zhǔn)差、最小值、四分之一分位數(shù)、二分之一分位數(shù)、四分之三分位數(shù)、和最大值,都是四星級文化主題酒店情感強(qiáng)度比四星級標(biāo)準(zhǔn)酒店的情感強(qiáng)度要高。因此從實(shí)現(xiàn)而言,可以說明文化主題酒店的屬性情感強(qiáng)度與標(biāo)準(zhǔn)酒店的屬性情感強(qiáng)度相比具有顯著差異性,并且文化主題酒店顧客體驗(yàn)的情感強(qiáng)度高于標(biāo)準(zhǔn)酒店,具體見圖2(a, b)。
圖2 酒店評論顧客情感強(qiáng)度組間對比
通過以上分析得出,文化主題酒店的屬性情感強(qiáng)度與標(biāo)準(zhǔn)酒店的屬性情感強(qiáng)度相比具有顯著差異性,假設(shè)一(H1)得到證明:三星級文化主題酒店的顧客體驗(yàn)(7 個(gè)屬性下)情感強(qiáng)度要顯著高于標(biāo)準(zhǔn)酒店的顧客體驗(yàn)情感強(qiáng)度;假設(shè)二(H2)得到證明:四星級文化主題酒店的顧客體驗(yàn)(7 個(gè)屬性下)情感強(qiáng)度要顯著高于標(biāo)準(zhǔn)酒店的顧客體驗(yàn)情感強(qiáng)度。
其次對不同星級的文化主題酒店進(jìn)行組內(nèi)屬性對比分析。酒店的服務(wù)屬性有7 個(gè),因此需要驗(yàn)證“中國文化”屬性的情感強(qiáng)度顯著高于其他屬性的情感強(qiáng)度,即需要驗(yàn)證“中國文化”屬性的顧客情感強(qiáng)度與整體情感強(qiáng)度的相關(guān)性要大于其他屬性顧客情感強(qiáng)度與整體情感強(qiáng)度的相關(guān)性。
為了進(jìn)行上述驗(yàn)證,現(xiàn)定義所有屬性的綜合情感強(qiáng)度為所有屬性下的特征詞情感強(qiáng)度之和,找到所有屬性下共有的特征詞強(qiáng)度并提取出來,作為該屬性下的特征詞強(qiáng)度,然后提取7 個(gè)屬性下各自維度共有的特征詞,構(gòu)建出屬性特征矩陣,采用皮爾森相關(guān)系數(shù)(也稱皮爾森積矩相關(guān)系數(shù),Pearson Product-moment Correlation Coefficient),計(jì)算出每個(gè)屬性對綜合屬性情感強(qiáng)度的相關(guān)性,絕對值越大說明該屬性相對其他屬性而言,屬性的強(qiáng)度越大,影響度就越大,同時(shí)還可以分析每個(gè)屬性下特征詞的情感強(qiáng)度分布,方法同上一步分析,計(jì)算最大值、最小值、平均值、分位數(shù)值等,具體見圖3(a,b)。
圖3 文化主題酒店評論各屬性情感強(qiáng)度對比
按照上述計(jì)算分析過程得出的結(jié)果, 通過觀察圖3a 可以發(fā)現(xiàn):文化主題三星級酒店的評論數(shù)據(jù)集中,中國文化屬性與顧客總體情感強(qiáng)度的相關(guān)性最高,為0.597,假設(shè)三(H3)得到證明:三星級文化主題酒店評論中,文化體驗(yàn)屬性觸發(fā)的情感強(qiáng)度要顯著高于其他服務(wù)屬性的情感強(qiáng)度。
從圖3b 中可以觀察到,文化主題四星級酒店的評論數(shù)據(jù)集中,房間屬性與顧客總體情感強(qiáng)度的相關(guān)性最高,為0.703,假設(shè)四(H4)“四星級文化主題酒店評論中,文化體驗(yàn)屬性觸發(fā)的情感強(qiáng)度要高于其他服務(wù)屬性的情感強(qiáng)度”沒有得到證明,根據(jù)判斷,這一結(jié)果具有合理性,在文化主題酒店組內(nèi)對比中,四星級酒店的房間設(shè)施顯然優(yōu)于三星級酒店,但中國文化屬性與顧客總體情感強(qiáng)度的相關(guān)性僅次于房間屬性,為0.371,是與顧客總體情感強(qiáng)度相關(guān)性排第二位的重要屬性,即文化主題四星級酒店的中國文化屬性與顧客評論總體情感強(qiáng)度相關(guān)度依然很高,高于酒店設(shè)施、員工與服務(wù)、位置、餐飲和價(jià)值等功能屬性。
綜上所述,筆者通過采集我國中高端酒店的在線中文文本評論并實(shí)施細(xì)粒度情感分析,挖掘出三星級和四星級酒店不同屬性的情感強(qiáng)度情況,并通過T 檢驗(yàn)證明了文化主題酒店的顧客情感體驗(yàn)(情感強(qiáng)度)要高于標(biāo)準(zhǔn)酒店的顧客情感體驗(yàn),進(jìn)而通過皮爾森相關(guān)性證明了文化主題酒店中國文化屬性的強(qiáng)度與總體顧客情感強(qiáng)度具有高度相關(guān)性,其中三星級酒店評論數(shù)據(jù)集的中國文化屬性與顧客總體情感強(qiáng)度要高于其他服務(wù)屬性,四星級酒店評論數(shù)據(jù)集的中國文化屬性與顧客總體情感強(qiáng)度僅次于房間屬性,高于其他服務(wù)屬性。
筆者通過研究得出以下結(jié)論:我國文化主題酒店的文化體驗(yàn)對顧客情感強(qiáng)度影響顯著,從顧客情感測量角度而言,酒店管理者將中國本土文化元素納入產(chǎn)品設(shè)計(jì)體系符合商業(yè)邏輯。筆者研究樣本中的中國文化主題酒店通過文化體驗(yàn)有效地促進(jìn)了顧客的情感強(qiáng)度,有的在建筑外觀、院落、大堂、廊道和客房陳設(shè)等方面全方位呈現(xiàn)濃厚的中國文化色彩(如四星級酒店),有的則低調(diào)地演繹當(dāng)?shù)匚幕瘍?nèi)核,如特色家具、裝飾、寢具、盥洗用具和手工藝品等(如三星級酒店),可見打造文化體驗(yàn)并非意味著高成本投入。在文旅融合的行業(yè)戰(zhàn)略背景下,管理者提煉與其酒店契合的文化要素,設(shè)計(jì)符合客群期待的文化體驗(yàn),提升客群吸引力,是我國文化強(qiáng)國戰(zhàn)略下具有現(xiàn)實(shí)可行性的產(chǎn)業(yè)發(fā)展創(chuàng)新路徑。[13]
當(dāng)然,本研究的實(shí)施還存在一定局限性,樣本數(shù)據(jù)均采集于新冠疫情前,因此得出的分析結(jié)論有待于加入新冠疫情后的評論數(shù)據(jù)再加以驗(yàn)證和修正,這將納入后續(xù)開展的研究當(dāng)中。盡管如此,筆者希望通過此研究發(fā)現(xiàn)能夠?yàn)楹笠咔闀r(shí)代的中國酒店產(chǎn)品設(shè)計(jì)和價(jià)值重構(gòu)提供實(shí)證參考。