郭億琦,張星海,趙志杰,趙全盛
(哈爾濱商業(yè)大學(xué)a.計(jì)算機(jī)與信息工程學(xué)院;b.黑龍江省電子商務(wù)與信息處理重點(diǎn)實(shí)驗(yàn)室,哈爾濱 150028)
目前酒店行業(yè)競(jìng)爭(zhēng)非常激烈,要想在其中脫穎而出,則需要重視顧客滿意度。顧客滿意度是評(píng)估酒店績(jī)效的重要“晴雨表”,因此深入了解顧客在住宿過(guò)程中的感受對(duì)酒店管理至關(guān)重要。隨著信息技術(shù)的快速發(fā)展,在線預(yù)訂和評(píng)論越來(lái)越受顧客的歡迎。許多顧客在網(wǎng)上預(yù)訂酒店,在入住后以圖片、文本和評(píng)級(jí)的形式發(fā)布評(píng)論,向商家做出此次體驗(yàn)滿意程度的反饋。挖掘在線評(píng)論中蘊(yùn)含的信息,從而為顧客提供個(gè)性化的服務(wù)會(huì)對(duì)酒店總體評(píng)價(jià)和形象造成的重要影響。先前的研究已經(jīng)發(fā)現(xiàn)在線評(píng)論文本的情感和顧客滿意度評(píng)級(jí)高度相關(guān)。然而,在線評(píng)論的其他表達(dá)形式,如圖片的數(shù)量、評(píng)論文本長(zhǎng)度、圖片和文本之間的相似度與顧客滿意度評(píng)級(jí)之間的關(guān)系尚不明確。本研究通過(guò)分析在線評(píng)論內(nèi)容的文本長(zhǎng)度、上傳的圖片數(shù)量以及圖片和文本間的相似性三個(gè)維度與顧客滿意度評(píng)級(jí)的關(guān)系,來(lái)了解顧客對(duì)酒店住宿體驗(yàn)的總體評(píng)價(jià),幫助酒店商家和在線預(yù)定平臺(tái)從在線評(píng)論中獲得顧客體驗(yàn)的描述和其他信息,以此更好設(shè)計(jì)評(píng)論系統(tǒng),激勵(lì)顧客撰寫高質(zhì)量的評(píng)論,使商家根據(jù)顧客的在線評(píng)論內(nèi)容和滿意度評(píng)級(jí)來(lái)改進(jìn)產(chǎn)品和服務(wù)。
在線評(píng)論是發(fā)生在消費(fèi)行為之后的體驗(yàn)反饋,以文本或圖片的形式存在并對(duì)企業(yè)口碑產(chǎn)生影響,是潛在消費(fèi)者消費(fèi)決策的重要參考信息,也是企業(yè)對(duì)未來(lái)發(fā)展的考量信息。徐虹(2016)通過(guò)研究攜程網(wǎng)中的游客對(duì)真實(shí)體驗(yàn)的在線評(píng)論,來(lái)剖析什么是卓越的顧客體驗(yàn)這一概念。該學(xué)者在第二年提出游客體驗(yàn)質(zhì)量可以正向影響游客的行為意志。該研究有助于旅游地管理者改善服務(wù)滿足不同游客群體的體驗(yàn)需求。
顧客滿意的早期研究可追溯到20 世紀(jì)30 年代在社會(huì)和實(shí)驗(yàn)心理學(xué)領(lǐng)域?qū)M意理論的研究探索。1985年,美國(guó)消費(fèi)心理學(xué)家首次提出顧客滿意度理論,其后在發(fā)達(dá)國(guó)家得到迅速?gòu)V泛的傳播和運(yùn)用。相較于歐美國(guó)家成熟的研究體系,我國(guó)在顧客滿意研究方面具有起步晚、發(fā)展快的特點(diǎn)。隨著市場(chǎng)化改革的深入及行業(yè)競(jìng)爭(zhēng)的加劇,我國(guó)企業(yè)也逐漸意識(shí)到保持顧客、留住顧客的重要性。根據(jù)Oliver(1980)的研究認(rèn)為,顧客滿意指的是一種態(tài)度,是客戶根據(jù)他們對(duì)產(chǎn)品或服務(wù)的期望以及他們對(duì)實(shí)際收到的產(chǎn)品或服務(wù)的感覺(jué)而形成的評(píng)價(jià)。
許多關(guān)鍵因素導(dǎo)致顧客滿意。Gu and Ryan(2008)發(fā)現(xiàn)了對(duì)顧客整體滿意度有積極影響的七個(gè)因素:床的舒適度、浴室設(shè)施的清潔度、房間的大小和設(shè)施的狀況、位置和可及性、食物和飲料的質(zhì)量、輔助服務(wù)和員工表現(xiàn)。同樣的,Ren et al.(2016)將顧客滿意度的來(lái)源歸納為四個(gè)維度:有形及感官體驗(yàn)、員工績(jī)效、美感和位置。除了酒店提供的核心屬性和服務(wù)之外,一些附帶的行為也可能導(dǎo)致客戶滿意,包括企業(yè)社會(huì)責(zé)任實(shí)踐和可持續(xù)實(shí)踐。
與文字評(píng)論相比,發(fā)布帶有圖片的評(píng)論需要顧客的操作步驟更加復(fù)雜,顧客需要付出更多的時(shí)間和精力。憑借在線評(píng)論中上傳的圖片內(nèi)容,使?jié)撛谙M(fèi)者對(duì)酒店設(shè)施有更真實(shí)的了解,提高評(píng)論信息的傳遞效果。同時(shí),顧客發(fā)布的圖片評(píng)論內(nèi)容是利用移動(dòng)設(shè)備及時(shí)拍攝的,反映的商品或服務(wù)較真實(shí)。上傳較多圖片的顧客有更多的經(jīng)驗(yàn),對(duì)酒店實(shí)際情況有更強(qiáng)的客觀性。因此,提出以下假設(shè):
H1:在線評(píng)論中上傳圖片數(shù)量對(duì)顧客滿意度有正向影響。
與對(duì)酒店產(chǎn)品和服務(wù)的積極方面的描述相比,顧客傾向于發(fā)表較長(zhǎng)的文本,對(duì)其消極方面進(jìn)行更詳細(xì)的描述。評(píng)論文本越長(zhǎng),表明顧客在評(píng)論產(chǎn)品和服務(wù)時(shí)投入的精力越多。這通常發(fā)生在他們經(jīng)歷負(fù)面消費(fèi)情緒時(shí)。當(dāng)消費(fèi)者遇到產(chǎn)品和服務(wù)的缺點(diǎn)時(shí),他們會(huì)使用更多的詞語(yǔ)來(lái)表達(dá)他們的沮喪、憤怒和沮喪。因此,提出以下假設(shè):
H2:在線評(píng)論中評(píng)論文本長(zhǎng)度對(duì)顧客滿意度有負(fù)面影響。
圖片作為酒店產(chǎn)品和服務(wù)的模擬物,真實(shí)呈現(xiàn)了酒店產(chǎn)品和服務(wù)的情況,說(shuō)明顧客對(duì)圖片的感知分析與真實(shí)產(chǎn)品的感知分析相似。文本能夠準(zhǔn)確描述酒店產(chǎn)品和服務(wù)的真實(shí)體驗(yàn),表達(dá)對(duì)酒店入住的總體感受,當(dāng)二者在內(nèi)容上呈現(xiàn)相似時(shí),會(huì)使二者的積極情感作用都得到增強(qiáng)。因此,提出以下假設(shè):
H3:在線評(píng)論中圖片和文本相似度對(duì)顧客滿意度有正面影響。
旅行電子商務(wù)發(fā)展至今,可提供網(wǎng)絡(luò)評(píng)論數(shù)據(jù)的專業(yè)網(wǎng)站數(shù)不勝數(shù)。從競(jìng)爭(zhēng)格局來(lái)看,在線旅游市場(chǎng)呈現(xiàn)“一超多強(qiáng)”格局。2020 年攜程在線旅游(OTA)市場(chǎng)份額達(dá)40.7%,排名榜首,遙遙領(lǐng)先主要競(jìng)爭(zhēng)對(duì)手。攜程作為全球三大在線旅游平臺(tái)之一,業(yè)務(wù)恢復(fù)率也顯著快于Booking 及Expedia。此外,去哪兒旅行、美團(tuán)及同程旅行穩(wěn)居第二梯隊(duì),競(jìng)爭(zhēng)力較強(qiáng)。從在線旅游(OTA)整體來(lái)看,攜程旅行占據(jù)主導(dǎo)地位。對(duì)于五星級(jí)和四星級(jí)這類高端酒店的客戶群體來(lái)說(shuō),他們對(duì)酒店的基礎(chǔ)設(shè)施有一定的信任度,因此對(duì)評(píng)論中有關(guān)夸贊酒店的評(píng)論對(duì)消費(fèi)者的價(jià)值不會(huì)很大。相反,對(duì)于三星級(jí)以下中低端酒店的客戶群體,由于希望通過(guò)瀏覽在線評(píng)論來(lái)更多地了解該酒店體驗(yàn),因此會(huì)對(duì)評(píng)論內(nèi)容更加敏感。基于此,本文選取攜程網(wǎng)上北京地區(qū)的三星級(jí)酒店為例,酒店的價(jià)格處在150—200 元之間,屬于中間水平。在確定研究樣本后,本研究使用Python 工具爬取酒店在線評(píng)論數(shù)據(jù),包括在線評(píng)論文本、圖片以及每個(gè)顧客的滿意度評(píng)分。通過(guò)刪除重復(fù)值等預(yù)處理操作,共得到樣本數(shù)據(jù)4 086 條。
本文利用機(jī)器學(xué)習(xí)算法編寫程序?qū)υ诰€評(píng)論上傳圖片顏色、紋理和形狀視覺(jué)特征進(jìn)行提取。單一的圖片基礎(chǔ)特征有時(shí)候并不能反映圖片的真實(shí)面貌,因?yàn)殛P(guān)注一種圖片信息的同時(shí)有可能會(huì)忽略其他信息,所以,從顏色、紋理和形狀三個(gè)維度出發(fā),通過(guò)信息的互補(bǔ)效應(yīng),可以全面充分展示在下評(píng)論圖片中的酒店產(chǎn)品和服務(wù)信息。最終提取的圖片特征包括:顏色直方圖1×256維,HOG 1×144 維,LBP 1×256 維,融合得到 656 維的特征矩陣。
潛在狄利克雷分布(Latent Dirichlet Allocation,LDA)由 Blei,David M.、Ng,Andrew Y.、Jordan(2003)提出,用來(lái)推測(cè)文本的主題分布。它可以將每條在線評(píng)論文本的主題以概率分布的形式給出,從而通過(guò)算法抽取出它們的主題分布,之后便可以根據(jù)主題分布進(jìn)行主題聚類或分類。LDA 通過(guò)詞匯的概率分布來(lái)反映主題。對(duì)于在線評(píng)論文本語(yǔ)料庫(kù)按照LDA 模型原理提取文字主題特征。
基于圖片和文本對(duì)酒店產(chǎn)品和服務(wù)的特征矩陣,本文通過(guò)計(jì)算兩個(gè)特征矩陣之間的歐式距離來(lái)度量圖片和文本的相似度。歐式距離是最常見的距離度量,衡量的是多維空間中兩個(gè)點(diǎn)之間的絕對(duì)距離。即m 維空間中兩個(gè)點(diǎn)之間的真實(shí)距離,或者該點(diǎn)到原點(diǎn)的距離。在二維和三維空間中的歐式距離就是兩點(diǎn)之間的實(shí)際距離。具體如公式1 所示。
本文以在線評(píng)論的上傳圖片數(shù)量、評(píng)論文本長(zhǎng)度、圖片和文本相似度作為自變量,以顧客滿意度評(píng)分(1—5 分)作為因變量,構(gòu)建多元線性回歸模型?;貧w分析是對(duì)變量間的線性關(guān)系進(jìn)行分析。本文將使用SPSS23 軟件對(duì)各變量進(jìn)行回歸分析,檢驗(yàn)假設(shè)H1,假設(shè)H2,假設(shè)H3,以探究在線評(píng)論內(nèi)容維度與顧客滿意度之間的關(guān)系。多元線性回歸分析結(jié)果如表1 所示。
表1 回歸分析
分析結(jié)果顯示,在線評(píng)論圖片和文本相似度的顯著性為0.03,上傳圖片數(shù)量的顯著性為0.00,評(píng)論文本長(zhǎng)度的顯著性為0.00,表明3 個(gè)自變量均與顧客滿意度存在顯著相關(guān)性。其中評(píng)論文本長(zhǎng)度的系數(shù)為負(fù)值,說(shuō)明評(píng)論文本長(zhǎng)度與顧客滿意度呈負(fù)相關(guān),假設(shè)H1、假設(shè)H2、假設(shè)H3 均得到支持。VIF 均小于10,說(shuō)明3 個(gè)自變量之間不存在多重共線性問(wèn)題。因此,可以得出3 個(gè)自變量對(duì)顧客滿意度的回歸方程為:
總體滿意度=0.048×圖文相似度-0.02×評(píng)論文本長(zhǎng)度+0.045×圖片數(shù)量
1.酒店和在線預(yù)定平臺(tái)對(duì)顧客發(fā)布在線評(píng)論時(shí)上傳圖片采取激勵(lì)措施。根據(jù)研究結(jié)果,在線評(píng)論的上傳圖片數(shù)量對(duì)顧客滿意度存在正向影響。這啟示商家應(yīng)該充分重視圖片評(píng)論的重要性,為激勵(lì)顧客多上傳圖片而采取強(qiáng)有力的措施;并優(yōu)化顧客發(fā)布帶有圖片的評(píng)論機(jī)制,簡(jiǎn)化步驟,為顧客便捷地發(fā)布圖片評(píng)論創(chuàng)造條件,如在酒店網(wǎng)站或在線平臺(tái)上開辟專門用于顧客發(fā)布圖片評(píng)論的網(wǎng)絡(luò)空間、簡(jiǎn)化在線評(píng)論的圖片編輯上傳界面、對(duì)上傳多張真實(shí)的酒店圖片給予發(fā)放優(yōu)惠券等獎(jiǎng)勵(lì)。
2.對(duì)顧客發(fā)布圖文結(jié)合的在線評(píng)論內(nèi)容進(jìn)行合理排版,鼓勵(lì)顧客發(fā)布圖文結(jié)合的在線評(píng)論內(nèi)容,爭(zhēng)取在有限的評(píng)論空間內(nèi)充分展示酒店產(chǎn)品和服務(wù),從而更好為消費(fèi)者了解產(chǎn)品信息提供參考。