劉鑫玥 邱燦華
(同濟(jì)大學(xué)經(jīng)濟(jì)與管理學(xué)院,上海 200092)
“互聯(lián)網(wǎng)+”推動(dòng)傳統(tǒng)產(chǎn)業(yè)轉(zhuǎn)型升級(jí),掀起數(shù)字化浪潮,大量在線(xiàn)旅游平臺(tái)也應(yīng)運(yùn)而生。越來(lái)越多的游客會(huì)撰寫(xiě)評(píng)論記錄旅行體驗(yàn),表達(dá)真實(shí)想法與直觀感受。隨著在線(xiàn)評(píng)論影響力的增加與文本分析技術(shù)的發(fā)展,很多學(xué)者開(kāi)始研究評(píng)論文本。然而,在旅游領(lǐng)域,通過(guò)文本評(píng)論追蹤游客滿(mǎn)意度的研究較少,并且影響游客滿(mǎn)意度的因素是不同的,每個(gè)方面都需要單獨(dú)考慮。已有研究大多只關(guān)注了促使游客滿(mǎn)意的相關(guān)因素,很少關(guān)注造成游客不滿(mǎn)意的因素。針對(duì)這些局限,本研究旨在利用用戶(hù)生成內(nèi)容發(fā)現(xiàn)促使游客滿(mǎn)意和造成游客不滿(mǎn)意的關(guān)鍵因素,為景區(qū)發(fā)展提供明確方向。
已有眾多研究關(guān)注影響游客滿(mǎn)意度的因素,亞伯拉罕·皮扎姆(Abraham Pizam)首先將顧客滿(mǎn)意概念應(yīng)用到旅游領(lǐng)域研究中,提出游客滿(mǎn)意度是游客對(duì)旅游目的地的預(yù)期和真實(shí)體驗(yàn)進(jìn)行比較后而產(chǎn)生的綜合評(píng)價(jià)[1]。大衛(wèi)·鮑文(David Bowen)將期望、績(jī)效、特征、情緒、公平、不一致6 個(gè)方面作為影響因素納入游客滿(mǎn)意度的研究[2]。索文·哈恩(Sowon Hahn)等采取實(shí)地調(diào)查方法對(duì)游客滿(mǎn)意度進(jìn)行研究,結(jié)果表明,在旅游項(xiàng)目開(kāi)始之前提供額外的信息可以提高游客滿(mǎn)意度[3]。
已有研究大多通過(guò)設(shè)置滿(mǎn)意度綜合評(píng)價(jià)指數(shù)檢測(cè)游客滿(mǎn)意度,將低得分視為不滿(mǎn)意,而忽略了不滿(mǎn)意因素,這就使得研究將導(dǎo)致游客滿(mǎn)意度低的因素視為不滿(mǎn)意影響因素。根據(jù)弗雷德里克·赫茲伯格(Fredrick Herzberg)的雙因素激勵(lì)理論[4],滿(mǎn)意和不滿(mǎn)意是兩個(gè)獨(dú)立的因素,可能同時(shí)存在于顧客體驗(yàn)中。由于造成顧客滿(mǎn)意和不滿(mǎn)意的因素并不相同,分別研究造成游客滿(mǎn)意與不滿(mǎn)意的因素十分必要。目前,只有少數(shù)旅游領(lǐng)域研究分別討論滿(mǎn)意與不滿(mǎn)意因素,這一領(lǐng)域還存在很大的局限性,需要進(jìn)一步研究[1]。
本文以上海市為例,根據(jù)《上海旅游資源圖志》對(duì)上海旅游資源的分類(lèi)標(biāo)準(zhǔn)[5],結(jié)合景區(qū)的實(shí)際特征,將上海市景區(qū)分為5 類(lèi),并從5 個(gè)類(lèi)別中選擇熱門(mén)景區(qū)進(jìn)行研究(見(jiàn)表1)。
表1 上海市景區(qū)分類(lèi)信息
本文選擇在攜程旅行網(wǎng)獲得景區(qū)評(píng)論。在2022年4 月通過(guò)八爪魚(yú)采集器,選取表1 中的25 個(gè)景區(qū)為研究對(duì)象,對(duì)其在攜程旅行網(wǎng)上的評(píng)論內(nèi)容進(jìn)行爬取,最終收集24 788 條評(píng)論。使用Python 進(jìn)行數(shù)據(jù)預(yù)處理。首先,過(guò)濾掉所有非中文評(píng)論,去除重復(fù)的評(píng)論文本;其次,過(guò)濾文本中出現(xiàn)的數(shù)字、標(biāo)點(diǎn)符號(hào)、停用詞等;最后,使用jieba 庫(kù)對(duì)文本數(shù)據(jù)進(jìn)行分詞處理。
情感分析是自然語(yǔ)言處理領(lǐng)域的一項(xiàng)重要任務(wù),利用計(jì)算機(jī)程序自動(dòng)分析文本內(nèi)容的情感極性,包含積極、消極與中性。情感極性可以反映顧客滿(mǎn)意度,本文認(rèn)為積極評(píng)論表示游客滿(mǎn)意,而消極評(píng)論則代表游客不滿(mǎn)意。使用Python 的SnowNLP 情感分析工具包對(duì)評(píng)論文本進(jìn)行情感分析。在進(jìn)行情感分析時(shí),輸出的情感極性值范圍為0 ~1,取值在0.5 及以上的為積極評(píng)論,0.5 以下的為消極評(píng)論,且數(shù)值越接近1 表示評(píng)論越積極,越接近0 則越消極。為確保樣本均衡,應(yīng)使積極與消極評(píng)論數(shù)量相等。由于積極評(píng)論數(shù)量遠(yuǎn)遠(yuǎn)大于消極評(píng)論數(shù)量,應(yīng)先確定每個(gè)景區(qū)中的消極評(píng)論數(shù)量,之后隨機(jī)選擇該景區(qū)同等數(shù)量的積極評(píng)論。
使用LDA 主題模型進(jìn)行分析時(shí),需要確定最優(yōu)主題數(shù)量。本文選擇困惑度和一致性作為評(píng)價(jià)指標(biāo)。困惑度指標(biāo)量化了文本所屬主題的不確定程度,困惑度越低則主題數(shù)量越優(yōu)[6]。一致性指標(biāo)衡量了模型生成的每個(gè)主題所對(duì)應(yīng)的高頻率詞語(yǔ)在語(yǔ)義上的一致性,數(shù)值越高則模型效果越好[7]。使用Python的Gensim 庫(kù)得到不同主題數(shù)量的模型評(píng)價(jià)結(jié)果(見(jiàn)圖1)。綜合比較兩個(gè)指標(biāo),最終選擇積極評(píng)論的主題數(shù)量為15,消極評(píng)論的主題數(shù)量為12。
圖1 LDA 主題數(shù)量
使用Python 的Gensim 庫(kù)分別對(duì)積極評(píng)論與消極評(píng)論構(gòu)建主題模型,得到積極評(píng)論的15 個(gè)主題和消極評(píng)論的12 個(gè)主題分布。根據(jù)各主題的高頻率關(guān)鍵詞,以及各主題最具代表性的前15 條評(píng)論文本,采用人工方式總結(jié)各主題名稱(chēng),結(jié)果如表2 所示。
表2 主題分析結(jié)果
參照國(guó)內(nèi)外游客滿(mǎn)意度評(píng)價(jià)指標(biāo)研究,將得到的主題進(jìn)一步分為4 類(lèi),包括旅游吸引物、景區(qū)服務(wù)與設(shè)施、景區(qū)管理和旅游體驗(yàn),具體如表3 所示。
表3 主題分類(lèi)
積極評(píng)論中,游客更多評(píng)論旅游吸引物,即旅游吸引物可以帶來(lái)滿(mǎn)意的旅游經(jīng)歷。消極評(píng)論中游客更多提及景區(qū)服務(wù)與設(shè)施,即景區(qū)服務(wù)與設(shè)施是造成游客不滿(mǎn)意的主要因素。
旅游吸引物方面,上海有眾多具有人文內(nèi)涵的歷史文化景區(qū),游客能體會(huì)到傳統(tǒng)文化的魅力。此外,觀賞自然風(fēng)光也是游客主要的旅游動(dòng)機(jī)。上海商業(yè)氛圍濃厚,可以滿(mǎn)足游客吃喝玩樂(lè)的需求。游客還提到建筑樓群。例如,上海外灘上佇立著眾多古典復(fù)興大樓,給游客帶來(lái)了獨(dú)特體驗(yàn)。消極評(píng)論中,一些網(wǎng)紅景區(qū)的過(guò)度營(yíng)銷(xiāo)造成實(shí)景與照片不符,密集的人流會(huì)導(dǎo)致游客抱怨。游客還評(píng)論到一些景區(qū)缺乏特色亮點(diǎn),千篇一律的項(xiàng)目會(huì)造成游客不滿(mǎn)。
景區(qū)服務(wù)與設(shè)施方面,積極和消極評(píng)論中都包含服務(wù)態(tài)度。積極評(píng)論中,游客強(qiáng)調(diào)了工作人員熱情好客的服務(wù)態(tài)度;相反,消極評(píng)論中,游客抱怨工作人員服務(wù)質(zhì)量低下。此外,游客表明景區(qū)內(nèi)明顯的引導(dǎo)標(biāo)志可以減少時(shí)間浪費(fèi),增加游覽觀光的舒適度。設(shè)施方面,消極評(píng)論中尤其提到設(shè)施老舊問(wèn)題,嚴(yán)重影響了參觀體驗(yàn)。換票方面,游客認(rèn)為在換票時(shí)需要長(zhǎng)時(shí)間排隊(duì)很麻煩。餐飲方面,游客抱怨景區(qū)內(nèi)餐廳味道一般而價(jià)格很高。
對(duì)于5 個(gè)不同的景區(qū)類(lèi)型,本文構(gòu)建了積極評(píng)論和消極評(píng)論主題分布特征圖(見(jiàn)圖2 和圖3),據(jù)此得出促進(jìn)游客滿(mǎn)意和導(dǎo)致游客不滿(mǎn)意影響的評(píng)論側(cè)重點(diǎn)有何不同。
圖2 積極評(píng)論主題分布特征
積極評(píng)論中,參觀名勝古跡的游客更多評(píng)論了歷史文化和交通便利,而較少評(píng)論價(jià)格水平與親子同樂(lè)。游覽城市觀光類(lèi)景區(qū)的游客更多寫(xiě)到交通便利和景區(qū)的商業(yè)化水平。在主題樂(lè)園游玩的游客更加在意體驗(yàn)感和價(jià)格水平,很少關(guān)注建筑樓群。在動(dòng)植物園游玩的游客更多評(píng)論了自然風(fēng)光和服務(wù)態(tài)度,很少評(píng)論歷史文化和體驗(yàn)感。參觀展館展覽的游客明顯寫(xiě)到了親子同樂(lè)和環(huán)境衛(wèi)生帶來(lái)的滿(mǎn)意經(jīng)歷。
消極評(píng)論中,參觀名勝古跡的游客較少提到設(shè)施老舊問(wèn)題,更多在意景區(qū)餐飲問(wèn)題。游覽城市觀光類(lèi)景區(qū)的游客更多抱怨了項(xiàng)目排隊(duì)和網(wǎng)紅地打卡的不愉快經(jīng)歷,而很少評(píng)論景區(qū)餐飲問(wèn)題。在主題樂(lè)園游玩的游客更多抱怨了工作人員的服務(wù)態(tài)度和項(xiàng)目關(guān)閉問(wèn)題,很少關(guān)注樂(lè)園的特色亮點(diǎn)。在動(dòng)植物園游玩的游客更多評(píng)論了意外天氣狀況帶來(lái)的遺憾經(jīng)歷,較少寫(xiě)到景區(qū)氛圍相關(guān)內(nèi)容。參觀展館展覽的游客更多評(píng)論了設(shè)施老舊問(wèn)題,對(duì)價(jià)格水平和景區(qū)氛圍不滿(mǎn)意,而很少提到項(xiàng)目關(guān)閉與天氣狀況。
本文基于游客評(píng)論,根據(jù)情感得分將評(píng)論劃分為積極評(píng)論與消極評(píng)論,之后運(yùn)用LDA 模型挖掘游客評(píng)論中的關(guān)鍵信息,得到了積極評(píng)論的15 個(gè)主題和消極評(píng)論的12 個(gè)主題,再通過(guò)分析5 個(gè)不同類(lèi)型景區(qū)的評(píng)論主題分布特征,得到了不同類(lèi)型游客的側(cè)重點(diǎn),為游客滿(mǎn)意度研究提供更全面的見(jiàn)解。
從文本挖掘的結(jié)果可以看出,積極評(píng)論的主題更多集中在旅游吸引物,證明旅游吸引物可以帶來(lái)滿(mǎn)意的旅游經(jīng)歷。消極評(píng)論的主題主要集中在景區(qū)服務(wù)與設(shè)施,可見(jiàn)景區(qū)服務(wù)與設(shè)施是造成游客不滿(mǎn)意的主要因素。因此,景區(qū)應(yīng)重視旅游吸引物建設(shè),利用景區(qū)的歷史文化內(nèi)涵、優(yōu)美的自然風(fēng)光等提升游客滿(mǎn)意度。同時(shí),景區(qū)應(yīng)加強(qiáng)工作人員培訓(xùn),提高服務(wù)質(zhì)量,注重景區(qū)內(nèi)設(shè)施的更新維護(hù)工作,以減少造成游客不滿(mǎn)意的因素。