林 靜 Nadezda Sorokina
又松大學(xué)旅游管理學(xué)院,韓國(guó)大田 34606
隨著互聯(lián)網(wǎng)的快速發(fā)展和智能手機(jī)的廣泛使用,社交媒體成為人們獲取信息和分享經(jīng)驗(yàn)的主要來(lái)源。在旅行前,社交媒體上的旅游評(píng)論對(duì)潛在游客感知旅游目的地和制定旅游決策至關(guān)重要。大型旅游推薦網(wǎng)站,如貓途鷹(TripAdvisor)、繽客(Booking)、攜程(Ctrip)等,通過(guò)呈現(xiàn)數(shù)以萬(wàn)計(jì)的評(píng)論,創(chuàng)造了大量?jī)r(jià)值信息,為游客提供了一個(gè)分享和比較旅游產(chǎn)品和服務(wù)的平臺(tái)。這些在線(xiàn)信息對(duì)學(xué)術(shù)界和旅游從業(yè)者都是極具價(jià)值的,首先,旅游評(píng)論是游客體驗(yàn)的自發(fā)呈現(xiàn),未受其他因素干擾,數(shù)據(jù)真實(shí)度高,游客更傾向于信任網(wǎng)絡(luò)評(píng)論,勝于商家宣傳;其次,專(zhuān)業(yè)人士可以通過(guò)處理評(píng)論數(shù)據(jù)來(lái)系統(tǒng)預(yù)測(cè)游客意圖和滿(mǎn)意度,為游客提供情報(bào),或幫助旅游主管部門(mén)提高客戶(hù)關(guān)系質(zhì)量和產(chǎn)品體驗(yàn)。
現(xiàn)有旅游文獻(xiàn)中很少有通過(guò)數(shù)據(jù)挖掘方法比較相似遺產(chǎn)地景區(qū)的研究,并且游客評(píng)論的特征可視化在商業(yè)應(yīng)用中仍處于起步階段。本研究試圖使用數(shù)據(jù)可視化工具來(lái)梳理兩個(gè)長(zhǎng)城景區(qū)在國(guó)外游客評(píng)論中的顯著特征和特征關(guān)系來(lái)揭示兩者呈現(xiàn)的具體差異,服務(wù)游客及從業(yè)者。
在本研究中使用的主要理論是計(jì)劃行為理論(Theory of Planned Behavior)。計(jì)劃行為理論認(rèn)為人們是以社區(qū)(Community)為導(dǎo)向的,人們的行為意圖受到他人、群體和主觀規(guī)范的影響。主觀規(guī)范指?jìng)€(gè)人對(duì)于是否采取某項(xiàng)特定行為所感受到的社會(huì)壓力,且一個(gè)人的可能行為取決于他/她的可用資源。由此我們可以歸納出:對(duì)同一行為已采取行動(dòng)者態(tài)度的分析可以預(yù)測(cè)潛在個(gè)體行為。例如,在社交媒體上發(fā)表評(píng)論是同伴影響的一種形式。網(wǎng)絡(luò)話(huà)語(yǔ)具有引領(lǐng)性、傳播性和影響性。網(wǎng)絡(luò)上對(duì)一個(gè)事物整體積極評(píng)論使個(gè)體也具有積極的評(píng)價(jià)傾向。據(jù)此在旅游層面上,過(guò)往游客對(duì)景區(qū)的正面評(píng)價(jià)可以正向影響潛在旅行者的行為意圖。但是由此我們發(fā)現(xiàn),過(guò)去相關(guān)領(lǐng)域?qū)W者對(duì)用戶(hù)生成內(nèi)容的研究大多集中在其因果關(guān)系上。
利用詞向量模型來(lái)進(jìn)行內(nèi)容分析是近年來(lái)隨計(jì)算機(jī)技術(shù)進(jìn)步而出現(xiàn)的一種探究詞義聯(lián)系的研究方法,其研究手段多樣。詞向量模型首先在高維空間中將單詞之間的連續(xù)相似性編碼為單詞向量之間的距離或角度,再進(jìn)一步依托非監(jiān)督向量建模,可捕獲并可視化詞語(yǔ)、句意關(guān)系,提供洞見(jiàn)。在其他領(lǐng)域,較多詞向量模型被開(kāi)發(fā)出來(lái)以促進(jìn)語(yǔ)法關(guān)聯(lián)、機(jī)器翻譯、視覺(jué)交互比較和圖像描述。在旅游領(lǐng)域的相關(guān)具體應(yīng)用主要有:Stepchenkova等和Govers等使用CATPAC和WORDER分析程序,通過(guò)因子分析了解游客對(duì)目的地形象的認(rèn)知。Serna等利用詞向量技術(shù)通過(guò)用戶(hù)網(wǎng)絡(luò)生成內(nèi)容動(dòng)態(tài)描述巴斯克地區(qū)的認(rèn)知目的地形象。Sánchez Franco等將Pathfinder應(yīng)用到Booking.com的在線(xiàn)評(píng)論分析中,得出揭示最常見(jiàn)術(shù)語(yǔ)組織結(jié)構(gòu),并準(zhǔn)確指出客戶(hù)的核心關(guān)注。Banerjee和Chua運(yùn)用AntConc 3.2.2文本分析工具包進(jìn)行了雙向因子方差分析,從TripAdvisor.com的酒店評(píng)論中生成評(píng)級(jí)模式。但如前所述,運(yùn)用詞向量模型對(duì)相似遺產(chǎn)地景區(qū)進(jìn)行具體特征比較的論文還很少。本文的新可視化模型有助于進(jìn)一步推進(jìn)游客評(píng)價(jià)研究中的對(duì)比分析。
本文在查閱大量歷史文獻(xiàn)的基礎(chǔ)上,嘗試通過(guò)一種新的數(shù)據(jù)可視化工具來(lái)對(duì)網(wǎng)絡(luò)評(píng)論內(nèi)容進(jìn)行分析,找出群體影響個(gè)體的語(yǔ)義組群,采取定量和定性分析,實(shí)現(xiàn)內(nèi)容概括,進(jìn)而指導(dǎo)旅游出行。本研究旨在解決以下研究問(wèn)題:第一,識(shí)別國(guó)外旅游者在兩個(gè)長(zhǎng)城景區(qū)評(píng)論中的關(guān)注點(diǎn);第二,通過(guò)MST探索相應(yīng)焦點(diǎn)及彼此語(yǔ)義關(guān)系;第三,關(guān)注評(píng)論中形容詞術(shù)語(yǔ)如何在ThemeRiver中流動(dòng)并從中提取含義;第四,內(nèi)容文本化以利于提供旅游情報(bào),改善旅游服務(wù)。
本文作者使用Python爬蟲(chóng)軟件爬取長(zhǎng)城2009年11月到2019年10月TripAdvisor.com中的共計(jì)2.1萬(wàn)篇英文評(píng)論。本文采用TripAdvisor.com旅游評(píng)論的主要原因是此網(wǎng)站評(píng)論可信度高,其內(nèi)部算法已過(guò)濾欺詐評(píng)論,通過(guò)歪曲事實(shí)來(lái)影響民意的可能性很低。
首先本文使用一個(gè)自然語(yǔ)言處理的Java開(kāi)源工具包(LingPipe)進(jìn)行語(yǔ)言數(shù)據(jù)處理,可實(shí)現(xiàn)以下功能:主題分類(lèi)(Top Classification)、命名實(shí)體識(shí)別(Named Entity Recognition)、句題檢測(cè)(Sentence Detection)、查詢(xún)拼寫(xiě)檢查(Query Spell Checking)、興趣短語(yǔ)檢測(cè)、聚類(lèi)、字符語(yǔ)言建模、數(shù)據(jù)庫(kù)文本挖掘、分詞、情感分析、語(yǔ)言辨別等。然后,本研究采用一種用于信息檢索與數(shù)據(jù)挖掘的常用加權(quán)技術(shù)(TF-IDF)將得分最高的前50個(gè)詞保存至excel文檔中,進(jìn)而采用Word2vec對(duì)文本進(jìn)行“向量化”,依托MST和ThemeRiver技術(shù)使用D3.js可視化圖庫(kù)進(jìn)行統(tǒng)計(jì)計(jì)算和繪圖。在實(shí)現(xiàn)MST、MSF和ThemeRiver的可視化描述后,作者再次檢索相關(guān)評(píng)論,進(jìn)行概括內(nèi)容的狹義內(nèi)容分析,確定觀點(diǎn)歸納的準(zhǔn)確性。結(jié)合上述成果,本研究將這兩個(gè)長(zhǎng)城遺址景區(qū)的MST、MSFs和ThemeRiver轉(zhuǎn)化為摘要,此摘要被認(rèn)為是外國(guó)游客對(duì)景區(qū)的整體畫(huà)像,且更具可讀性、整體性。
這兩個(gè)景區(qū)的MST節(jié)點(diǎn)的大小代表詞頻。它們之間的關(guān)系由它們邊的長(zhǎng)度來(lái)表示,關(guān)系越緊密,邊緣越短。這些文字、線(xiàn)條和MSF揭示了游客的關(guān)切。筆者依據(jù)八達(dá)嶺長(zhǎng)城MST、MSF做出以下描繪:第一,【左塔或山頂】的【攀爬】是【陡峭而困難的】;第二,【火車(chē)、公共汽車(chē)或纜車(chē)】是主要交通方式;第三,【天氣和水】是【冷的】;第四,與【導(dǎo)游】一起【參觀或體驗(yàn)】【中國(guó)北京】,并【欣賞】【中國(guó)歷史】的【驚人和美麗】是值得【推薦】的;第五,【長(zhǎng)城】是一個(gè)【值得推薦】但【擁擠和繁忙】的景區(qū);第六,【人們或游客】愛(ài)【拍照】。
筆者依據(jù)慕天峪長(zhǎng)城MST、MST做出以下描繪:第一,【八達(dá)嶺和慕天峪】【人或游客】是【擁擠的】;第二,從【旅館】到【入口處】需要長(zhǎng)【時(shí)間】的【公共汽車(chē)】;第三,【訪(fǎng)問(wèn)或體驗(yàn)】【中國(guó)北京】了解【中國(guó)歷史】是【開(kāi)心、驚人和美麗的】;第四,【攀登】【陡峭的臺(tái)階】是【值得】和【推薦】的;第五,【坐抬椅、纜車(chē)】到【山頂或左塔】,【乘坐雪橇】【下滑】是有【樂(lè)趣】的。
ThemeRiver可視化效果展示出以下兩個(gè)方面內(nèi)容:第一,“梨形流”是由當(dāng)月評(píng)閱次數(shù)形成的。它清楚地表明,4月(北京的春天)和9月(北京的秋天)是游覽長(zhǎng)城的最佳月份,這源于長(zhǎng)城屬于北溫帶半濕潤(rùn)大陸性季風(fēng)氣候,夏熱冬冷;作為戶(hù)外文化遺產(chǎn),長(zhǎng)城景區(qū)的游覽受季節(jié)影響很大。第二,八達(dá)嶺長(zhǎng)城評(píng)論中提到的【險(xiǎn)峻、擁擠】和【震驚】最多,慕田峪長(zhǎng)城評(píng)論中提到的【險(xiǎn)峻、擁擠】和【值得】最多。
本研究試圖擴(kuò)展現(xiàn)有的知識(shí),運(yùn)用MST,ThemeRiver和內(nèi)容概括分析從英語(yǔ)游客的評(píng)論中考察兩個(gè)長(zhǎng)城景區(qū)的評(píng)論關(guān)注點(diǎn)異同??偟膩?lái)說(shuō),我們發(fā)現(xiàn)兩個(gè)景區(qū)都“擁擠”和“陡峭”,但“震驚”和“值得”,最好的旅游季節(jié)是春天和秋天。長(zhǎng)城天氣呈現(xiàn)出“夏熱”“冬冷”的特征。游客將參觀長(zhǎng)城作為了解中國(guó)歷史和文化的一種方式。進(jìn)一步歸納這兩個(gè)景區(qū)的MST可以發(fā)現(xiàn)二者之間的區(qū)別:在八達(dá)嶺長(zhǎng)城,游客更有可能選擇導(dǎo)游來(lái)提供旅游服務(wù)。在慕田峪長(zhǎng)城,游客們對(duì)交通、抬椅、旱橇、纜車(chē)等設(shè)施都很滿(mǎn)意,這對(duì)他們登山很有幫助。進(jìn)一步的內(nèi)容分析我們可以得到,雖然兩個(gè)景區(qū)都“繁忙”“擁擠”“陡峭”,但八達(dá)嶺長(zhǎng)城比慕田峪長(zhǎng)城“更陡峭”“更擁擠”。八達(dá)嶺長(zhǎng)城對(duì)游客體力有更高的要求。根據(jù)上述發(fā)現(xiàn),可以為每個(gè)景區(qū)寫(xiě)一個(gè)總結(jié)。與TripAdvisor網(wǎng)頁(yè)上的“Popular Mentioned”相比,本文總結(jié)可以更好地揭示游客關(guān)注和體驗(yàn)感受。它還具有可靠性和可讀性的優(yōu)點(diǎn),內(nèi)容概括方式更優(yōu)化(見(jiàn)表 1、表 2)。
表1 基于本文研究的八達(dá)嶺長(zhǎng)城概述
表2 基于本文研究的慕田峪長(zhǎng)城概述
對(duì)于這兩處遺址景區(qū)來(lái)說(shuō),八達(dá)嶺長(zhǎng)城和慕田峪長(zhǎng)城在營(yíng)銷(xiāo)推廣上都可以得到高度贊揚(yáng)。長(zhǎng)城游客在評(píng)價(jià)景區(qū)時(shí)傾向于著墨有形特征,如物理設(shè)施、景觀、交通和人員的外貌。雖然這兩個(gè)遺址景區(qū)相似,但它們?cè)谔厣头?wù)上呈現(xiàn)的差異可以相互借鑒和補(bǔ)充。仔細(xì)研究這些概述內(nèi)容的共性,可以洞察游客的行為意圖,促進(jìn)管理和市場(chǎng)營(yíng)銷(xiāo)。
針對(duì)評(píng)價(jià)里談及的旅游旺季擁擠問(wèn)題,管理部門(mén)可以針對(duì)游客數(shù)量提前預(yù)警和給出提示,并采取“限流”的措施來(lái)緩解。在如今的互聯(lián)網(wǎng)時(shí)代,游客可以通過(guò)APP提前訂票,管理者也可以通過(guò)APP系統(tǒng),提醒消費(fèi)者準(zhǔn)備登山用品,提醒游客在慕天峪長(zhǎng)城登山時(shí)要多帶些飲用水,夏天注意防曬防暑,冬天注意低溫影響,通過(guò)發(fā)送相關(guān)短信,可以顯著提高游客滿(mǎn)意度。我們從總結(jié)中仔細(xì)研究它們的差異發(fā)現(xiàn),慕田峪長(zhǎng)城因纜車(chē)和旱橇提供的極大便利而深受游客歡迎。事實(shí)上,八達(dá)嶺長(zhǎng)城比慕田峪長(zhǎng)城更陡峭,優(yōu)化類(lèi)似服務(wù),一定會(huì)增加游客的便利,提高他們的體驗(yàn)滿(mǎn)意度。八達(dá)嶺長(zhǎng)城的導(dǎo)游服務(wù)讓游客非常滿(mǎn)意。游客喜歡在導(dǎo)游的幫助下拍照和學(xué)習(xí)中國(guó)歷史。慕田峪長(zhǎng)城管理者可以借鑒這一經(jīng)驗(yàn),積極完善自己的導(dǎo)游隊(duì)伍。此外,關(guān)于景區(qū)暴露的缺點(diǎn),景區(qū)瓶裝飲用水水價(jià)過(guò)高,也需要引起管理者注意,適當(dāng)采取行動(dòng)。
本文也存在一些局限性。首先,本文研究重點(diǎn)是最高頻詞匯,忽略了短語(yǔ)、句意分析。因此,這篇文章的相關(guān)術(shù)語(yǔ)與TripAdvisor“Popular mentioned”(熱門(mén)提及)存在一些差異。一些重要的景區(qū)特征或評(píng)價(jià)沒(méi)有顯示出來(lái),將來(lái)的研究可以通過(guò)增加短語(yǔ)的方式來(lái)改進(jìn)。狹義的內(nèi)容分析可以應(yīng)用到MST的每個(gè)分支,以獲得更準(zhǔn)確的綜述,使總結(jié)更具描述性和文學(xué)性,本文并沒(méi)有展開(kāi)討論。