□李加軍
(廣州商學(xué)院,廣東 廣州 511363)
截至2017年6月,我國(guó)網(wǎng)民規(guī)模達(dá)到7.51億。互聯(lián)網(wǎng)普及率為54.3%。我國(guó)在線旅游服務(wù)近年來(lái)也呈現(xiàn)爆發(fā)式增長(zhǎng),根據(jù)艾瑞網(wǎng)數(shù)據(jù)顯示,2016年中國(guó)在線旅游市場(chǎng)交易規(guī)模達(dá)到5 934.6億元,增長(zhǎng)率為34%。越來(lái)越多的旅游者在進(jìn)行旅游決策前會(huì)主動(dòng)地搜尋信息,旅游在線評(píng)論為旅游者搜尋信息提供了重要參考和幫助,并成為影響旅游者旅游決策的一種重要方式。
網(wǎng)絡(luò)文本分析法是通過(guò)提煉網(wǎng)上文本的中心思想以開(kāi)展相關(guān)主題研究,網(wǎng)絡(luò)文本分析法逐漸成為旅游學(xué)的重要研究方向。張付志(2014)等通過(guò)獲得用戶(hù)評(píng)論對(duì)商品的喜愛(ài)程度,結(jié)合用戶(hù)的環(huán)境信息來(lái)為用戶(hù)產(chǎn)生推薦,并通過(guò)實(shí)驗(yàn)驗(yàn)證了該算法的優(yōu)越性。[1]何丹(2017)應(yīng)用北京地區(qū)博物館的網(wǎng)絡(luò)評(píng)論文本探究游客在博物館旅游過(guò)程中的旅游體驗(yàn)感知特征。[2]李爽(2015)以大陸居民赴臺(tái)旅游的98篇游記為研究對(duì)象,利用ROST CM軟件對(duì)收集的文本進(jìn)行內(nèi)容分析,獲取游客食、住、行、游、購(gòu)、娛等旅游六要素在地點(diǎn)選擇、內(nèi)容偏好、體驗(yàn)過(guò)程、服務(wù)感知等方面的感知信息,深入分析人陸居民赴臺(tái)旅游體驗(yàn)的特征和評(píng)價(jià)。[3]張文亭(2017)以永定土樓世界文化遺產(chǎn)地為研究案例,分析游客感知和官方網(wǎng)站宣傳的旅游形象之間的差異。[4]宋振春等(2018)應(yīng)用ROST內(nèi)容挖掘系統(tǒng)、ROST新聞分析工具和UCINET軟件進(jìn)行數(shù)據(jù)分析,從旅游跨文化交流的角度出發(fā),研究了中國(guó)社會(huì)對(duì)于出境旅游的認(rèn)知內(nèi)容、特性以及與出境旅游發(fā)展過(guò)程的關(guān)系。[5]仲寧等(2018)以江蘇宜興為案例地,研究了官方宣傳形象和游客感知形象之間存在的異同。[6]
已有研究局限性在于以宏觀層面研究為主多,微觀層面研究較少;大多采用內(nèi)容分析法對(duì)在線評(píng)論文本進(jìn)行詞頻統(tǒng)計(jì),沒(méi)有考慮中文詞語(yǔ)常出現(xiàn)的同義詞、近義詞現(xiàn)象;較少應(yīng)用在線評(píng)論進(jìn)行情感分析。因此,本文通過(guò)采集并處理螞蜂窩網(wǎng)有關(guān)廣州增城白水寨風(fēng)景區(qū)游客評(píng)論信息,應(yīng)用網(wǎng)絡(luò)文本分析方法進(jìn)行關(guān)鍵詞和情感分析,以期為潛在游客的旅游和旅游景區(qū)管理決策提供參考依據(jù)。
本文主要采用網(wǎng)路文本內(nèi)容分析的研究方法。通過(guò)深入挖掘文本內(nèi)容背后的含義與規(guī)律,對(duì)事物發(fā)展做出預(yù)測(cè)。數(shù)據(jù)的采集和分析使用深圳視界信息技術(shù)有限公司開(kāi)發(fā)的八爪魚(yú)數(shù)據(jù)采集系統(tǒng)和微圖軟件。八爪魚(yú)數(shù)據(jù)采集系統(tǒng)能夠根據(jù)需要實(shí)現(xiàn)數(shù)據(jù)自動(dòng)化采集、編輯、規(guī)范化,提高效率。微圖軟件可以達(dá)到通過(guò)一系列智能算法,從核心關(guān)鍵詞、典型意見(jiàn)、情感傾向(正面/負(fù)面)等不同維度快速分析海量文本。
本文于 2018年7月1日至9月1日,選取廣州增城白水寨風(fēng)景名勝區(qū)在螞蜂窩網(wǎng)的在線評(píng)論402條作為樣本。白水寨風(fēng)景名勝區(qū)位于增城區(qū)派潭鎮(zhèn),占地面積約170km2,景區(qū)擁有原始森林、淺灘濕地、峽谷天池等廣東罕見(jiàn)自然生態(tài)資源,其中最令人矚目的當(dāng)屬落差高達(dá)428.5米的全國(guó)內(nèi)地落差最大瀑布——白水仙瀑。
螞蜂窩是中國(guó)最大的旅行分享網(wǎng)站,創(chuàng)立于2006年,從2010年正式開(kāi)始公司化運(yùn)營(yíng)。螞蜂窩更強(qiáng)調(diào)用戶(hù)自己原創(chuàng)內(nèi)容分享,依據(jù)用戶(hù)偏好及其行為習(xí)慣,對(duì)應(yīng)提供個(gè)性化的旅行信息。
將樣本通過(guò)微圖軟件進(jìn)行關(guān)鍵詞提取,經(jīng)篩選獲得有意義的關(guān)鍵詞及其中心度如表1所示,中心度大小代表其重要性性程度,中心度越高,節(jié)點(diǎn)越處于核心地位。
表1 關(guān)鍵詞中心度(排名前 50 位)
從表1可見(jiàn),關(guān)鍵詞中心度排名前50位中,詞性以主要包含名詞、形容詞和動(dòng)詞。名詞數(shù)量最多,主要是景點(diǎn)設(shè)施、地名、景點(diǎn)環(huán)境;形容詞主要用來(lái)表現(xiàn)游客的態(tài)度、心情、感知和描述景點(diǎn)的形象和感官特征;動(dòng)詞主要反映游客參觀游覽的行為、動(dòng)機(jī)、過(guò)程等旅游活動(dòng)特征。前50個(gè)特征詞是游客對(duì)景點(diǎn)感知中較突出的部分,這些詞集中反映了景區(qū)形象屬性特點(diǎn)和游客的參觀旅游活動(dòng)行為體驗(yàn)特征。為了更直觀地表達(dá)白水寨景區(qū)游客評(píng)論關(guān)注點(diǎn),我們將表1中列出的前50位關(guān)鍵詞中心度在線生成詞云圖(圖1)。圖中字體的大小反映關(guān)鍵詞中心度的大小,從詞云圖可以看出“瀑布、不錯(cuò)、風(fēng)景、空氣、景區(qū)、地方、增城、爬到、山頂、門(mén)票”等是游客點(diǎn)評(píng)關(guān)注的熱點(diǎn)。
圖1 關(guān)鍵詞中心度詞云圖
為了更好地分析,本文從5個(gè)主類(lèi)目和10個(gè)次類(lèi)目對(duì)高頻關(guān)鍵詞進(jìn)行分類(lèi)歸納(見(jiàn)表2),5個(gè)主類(lèi)目分別是旅游吸引物、旅游環(huán)境、旅游設(shè)施與服務(wù)、旅游體驗(yàn)、旅游評(píng)價(jià)。從旅游吸引物來(lái)看,廣州白水寨風(fēng)景區(qū)最核心吸引物是瀑布,景區(qū)的景色和風(fēng)景都是圍繞瀑布布局,并被游客感知。從旅游環(huán)境來(lái)看,游客關(guān)注度較高的是區(qū)位環(huán)境和自然環(huán)境,游客更偏好景區(qū)內(nèi)的自然環(huán)境,對(duì)文化環(huán)境較少提及。從旅游設(shè)施與服務(wù)來(lái)看,游客對(duì)景區(qū)內(nèi)食宿設(shè)施、交通設(shè)施、旅游服務(wù)等方面評(píng)價(jià)甚多,比如景區(qū)內(nèi)游覽體力消耗大、門(mén)票價(jià)格偏高等,這些是游客較關(guān)注的游覽細(xì)節(jié),景區(qū)管理應(yīng)從這些方面著重改進(jìn)和完善。從旅游體驗(yàn)來(lái)看,游客比較關(guān)注休閑、體驗(yàn)、觀光,游客體驗(yàn)的方式越來(lái)越多種多樣。從旅游評(píng)價(jià)來(lái)看,游客評(píng)價(jià)以正面評(píng)價(jià)為主。
情感分析作為當(dāng)前自然語(yǔ)言處理領(lǐng)域中最為活躍的研究之一,是指對(duì)在線評(píng)論文本進(jìn)行情感分析判斷文本的情感極性是正面、負(fù)面還是中性,或識(shí)別用戶(hù)的觀點(diǎn)是“贊同”還是“反對(duì)”。根據(jù)定義的規(guī)則,將情感值設(shè)定為(0,1)區(qū)間,首先對(duì)每條評(píng)論進(jìn)行分析評(píng)分,0為最負(fù)面,1為最正面,統(tǒng)計(jì)本文的情感傾向,從而對(duì)情感分析做出判斷,根據(jù)ID合并計(jì)算出每條文本的最終情感傾向評(píng)分,部分結(jié)果如表3所示。
表2 廣州增城白水寨風(fēng)景區(qū)在線評(píng)論主題類(lèi)目
表3 情感得分值和評(píng)論文本(部分)
通過(guò)情感分析發(fā)現(xiàn),廣州增城白水寨風(fēng)景區(qū)在線評(píng)論整體綜合評(píng)分0.521,正面評(píng)價(jià)占比66.07%,負(fù)面評(píng)價(jià)占比33.93%,表明廣州增城白水寨風(fēng)景區(qū)帶給游客的總體印象是積極大于消極。
根據(jù)情感分析結(jié)果生成云圖(見(jiàn)圖2),發(fā)現(xiàn)正面感知主要來(lái)自景區(qū)的空氣、環(huán)境、瀑布、風(fēng)景。少部分游客的實(shí)際旅游體驗(yàn)小于期望,負(fù)面感知主要是來(lái)自于景點(diǎn)門(mén)票價(jià)格過(guò)高帶來(lái)的不滿。
本研究存在以下幾個(gè)方面的局限性。首先,本文研究?jī)H以螞蜂窩網(wǎng)上一定時(shí)間內(nèi)上傳的在線評(píng)論作為樣本來(lái)源,沒(méi)有納入旅游論壇、旅友微博、微信平臺(tái)等其他類(lèi)型旅游網(wǎng)站;同時(shí),由于游客感知具有動(dòng)態(tài)性,在不同的旅游階段,游客感知和關(guān)注的因素有差異的;此外,使用的分析軟件在進(jìn)行分析時(shí)存在一定主觀性。未來(lái)研究應(yīng)進(jìn)一步拓展資料搜集渠道,對(duì)游客不同時(shí)間段內(nèi)發(fā)表的評(píng)論進(jìn)行比較分析,以期對(duì)景區(qū)更全面的了解,使研究更加深入。
山西經(jīng)濟(jì)管理干部學(xué)院學(xué)報(bào)2019年1期