葛 瑞 劉曉莉 萬云霞 潘立新
1.滁州學(xué)院地理信息與旅游學(xué)院,安徽滁州 239000;2.滁州學(xué)院外國語學(xué)院,安徽滁州 239000
隨著互聯(lián)網(wǎng)發(fā)展普及,在網(wǎng)上進行旅游預(yù)定、在線評論、分享交流越來越便捷,出現(xiàn)了海量的旅游數(shù)據(jù)信息,而網(wǎng)絡(luò)非實名制的存在,使得游客在交流評論時更能表達出真情實感和真實想法。伴隨著內(nèi)容挖掘軟件的出現(xiàn)、數(shù)據(jù)采集技術(shù)的進步,很多學(xué)者開始收集旅游大數(shù)據(jù)信息進行研究,深入挖掘游客對旅游目的地的滿意程度、情感特征、旅游體驗評價及其相關(guān)需求,為旅游目的地產(chǎn)品、設(shè)施、管理等方面提出建設(shè)性的意見。
唐模風(fēng)景區(qū)位于黃山市,是國家5A景區(qū)、黃山市十大景區(qū)之一,始建于唐、發(fā)展于宋、盛于明清,歷史傳說因其經(jīng)濟活躍、民風(fēng)淳樸,而被譽為“唐朝模范村”。
本文運用網(wǎng)絡(luò)文本分析方法進行情感特征研究。借助攜程網(wǎng)、大眾點評等網(wǎng)站收集關(guān)于唐模景區(qū)的在線點評文本,利用八爪魚軟件收集唐模景區(qū)的評論數(shù)據(jù),用ROST Content Mining從高頻詞、語義網(wǎng)絡(luò)、情感分析等功能模塊挖掘文本中游客表達的情感特征。
本文的在線點評文本選自攜程旅游網(wǎng)、大眾點評、馬蜂窩旅游網(wǎng)、途牛旅游網(wǎng)。以“黃山市唐模景區(qū)”為關(guān)鍵詞,運用網(wǎng)絡(luò)搜索在線點評文本,共收集獲得900多條在線點評,其中攜程574條、大眾點評362條、途牛8條、馬蜂窩9條,這是唐模景區(qū)2015年—2020年幾乎包含所有網(wǎng)站的點評數(shù)據(jù),其覆蓋面廣,具有可行性。
將數(shù)據(jù)導(dǎo)入表格后手動刪除2015年前的評論數(shù)據(jù),數(shù)據(jù)去噪,統(tǒng)一格式,按2015—2020年升序排列。為確保評論對研究有實際意義,刪除部分旅游網(wǎng)站平臺設(shè)置的快速評價默認好評的內(nèi)容以及用戶在評論區(qū)發(fā)布廣告等與景區(qū)無關(guān)的言論和重復(fù)數(shù)據(jù),最后保留攜程554條、大眾點評347條、馬蜂窩3條、途牛8條,共912條。
利用高詞頻分析可以快速高效地從大量文本數(shù)據(jù)中找出關(guān)鍵詞。使用ROST Content Mining對收集到的網(wǎng)絡(luò)文本進行高頻詞分析,統(tǒng)計2015—2020年排名前100的詞匯及其頻次(見表1)。發(fā)現(xiàn)大部分游客的評論中都是積極的詞匯,存在較少的消極言論詞匯。詞云圖可以過濾掉大量的文本信息,更直觀地體現(xiàn)高頻詞數(shù)據(jù),出現(xiàn)詞匯的大小代表詞頻的高低,詞匯所占越大詞頻越高,反之詞頻越低。將唐模景區(qū)排名前100的詞匯進行轉(zhuǎn)化制作詞云圖,運用Word Art詞云在線生成工具,制作唐模景區(qū)詞云圖(見圖1),直觀清楚地反映各高頻詞所出現(xiàn)的頻次及所占比重。詞頻率最高的是關(guān)于唐模景區(qū)的相關(guān)信息,例如“唐?!薄熬皡^(qū)”“徽州”“徽派”“村落”等詞匯,是游客游玩后對唐模景區(qū)整體(包括地理位置、風(fēng)格、建筑及自身的旅游體驗感)的評價。游客在評論中提及“值得”“適合”“值得一見”等詞,表明游客對唐模景區(qū)的游玩感受普遍良好,給了比較高的評價。排名前100的詞匯中也有消極情感類的詞匯,但是占總體的極少數(shù),其中“不值”這一詞匯出現(xiàn)了32次,查找相關(guān)評論,發(fā)現(xiàn)是游客認為門票貴,性價比不高,覺得不值。
表1 2015年—2020年唐模景區(qū)排名前100詞匯
圖1 唐模景區(qū)詞云圖
單純的高頻詞分析只能反映出各個詞出現(xiàn)的次數(shù)及其比重,語義網(wǎng)絡(luò)分析在此基礎(chǔ)上能表現(xiàn)出各個詞之間的內(nèi)部聯(lián)系與結(jié)構(gòu),將文本轉(zhuǎn)換為圖片的形式,可以更加直觀地看出各個高頻詞之間的關(guān)系(見圖2)。可以看出語義結(jié)構(gòu)圖有很多中心并向四周無規(guī)律的分散,其中以“唐?!薄盎罩荨薄熬皡^(qū)”“徽派”為中心,除去這些中心詞匯外,“歷史”“西湖”“建筑”等詞匯是對中心詞匯的解釋及延伸。在語義網(wǎng)絡(luò)圖的最外層例如“特色”“悠久”“千年”“商業(yè)”“風(fēng)光”“深厚”等詞匯,是對內(nèi)部中心詞匯更進一步的解釋及延伸,通過這張圖可以看出各個詞匯之間的關(guān)聯(lián)程度,線條越集中的詞匯越重要。
圖2 唐模景區(qū)語義網(wǎng)絡(luò)結(jié)構(gòu)圖
在ROST Content Mining軟件中選擇情感分析,得出游客情感特征分析的最終結(jié)果(見表2)。積極情緒的游客占85%以上,消極情緒的游客占8%左右,說明大部分游客表達了正向的情感特征,并對唐模景區(qū)給予了比較積極的情感評價和價值認同,這與高頻詞分析的結(jié)論相一致。處于中立立場的中性情緒的游客占7%,以客觀地陳述自己的旅游體驗為主。積極情感語義高頻詞匯有:“特色”“安靜”“方便”“值得”等,反映唐模景區(qū)作為傳統(tǒng)村落具有特色的徽派建筑吸引游客前往,且歷史文化氣息深厚、景色宜人,使游客產(chǎn)生積極情緒。而消極情感主要體現(xiàn)在“門票”“景區(qū)不大”上,原因主要在于交通基礎(chǔ)設(shè)施不完善,景區(qū)門票價格略高。將表格內(nèi)的數(shù)據(jù)制作成圖表(見圖3),通過六年的比較發(fā)現(xiàn)游客的積極情緒具有很強的波動性,呈下降—上升—下降的波動趨勢,2015年至2016年下降,2016年至2019年持續(xù)遞增的狀態(tài),2020年因疫情影響稍有下降。
表2 2015—2020年唐模景區(qū)情感分析表
圖3 2015—2020年唐模景區(qū)游客積極情緒柱狀圖
本文通過獲取唐模景區(qū)2015—2020年旅游網(wǎng)站游客評論,分析唐模景區(qū)游客情感特征,得出主要結(jié)論:游客情感以積極情感為主,要強化游客積極情緒,弱化消極情緒,關(guān)注基礎(chǔ)設(shè)施設(shè)備、門票的性價比方面的完善,通過六年的比較發(fā)現(xiàn)游客的積極情緒具有很強的波動性,呈下降—上升—下降的波動趨勢。