亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于細(xì)粒度情感分析的游客目的地感知形象研究

        2025-05-26 00:00:00簡(jiǎn)洪波陳堅(jiān)吳曉桐
        旅游論壇 2025年2期
        關(guān)鍵詞:情感分析模型

        中圖分類號(hào)]F592.7 [文獻(xiàn)標(biāo)識(shí)碼]A [文章編號(hào)]1674-3784(2025)02-0017-12

        隨著自主旅游市場(chǎng)的不斷發(fā)展,游客逐漸成為市場(chǎng)的主導(dǎo)者。游客自的地感知形象是影響游客出行的關(guān)鍵決策變量,直接影響游客滿意度。同時(shí),積極的游客感知形象有助于將潛在出行者轉(zhuǎn)化為現(xiàn)實(shí)游客,通過(guò)提供多樣化服務(wù)以滿足游客個(gè)性化需求,對(duì)于樹立目的地品牌價(jià)值,吸引游客重游或向好友推薦具有重要意義[2]。以往,旅游目的地、景區(qū)主要通過(guò)大眾媒體廣告等營(yíng)銷手段塑造旅游形象,進(jìn)而影響游客決策過(guò)程,如今社交網(wǎng)絡(luò)平臺(tái)逐漸取代了傳統(tǒng)營(yíng)銷手段,成為游客獲取旅游信息的主要途徑[3]。越來(lái)越多的游客選擇通過(guò)在線評(píng)論表達(dá)自身看法,旅游信息不再完全由旅游景區(qū)所掌握,這給旅游營(yíng)銷工作帶來(lái)了極大的挑戰(zhàn)。

        隨著互聯(lián)網(wǎng)的發(fā)展,網(wǎng)絡(luò)信息逐漸成為游客目的地感知形象研究的重要數(shù)據(jù)來(lái)源。早期,旅游者網(wǎng)絡(luò)日志被應(yīng)用于目的地形象研究中,Huang等通過(guò)對(duì)網(wǎng)絡(luò)日志的研究,認(rèn)為積極的游客感知形象對(duì)游客的購(gòu)買行為具有正面影響[4]。伴隨著移動(dòng)端的普及和社交網(wǎng)絡(luò)平臺(tái)的興起,用戶劇增,產(chǎn)生了大量的旅游者在線評(píng)論數(shù)據(jù)[5]。與網(wǎng)絡(luò)日志相比,在線評(píng)論數(shù)據(jù)具有多樣性、龐雜性和時(shí)效性等特點(diǎn),已成為研究者研究游客感知形象的新渠道,如孫曉東等使用攜程網(wǎng)在線評(píng)論數(shù)據(jù)研究中國(guó)郵輪品牌形象感知問(wèn)題,驗(yàn)證了使用游客在線評(píng)論數(shù)據(jù)的有效性和可靠性[。

        情感分析能感知在線評(píng)論信息背后隱含的旅游者情緒,揭示游客情緒變化的影響誘因,已成為研究游客情緒的主要手段之一[7]。Li等運(yùn)用雙向長(zhǎng)短期記憶模型對(duì)酒店評(píng)論情感開(kāi)展分析,研究發(fā)現(xiàn)酒店環(huán)境是旅客情感的主要影響因素[8;Tao等運(yùn)用百度情感詞典發(fā)現(xiàn)攜程網(wǎng)和微博旅游評(píng)論情感存在平臺(tái)差異[9]。在方法上,算法的適用性與準(zhǔn)確性是研究者關(guān)注的焦點(diǎn)。Liu等構(gòu)建了包含旅游特定術(shù)語(yǔ)的英漢情感詞典以提高情感識(shí)別精準(zhǔn)度[10];Alaei等認(rèn)為增大訓(xùn)練數(shù)據(jù)集規(guī)模有助于提高機(jī)器學(xué)習(xí)準(zhǔn)確性,但會(huì)受到算法類型、語(yǔ)種等因素干擾[11]。在視角上,目前研究主要集中在從整體層面提取每條評(píng)論情感傾向,無(wú)法區(qū)分游客對(duì)景區(qū)不同屬性的特定情感傾向,如門票、餐飲、環(huán)境和服務(wù)等[12]。在現(xiàn)實(shí)場(chǎng)景下,整體情感傾向可能與特定屬性情感傾向不一致[13]。因此,通過(guò)識(shí)別評(píng)論中多目標(biāo)情感傾向的細(xì)粒度情感分析,可以更準(zhǔn)確地表征游客對(duì)目的地多維度情感極性,發(fā)現(xiàn)用戶情感誘因。

        綜上,在線評(píng)論數(shù)據(jù)已被廣泛用于游客目的地感知形象研究中,情感分析是其主要研究手段。已有研究聚焦于整體情感視角,情感詞典和機(jī)器學(xué)習(xí)是其主要算法模型,前者構(gòu)建具有域適應(yīng)性詞典以提高情感識(shí)別準(zhǔn)確性,后者借助大規(guī)模語(yǔ)料訓(xùn)練以提升情感模型性能。現(xiàn)實(shí)場(chǎng)景中,整體情感分析忽略了游客表達(dá)的多維度情感極性,而細(xì)粒度情感分析能實(shí)現(xiàn)游客在線評(píng)論多維度情感提取,能更精確地表征游客情感。結(jié)合在線評(píng)論數(shù)據(jù)特性,細(xì)粒度情感分析能做到更全面、更細(xì)致和更深入的情感挖掘與分析。因此,本文采用此方法,以攜程網(wǎng)在線旅行社游客評(píng)論作為數(shù)據(jù)來(lái)源,從游客評(píng)論行為的角度切人,通過(guò)游客在線評(píng)論實(shí)現(xiàn)對(duì)游客目的地感知形象的細(xì)粒度情感分析。

        1數(shù)據(jù)采集與研究思路

        1.1 研究對(duì)象

        在線評(píng)論數(shù)據(jù)來(lái)源于社交媒體平臺(tái)、網(wǎng)站、論壇等允許用戶發(fā)布信息的網(wǎng)絡(luò)平臺(tái),表現(xiàn)為用戶發(fā)表的文本、視頻、圖片、音頻等,而文本信息為其主要載體[14]。旅游網(wǎng)站評(píng)論數(shù)據(jù)大多是游客親身體驗(yàn)后發(fā)表的看法,與其他平臺(tái)相比,具有更高的可信度。攜程網(wǎng)是國(guó)內(nèi)最具影響力的旅游網(wǎng)絡(luò)平臺(tái)之一,可供游客隨時(shí)隨地獲取、分享、傳播信息,反映游客最新想法和實(shí)時(shí)動(dòng)態(tài),具有用戶群體廣、評(píng)論數(shù)量多、內(nèi)容時(shí)效性高等特性,為旅游景點(diǎn)形象感知研究提供了良好數(shù)據(jù)基礎(chǔ)。上海迪士尼度假區(qū)(以下簡(jiǎn)稱上海迪士尼)位于上海浦東新區(qū),是中國(guó)內(nèi)地第一個(gè)迪士尼度假區(qū)。根據(jù)《2021年全球主題公園及景點(diǎn)游客量報(bào)告》,上海迪士尼2020年接待游客量848萬(wàn)人次,同比增長(zhǎng) 54% ,位列全球第六,也升至亞太第一位。根據(jù)攜程發(fā)布的《2023年五一出游數(shù)據(jù)報(bào)告》和《2023年國(guó)慶出游數(shù)據(jù)報(bào)告》,上海迪士尼均屬于熱門旅游景點(diǎn)。因此,本文選取上海迪士尼作為研究對(duì)象,以攜程網(wǎng)站游客在線評(píng)論作為研究數(shù)據(jù)來(lái)源。

        1.2 數(shù)據(jù)采集與處理

        本文擬采用后羿采集器從攜程網(wǎng)站采集旅游評(píng)論數(shù)據(jù),采集的數(shù)據(jù)內(nèi)容包括用戶昵稱、評(píng)論內(nèi)容、評(píng)論IP地址、評(píng)論時(shí)間、點(diǎn)贊數(shù)等字段。為減輕非結(jié)構(gòu)化文本數(shù)據(jù)的復(fù)雜性,需對(duì)初步采集的數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理,主要包括無(wú)效數(shù)據(jù)剔除和穴余字段刪除,然后借助Jieba分詞工具進(jìn)行文本分詞、停用詞刪除及詞頻統(tǒng)計(jì)。

        1.3 研究思路

        主題模型和情感分析是在線評(píng)論數(shù)據(jù)分析的主要方法,前者提取主題特征,后者識(shí)別主題情感。在主題模型中,LDA(latentDirichletallocation,潛在狄利克雷分布)模型的使用率最高,借助其實(shí)現(xiàn)主題特征提取是較為常用和有效的方法[15]。情感分析可分為情感詞典、機(jī)器學(xué)習(xí)和深度學(xué)習(xí)等3類方法[16],深度學(xué)習(xí)在其中占據(jù)主導(dǎo)地位,其預(yù)測(cè)精度整體上高于其他兩類算法「7]。因此,本文以上海迪士尼的在線評(píng)論作為研究樣本,基于預(yù)處理后的數(shù)據(jù),借助LDA模型實(shí)現(xiàn)主題特征提取,構(gòu)建游客對(duì)上海迪士尼的感知形象。運(yùn)用深度學(xué)習(xí)LCF-ATEPC(lo-cal context focused aspect term extractionandpolarityclassification,局部上下文聚焦的方面術(shù)語(yǔ)提取與極性分類)模型實(shí)現(xiàn)細(xì)粒度情感分析,通過(guò)人工標(biāo)注情感,建立情感數(shù)據(jù)庫(kù),訓(xùn)練LCF-ATEPC細(xì)粒度情感模型,同時(shí)訓(xùn)練SnowNLP粗粒度情感模型作為對(duì)照,對(duì)各形象維度下的游客評(píng)論實(shí)現(xiàn)情感分析,統(tǒng)計(jì)各維度情感極性占比,探究?jī)深惽楦心P颓楦蟹治霾町?。最后,基于?xì)粒度情感分析結(jié)果,利用詞云圖挖掘游客情感傾向關(guān)鍵詞,實(shí)現(xiàn)游客情感誘因探究。

        2數(shù)據(jù)特征提取方法

        2.1基于LDA模型的感知形象構(gòu)建

        游客感知形象的識(shí)別依賴于主題模型的挖掘結(jié)果,LDA模型是主題挖掘中最受歡迎的無(wú)監(jiān)督主題模型,相較于其他無(wú)監(jiān)督模型,它具有更好的操作性和語(yǔ)義解釋性[18]。本文擬采用LDA模型實(shí)現(xiàn)主題挖掘,并利用pyLDAvis實(shí)現(xiàn)模型結(jié)果可視化分析。作為無(wú)監(jiān)督模型,LDA需要預(yù)先指定主題參數(shù)k ,參數(shù) k 偏小會(huì)導(dǎo)致模型無(wú)法準(zhǔn)確挖掘文本深層信息,偏大則可能會(huì)產(chǎn)生冗余主題。

        “困惑度”與“一致性”是LDA模型中常用的確定主題數(shù)量的指標(biāo)[19],“困惑度”代指文檔隸屬主題的不確定性,而“一致性”則代指主題可解釋度[20],但“困惑度”不關(guān)注語(yǔ)義信息,即無(wú)法判斷信息質(zhì)量。因此本研究擬采用一致性確定主題參數(shù)k,并再次代入LDA模型測(cè)試。為確保挖掘主題質(zhì)量,本研究調(diào)用pyLDAvis中的gensim包實(shí)現(xiàn)LDA結(jié)果可視化分析,依據(jù)可視化分析結(jié)果,建立LDA主題模型,并確立主題和主題特征詞,構(gòu)建感知形象維度。

        2.2 基于LCF-ATEPC細(xì)粒度情感分析

        情感分析對(duì)研究游客感知形象具有重要意義[21]?,F(xiàn)有應(yīng)用于游客感知形象的情感分析主要停留在粗粒度層面,即從整體層面分析用戶情感。而細(xì)粒度情感分析能識(shí)別用戶表達(dá)的多維度情感極性,能更深人準(zhǔn)確地挖掘用戶情感態(tài)勢(shì)。本文采用LCF-ATEPC情感模型,通過(guò)人工構(gòu)建情感數(shù)據(jù)庫(kù)訓(xùn)練模型,并與其他幾類情感模型進(jìn)行對(duì)比,確定模型性能,在LDA模型結(jié)果基礎(chǔ)上,進(jìn)一步分析各維度情感態(tài)勢(shì)。

        LCF-ATEPC模型是一種基于多頭自注意力(multi-head self-attention,MHSA)和局部上下文焦點(diǎn)機(jī)制(localcontextfocus,LCF)的多任務(wù)學(xué)習(xí)模型,并集成了預(yù)訓(xùn)練的BERT(bidirectional encoder representationsfromtransformers,基于變換器的雙向編碼器表示)模型。該模型結(jié)合了方面術(shù)語(yǔ)提?。╝specttermextraction,ATE)和方面情感極性分類(aspectpolarityclassification,APC)任務(wù),采用兩個(gè)獨(dú)立的BERT層分別對(duì)全局上下文和局部上下文進(jìn)行建模。通過(guò)特征交互學(xué)習(xí)層,實(shí)現(xiàn)局部上下文特征和全局上下文特征之間的交互學(xué)習(xí),進(jìn)而利用全局上下文特征提取方向詞,并預(yù)測(cè)其情感極性。借助人工構(gòu)建的情感數(shù)據(jù)庫(kù)訓(xùn)練,LCF-ATEPC模型能自動(dòng)實(shí)現(xiàn)在線評(píng)論文本中方面詞提取和情感極性分類任務(wù)。

        3 研究結(jié)果分析

        3.1 數(shù)據(jù)預(yù)處理

        3.1.1 數(shù)據(jù)采集和文本分詞

        本文選擇2023年5月至2024年5月為評(píng)論采集時(shí)間,借助后羿采集器從攜程網(wǎng)站上采集游客評(píng)論,并通過(guò)軟件自帶數(shù)據(jù)去重功能對(duì)數(shù)據(jù)進(jìn)行去重,初步采集22455條游客評(píng)論,評(píng)論內(nèi)容包括評(píng)論ID、評(píng)論時(shí)間、評(píng)論文本和評(píng)論鏈接。隨后對(duì)數(shù)據(jù)進(jìn)行清洗,剔除文本中的無(wú)效數(shù)據(jù),如網(wǎng)絡(luò)鏈接、網(wǎng)絡(luò)符號(hào)等,最終保留有效數(shù)據(jù)13510條。

        為進(jìn)一步降低數(shù)據(jù)的非結(jié)構(gòu)化特征,需對(duì)數(shù)據(jù)進(jìn)行分詞和去除停用詞。Jieba分詞器是中文分詞過(guò)程常用的分詞工具,并且可加載自定義詞典對(duì)文本進(jìn)行分詞和去詞。本文首先使用Jieba分詞器對(duì)采集到的文本數(shù)據(jù)進(jìn)行初始分詞,并根據(jù)分詞結(jié)果,構(gòu)建“不分詞”詞典,再對(duì)初始文本進(jìn)行分詞,實(shí)現(xiàn)對(duì)初始分詞結(jié)果中的不應(yīng)分詞內(nèi)容進(jìn)行修正。中文停用詞庫(kù)、哈工大停用詞庫(kù)、百度停用詞庫(kù)是常見(jiàn)的中文停用詞表,本文將上述詞庫(kù)合并構(gòu)建自定義停用詞庫(kù),借助Jieba分詞器實(shí)現(xiàn)停用詞去除,并構(gòu)建旅游文本數(shù)據(jù)庫(kù)。

        3.1.2 文本標(biāo)注

        從旅游文本數(shù)據(jù)庫(kù)中隨機(jī)不重復(fù)抽取2000條數(shù)據(jù)進(jìn)行人工情感標(biāo)注,構(gòu)建旅游情感數(shù)據(jù)庫(kù)。情感標(biāo)注主要是對(duì)評(píng)論文本中的方面詞標(biāo)注情感極性,本文主要分為積極、消極和中性等3種極性,部分標(biāo)注數(shù)據(jù)見(jiàn)表1。為驗(yàn)證情感標(biāo)注結(jié)果的可靠性,對(duì)標(biāo)注結(jié)果進(jìn)行一致性檢驗(yàn)。隨機(jī)從已標(biāo)注文本中抽取200條評(píng)論文本,邀請(qǐng)2位旅游領(lǐng)域?qū)<覅⒓忧楦袠?biāo)注培訓(xùn),使其在不參考原始標(biāo)注結(jié)果的情況下進(jìn)行獨(dú)立標(biāo)注。情感標(biāo)注規(guī)則和原始標(biāo)注一致。最后通過(guò)計(jì)算Cohen'sKappa值來(lái)評(píng)估標(biāo)注結(jié)果可靠性,計(jì)算結(jié)果中,專家A標(biāo)注結(jié)果與原始標(biāo)注結(jié)果的Kap-pa值為0.78,專家B標(biāo)注結(jié)果與原始標(biāo)注結(jié)果的Kappa值為0.80,專家A標(biāo)注結(jié)果與專家B標(biāo)注結(jié)果的Kappa值為0.82。檢驗(yàn)結(jié)果表明標(biāo)注結(jié)果具有較高的可重復(fù)性和可靠性。最后對(duì)已標(biāo)注的情感數(shù)據(jù)集按照7:3的比例拆分成訓(xùn)練集和測(cè)試集。

        表1旅游文本情感數(shù)據(jù)(部分)

        3.2 LDA主題挖掘結(jié)果

        3.2.1 最佳主題參數(shù)確定

        在建立LDA模型之前,需要確定最佳主題數(shù)量參數(shù) k 。因LDA模型一次只能確定一個(gè)主題參數(shù),故將主題數(shù)量區(qū)間設(shè)為[2,10」,并計(jì)算對(duì)應(yīng)主題下一致性指標(biāo)得分,然后利用Python的數(shù)據(jù)可視化包Matplotlib繪制主題數(shù)量一致性折線圖,如圖1所示。

        圖1一致性得分

        在圖1中,一致性得分峰值對(duì)應(yīng)主題數(shù)為6。因此,將 k=6 代人LDA模型運(yùn)算,借助pyLDAvis中的gensim包對(duì)LDA模型進(jìn)行可視化分析,見(jiàn)圖2。

        當(dāng) k=6 時(shí),可視化結(jié)果中各主題邊界清晰,沒(méi)有重疊,具有良好的獨(dú)立性。因此確定最佳主題參數(shù) k=6 ,并構(gòu)建LDA模型,根據(jù)模型輸出結(jié)果,確定主題特征詞,構(gòu)建感知形象維度。

        圖2 主題可視化分布

        3.2.2 感知形象構(gòu)建

        從表2可知,LDA模型共確定6個(gè)主題。topicl占比 27.54% ,根據(jù)主題特征詞“排隊(duì)”“人太多”“時(shí)間”“小時(shí)”可知,景區(qū)存在排隊(duì)問(wèn)題,該主題在6個(gè)主題中占比排第一,說(shuō)明排隊(duì)問(wèn)題受到游客的主要關(guān)注。topic2占比 17.22% ,主題特征詞“攜程”“購(gòu)買”“方便”反映了游客對(duì)游覽景點(diǎn)配套設(shè)施服務(wù)的關(guān)注,包括購(gòu)票、出票和住宿環(huán)節(jié);其中,“方便”和“優(yōu)惠”等詞說(shuō)明了與其他途徑購(gòu)票相比,攜程網(wǎng)提供更加完善的購(gòu)票服務(wù)和更優(yōu)惠的票價(jià)。topic3占比 18.59% ,主題特征詞“開(kāi)心”“好看”“好玩”反映了盡管存在長(zhǎng)時(shí)間排隊(duì)問(wèn)題,但在游玩項(xiàng)目環(huán)節(jié)游客體驗(yàn)很棒,NPC角色外形好看;從“小孩”“孩子\"看出,游客群體存在部分家庭游、親子游群體。topic 4 占比 9.96% ,從“漂流”“雷鳴山”“礦山”等詞可以看出,該主題主要圍繞景點(diǎn)項(xiàng)目,反映的是游客群體比較關(guān)注的重點(diǎn)項(xiàng)目。topic 5占比 12.22% ,“再次”“下次”“還會(huì)”等詞表達(dá)了游客重復(fù)游覽的愿望,側(cè)面反映游客對(duì)整個(gè)景點(diǎn)的認(rèn)可;“童話”“氛圍”則是對(duì)整個(gè)景點(diǎn)的象征。topic6占比 14.47% ,根據(jù)主題特征詞“導(dǎo)游”“服務(wù)\"“安排”,該維度表達(dá)了游客對(duì)于園區(qū)導(dǎo)游或其他工作人員服務(wù)質(zhì)量的關(guān)注;“熱情”“合理”等情感詞表達(dá)了游客對(duì)園區(qū)導(dǎo)游服務(wù)的認(rèn)可。

        表2最佳主題輸出結(jié)果

        LDA模型確定的6個(gè)主題分別從不同方面表征了游客感知形象,依據(jù)主題特征詞的描述,將主題結(jié)果具象化,依次確定“排隊(duì)時(shí)間”“門票價(jià)格”“游玩過(guò)程”“熱門項(xiàng)目”“游玩評(píng)價(jià)”“導(dǎo)游服務(wù)”等6個(gè)主題指標(biāo),其中:“排隊(duì)時(shí)間”“門票價(jià)格”涉及時(shí)間和價(jià)格屬性,納人“感知成本”維度;“游玩過(guò)程”“熱門項(xiàng)目”“游玩評(píng)價(jià)”涉及體驗(yàn)屬性,將其歸屬“感知體驗(yàn)”維度;而“導(dǎo)游服務(wù)”涉及服務(wù)屬性,將其劃為“感知服務(wù)”維度,如表3所示。

        表3游客感知形象維度

        3.3 情感模型訓(xùn)練比較

        3.3.1 粗粒度和細(xì)粒度情感模型訓(xùn)練比較

        基于上文構(gòu)建的人工標(biāo)注情感數(shù)據(jù)集,訓(xùn)練LCF-ATEPC模型,實(shí)驗(yàn)超參數(shù)的設(shè)置參考Yang等的研究結(jié)果[22],并根據(jù)實(shí)驗(yàn)結(jié)果對(duì)超參數(shù)進(jìn)行微調(diào)。表4列出了微調(diào)后的超參數(shù)。同時(shí)為確保模型性能和實(shí)現(xiàn)粗細(xì)情感對(duì)比,選用粗粒度SnowNLP模型作為對(duì)照模型。通過(guò)模型的不斷訓(xùn)練與驗(yàn)證,測(cè)試結(jié)果如表5所示。實(shí)驗(yàn)結(jié)果表明,LCF-ATEPC模型在情感分析任務(wù)中具有優(yōu)秀的情感分析性能。

        表4LCF-ATEPC模型超參數(shù)設(shè)置
        表5實(shí)驗(yàn)結(jié)果對(duì)比

        SnowNLP模型是適用于中文文本處理的情感模型,該模型采用樸素貝葉斯分類器,從標(biāo)注的訓(xùn)練數(shù)據(jù)中預(yù)測(cè)情感并生成情感評(píng)分[23]。由于細(xì)粒度情感模型訓(xùn)練數(shù)據(jù)不適用于粗粒度模型訓(xùn)練,因此本研究通過(guò)人工標(biāo)注篩選了2000條正面和負(fù)面的情感數(shù)據(jù)作為SnowNLP模型訓(xùn)練數(shù)據(jù)。同時(shí)參考Qu 等的研究結(jié)果[24],劃分為消極、中立和積極等3個(gè)情感區(qū)間,分別是[0,0.4)、[0.4,0.6]、(0.6,1.0],訓(xùn)練結(jié)果如表5所示。

        3.3.2 粗粒度與細(xì)粒度情感分析

        基于訓(xùn)練好的情感模型,對(duì)各維度下的游客評(píng)論進(jìn)行情感分析。該模型的輸出結(jié)果包含“原文內(nèi)容”“方面詞”“情感極性”“情感信度”等,如表6所示。其中“方面詞”是情感的載體,情感極性是“方面詞”的具體情感,“情感信度”則是模型對(duì)該“情感極性”計(jì)算出的可信程度。情感信度超過(guò)0.5的被認(rèn)為是可信的。

        表6預(yù)測(cè)結(jié)果(部分)

        在一條評(píng)論文本中,模型往往會(huì)識(shí)別多個(gè)方面詞,并預(yù)測(cè)其情感極性,這些方面詞涉及多個(gè)維度,因此,為了更加準(zhǔn)確地分析各主題情感極性,研究通過(guò)對(duì)主題詞與方面詞進(jìn)行語(yǔ)義匹配,匹配成功后進(jìn)一步統(tǒng)計(jì)其情感極性和情感信度。LCF-ATEPC模型統(tǒng)計(jì)結(jié)果如圖3所示。圖3中,除“排隊(duì)時(shí)間”外,其余主題積極情感占比均高于 75% ,表明游客對(duì)上海迪士尼形象總體持正面態(tài)度,與前文主題特征詞結(jié)果一致。SnowNLP預(yù)測(cè)結(jié)果如圖4所示。

        圖3LCF-ATEP-主題情感占比情況
        圖4SnowNLP-主題情感占比情況

        比較圖3與圖4可以發(fā)現(xiàn),粗細(xì)兩類模型在6個(gè)主題情感預(yù)測(cè)中,各主題情感傾向一致。但在“排隊(duì)時(shí)間”主題中,兩類模型差距超過(guò) 10% ,而在剩余5個(gè)主題中,差異均在 5% 以下,表明兩類模型在情感較為統(tǒng)一的主題中,預(yù)測(cè)結(jié)果差距不大,而在情感沖突較為明顯的主題中,差異較為顯著。兩類模型均預(yù)測(cè)出少量的中立情感,因?yàn)橹辛⑶楦姓急容^少,大部分情感集中在積極和消極兩端,所以表明該景點(diǎn)評(píng)論數(shù)據(jù)中情感偏向兩極。

        兩類模型訓(xùn)練的是同一份情感數(shù)據(jù)集,但在情感標(biāo)注時(shí)采用不同方法,細(xì)粒度情感標(biāo)注出評(píng)論中的每一個(gè)方面詞及其情感傾向,而粗粒度情感標(biāo)注只標(biāo)注整個(gè)評(píng)論的情感傾向。在情感統(tǒng)一維度,單一情感占比較高,兩類模型結(jié)果差距不大,而在情感沖突維度,尤其是單一評(píng)論中表達(dá)積極和消極兩種情感的這類評(píng)論占比較高時(shí),細(xì)粒度情感能識(shí)別不同方面詞的情感傾向,而粗粒度情感對(duì)情感的判斷一方面與訓(xùn)練數(shù)據(jù)集有關(guān),另一方面也受非主題方面詞情感傾向影響,因此其預(yù)測(cè)結(jié)果與細(xì)粒度模型存在較大差異。

        3.4 主題情感誘因分析

        3.4.1 感知成本分析

        在“排隊(duì)時(shí)間”主題指標(biāo)中,負(fù)面情感評(píng)論占比高達(dá) 47.41% ,表明有近一半的游客因排隊(duì)問(wèn)題而產(chǎn)生負(fù)面情緒。結(jié)合圖5的詞云圖分析,由于長(zhǎng)時(shí)間的站立和等待會(huì)導(dǎo)致身體疲勞,這種生理上的不適加劇了負(fù)面情感的出現(xiàn)。此外,外部環(huán)境因素高頻出現(xiàn)在負(fù)面評(píng)論中,如雨天、高溫和寒冷天氣對(duì)游客的影響。雨天往往會(huì)導(dǎo)致戶外游玩設(shè)施關(guān)閉,進(jìn)而使游客產(chǎn)生遺憾情緒,尤其是未能體驗(yàn)到預(yù)期的游玩項(xiàng)目。而高溫和寒冷天氣降低了游客的身體舒適度,進(jìn)一步加劇排隊(duì)期間的負(fù)面情緒,導(dǎo)致游客產(chǎn)生疲憊、焦躁和沮喪等情感。這些情感使游客的游玩焦點(diǎn)集中在排隊(duì)過(guò)程中,降低了對(duì)游玩活動(dòng)的期待和體驗(yàn),并引發(fā)明顯的負(fù)面情感反饋。分析評(píng)論發(fā)現(xiàn),游客對(duì)上海迪士尼推出早鳥票、早享卡和尊享卡等差異化門票服務(wù)表示認(rèn)可。這類門票在一定程度上縮短排隊(duì)等候時(shí)間,提升游玩體驗(yàn)。此外,錯(cuò)峰出行是許多游客在評(píng)論中推薦的出行策略,該方法能有效減少排隊(duì)等待時(shí)間,提高游玩愉悅感。

        圖5 感知成本分析

        在“門票價(jià)格”這一主題指標(biāo)中,積極情感評(píng)論占比 ,說(shuō)明大部分游客能接受門票的定價(jià)。結(jié)合詞云圖分析,游客普遍認(rèn)為通過(guò)攜程購(gòu)買門票性價(jià)比更高。然而,深人分析負(fù)面評(píng)論后發(fā)現(xiàn),不可改簽和不可退票政策是游客抱怨的主要原因。此外,園區(qū)內(nèi)的高消費(fèi)水平也進(jìn)一步激化了游客的負(fù)面情緒,尤其是園區(qū)內(nèi)的餐飲定價(jià)過(guò)高,且味道一般,使得部分游客對(duì)消費(fèi)感到不滿,成為游客吐槽的重點(diǎn)。與此同時(shí),長(zhǎng)時(shí)間的排隊(duì)等待也加重了游客的負(fù)擔(dān),進(jìn)一步導(dǎo)致所支付的票價(jià)與所得到的體驗(yàn)不成正比,產(chǎn)生了性價(jià)比不足的負(fù)面情感。

        3.4.2 感知體驗(yàn)分析

        由圖3可知,“游玩過(guò)程”“熱門項(xiàng)目”和“游玩評(píng)價(jià)”等3個(gè)感知體驗(yàn)的主題占比依次為 87.44%.79.18% 和 88.08% ,表明在整個(gè)游玩體驗(yàn)維度中,游客普遍持有正面積極態(tài)度。如圖6所示,“游玩過(guò)程”出現(xiàn)頻率較高的詞有“開(kāi)心”“好玩”“喜歡”,表明絕大部分游客在景區(qū)游玩過(guò)程中感到愉悅和滿意;此外,“孩子”和“小朋友”等詞的出現(xiàn),暗示上海迪士尼獲得了家長(zhǎng)們的認(rèn)可。在“熱門項(xiàng)目”中,“地平線\"“煙花\"\"動(dòng)物”等詞的高頻出現(xiàn),揭示了這些項(xiàng)目是游客在游玩過(guò)程中產(chǎn)生正面情感的主要來(lái)源,景區(qū)可通過(guò)加強(qiáng)熱門項(xiàng)目體驗(yàn),進(jìn)一步提升游客滿意度和忠誠(chéng)度。而在“游玩評(píng)價(jià)”中,“下次”“值得”“喜歡”“不錯(cuò)\"的出現(xiàn),暗示了游客對(duì)整個(gè)游玩體驗(yàn)感到滿意,并且具有較強(qiáng)的再次游玩意愿。

        在對(duì)3個(gè)感知體驗(yàn)主題的負(fù)面評(píng)論分析中,頻繁出現(xiàn)的關(guān)鍵詞有“排隊(duì)”“人多”“天氣”。特別是帶孩子游玩的游客中,“排隊(duì)”和“天氣”對(duì)其影響尤為突出。通過(guò)進(jìn)一步分析,“高溫”和“寒冷天氣”主要通過(guò)加劇排隊(duì)問(wèn)題進(jìn)而影響游客情緒,而“雨天”則通過(guò)影響“煙花”和“花車”等戶外類項(xiàng)目,致使游客情緒下降。通過(guò)以上分析,在游玩體驗(yàn)中,“熱門項(xiàng)目”是影響游客滿意度的關(guān)鍵因素,而“天氣\"和“排隊(duì)”是帶來(lái)負(fù)面情緒的主要因素。

        圖6 感知體驗(yàn)分析

        3.4.3 感知服務(wù)分析

        如圖3所示,在“導(dǎo)游服務(wù)”中,積極情感占比 90% ,表明多數(shù)游客對(duì)景區(qū)服務(wù)質(zhì)量持有積極評(píng)價(jià)。在圖6(d)中,高頻詞有“導(dǎo)游”“服務(wù)”“態(tài)度”“安排”,而對(duì)應(yīng)的積極情感詞匯主要有“熱情”“開(kāi)心”“周到”“不錯(cuò)”。這反映出上海迪士尼工作人員在服務(wù)方面的高水平。例如評(píng)論“導(dǎo)游全程陪伴陪玩,安排合理,項(xiàng)目全部輕松刷完,很好的迪土尼之旅”,這種高質(zhì)量的導(dǎo)游服務(wù)顯著提升了游玩體驗(yàn),使得許多游客在評(píng)論中主動(dòng)推薦導(dǎo)游服務(wù)。盡管該主題負(fù)面評(píng)論占比較少,僅為 7.55% ,但通過(guò)深入解讀后,“態(tài)度”是負(fù)面評(píng)論中出現(xiàn)頻率最高的關(guān)鍵詞,而對(duì)應(yīng)的情感詞為“太差”。綜合圖3和圖6可以發(fā)現(xiàn),合理的路線規(guī)劃和熱情的服務(wù)態(tài)度是影響游客情感變化的關(guān)鍵因素,這表明導(dǎo)游在服務(wù)過(guò)程中,既要保證行程安排的合理性,也需要注重態(tài)度和情感互動(dòng),以進(jìn)一步提升游客滿意度。

        4 結(jié)論與討論

        4.1 結(jié)論

        本研究以攜程網(wǎng)在線游客評(píng)論為數(shù)據(jù)來(lái)源,采用主題模型與細(xì)粒度情感分析相結(jié)合的方式,深人挖掘游客對(duì)上海迪士尼的感知形象與情感偏好。通過(guò)LDA主題模型對(duì)游客的感知偏好進(jìn)行識(shí)別,構(gòu)建了多個(gè)游客感知主題,并進(jìn)一步運(yùn)用LCF-ATEPC細(xì)粒度情感模型解析游客的情感傾向,形成了與傳統(tǒng)粗粒度情感分析模型(如SnowNLP)的對(duì)比,為情感分析提供了新的研究思路和方法。研究發(fā)現(xiàn):

        (1)游客對(duì)上海迪士尼樂(lè)園的整體情感偏向積極,整體情感評(píng)分較高。然而,粗粒度情感模型與細(xì)粒度情感模型在情感沖突維度上展現(xiàn)出顯著差異,特別是在包含多重情感表達(dá)的評(píng)論中,細(xì)粒度情感分析能夠更精確地識(shí)別不同方面術(shù)語(yǔ)及其情感極性,提供更細(xì)致的情感分析視角,揭示了細(xì)粒度情感分析在處理復(fù)雜情感表達(dá)中的優(yōu)勢(shì)。

        (2)排隊(duì)時(shí)間是游客產(chǎn)生負(fù)面情緒的主要原因之一,尤其在高溫、寒冷或雨天等不利天氣條件下,游客的負(fù)面情感更為顯著。長(zhǎng)時(shí)間排隊(duì)不僅導(dǎo)致游客情緒不滿,還降低了他們對(duì)游玩體驗(yàn)的期待,進(jìn)而影響他們對(duì)門票性價(jià)比的認(rèn)知和整體滿意度。天氣因素對(duì)游客的情感影響尤為突出,雨天使得一些戶外游樂(lè)設(shè)施無(wú)法開(kāi)放,導(dǎo)致游客的遺憾情緒增加,而極端天氣(如高溫和寒冷天氣)則通過(guò)降低游客的身體舒適度,進(jìn)一步加劇了排隊(duì)過(guò)程中的不愉快體驗(yàn)。

        (3)在游玩服務(wù)方面,導(dǎo)游服務(wù)游客滿意度最高。游客普遍對(duì)導(dǎo)游的服務(wù)態(tài)度和專業(yè)水平表示認(rèn)可,認(rèn)為其有效提升了游玩體驗(yàn)。而門票價(jià)格、游玩過(guò)程中的服務(wù)質(zhì)量以及熱門項(xiàng)目的體驗(yàn),則是游客情感中積極情緒的主要來(lái)源。特別是熱門項(xiàng)目對(duì)游客的滿意度有著決定性的影響,能夠有效提升游客的整體情感體驗(yàn)。

        4.2 討論

        游客對(duì)旅游目的地的形象感知在旅游管理和營(yíng)銷中具有重要意義,尤其是感知維度的科學(xué)性和準(zhǔn)確性直接影響到目的地形象的建立與優(yōu)化。首先,本文通過(guò)LDA主題模型對(duì)游客感知維度進(jìn)行建模,相較于傳統(tǒng)的高頻詞分析方法,LDA模型提供了一種更為精細(xì)化的度量方式,能夠從多個(gè)層面提煉游客感知的多維信息,為目的地形象的構(gòu)建提供了更加系統(tǒng)化的理論基礎(chǔ)。其次,通過(guò)對(duì)游客情感的深度分析,本文進(jìn)一步優(yōu)化了旅游目的地感知的情感度量方法。通過(guò)引人LCF-ATEPC細(xì)粒度情感分析模型,將情感分析從傳統(tǒng)的句子級(jí)別延伸至方面級(jí)別,精準(zhǔn)捕捉了游客在不同場(chǎng)景下的多維情感表達(dá)。這不僅豐富了情感分析的測(cè)量方法,也為旅游管理者提供了更為細(xì)致和真實(shí)的游客情感數(shù)據(jù),進(jìn)而優(yōu)化了游客目的地感知的整體框架。最后,選取熱門旅游景點(diǎn)上海迪士尼作為本研究實(shí)證對(duì)象,運(yùn)用LCF-ATEPC細(xì)粒度情感模型與SnowNLP粗粒度情感模型進(jìn)行對(duì)比研究,揭示了情感沖突維度中兩種模型的顯著差異?,F(xiàn)實(shí)場(chǎng)景下,游客評(píng)論常常涉及多個(gè)評(píng)價(jià)維度,非自標(biāo)對(duì)象的情感會(huì)對(duì)目標(biāo)對(duì)象的情感評(píng)估產(chǎn)生干擾。傳統(tǒng)的粗粒度情感分析方法未能有效解決這一問(wèn)題,而本文采用的細(xì)粒度情感分析則通過(guò)甄別主題方面詞,有效減輕了其他維度情感的干擾,提供了更加細(xì)致且準(zhǔn)確的情感視角。

        參考文獻(xiàn)

        [1]楊發(fā)鵬,白銀霞.新疆屯墾旅游形象對(duì)旅游忠誠(chéng)度的影響研究:以石河子地區(qū)為例[J],石河子大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版),2018(3):50-56.

        [2]譚紅日,劉沛林,李伯華.基于網(wǎng)絡(luò)文本分析的大連市旅游目的地形象感知[J].經(jīng)濟(jì)地理,2021(3):231-239.

        [3] DEY B, SARMA M K. Information source usageamong motive-based segments of travelers to newlyemerging tourist destinations[J]. Tourism manage-ment,2009 (3):341-344.

        [4] HUANG C Y, CHOU C J, LIN P C. Involvementtheory in constructing bloggers' intention to purchasetravel products[J]. Tourism management, 2010(4):513-526.

        [5]王承云,戴添樂(lè),蔣世敏,等.基于網(wǎng)絡(luò)大數(shù)據(jù)的上海紅色旅游形象感知與情感評(píng)價(jià)研究[J],旅游科學(xué),2022 (2):138-150.

        [6]孫曉東,倪榮鑫.中國(guó)郵輪游客的產(chǎn)品認(rèn)知、情感表達(dá)與品牌形象感知:基于在線點(diǎn)評(píng)的內(nèi)容分析[J].地理研究,2018(6):1159-1180.

        [7]和澤海,陶玉國(guó),張紅霞.基于多源異構(gòu)評(píng)論的旅游目的地形象及其影響因素:情感分析視角[J].世界地理研究,2024(10):168-179.

        [8]LI R, LI Y Q, RUAN W Q, et al. Sentiment miningof online reviews of peer-to-peer accommodations:customer emotional heterogeneity and its influencingfactors[J/OL]. Tourism management, 2023,96:104704[2024-08-21].https://doi. org/10.1016/j.tourman.2022.104704.

        [9]TAO YG,LIU WJ,HUANG ZF,et al. Thematicanalysis of reviews on the air quality of tourist destina-tions from a sentiment analysis perspective[J/OL].Tourism management perspectives, 2022,42: 100969[2024-08-23]. https://doi. org/10.1016/j. tmp.

        [10] LIU Y,HUANG K X,BAO J G, et al. Listen tothe voices from home: an analysis of chinese tour-ists' sentiments regarding australian destinations[J].Tourism management, 2019,71:337-347.

        [11] ALAEI A R, BECKEN S, STANTIC B. Sentimentanalysis in tourism: capitalizing on big data J].Journal of travel research, 2019 (2): 175-191.

        [12]BIAN Y W,YE R S, ZHANG J,et al. Customerpreference identification from hotel online reviews: aneural network based fine-grained sentiment analysis[J/OL]. Computers amp; industrial engineering,2022,172:108648[2024-08-15].https://doi. org/10.1016/j.cie.2022.108648.

        [13]DRAGONI M, KESSLER F B. A three-phase ap-proach for exploiting opinion mining in computationaladvertising[J]. IEEE intelligent systems, 2017(3):21-27.

        [14]TOIVONEN T,HEIKINHEIMO V,F(xiàn)INK C,etal. Social media data for conservation science: amethodological overview[J]. Biological conservation,2019,233:298-315.

        [15] SANCHEZ-FRANCO M J,REY-MORENO M. Dotravelers' reviews depend on the destination? Ananalysis in coastal and urban peer-to-peer lodgings[J].Psychology amp; marketing,2021 (2):441-459.

        [16]王才雪,陳堅(jiān),傅志妍,等.基于社交網(wǎng)絡(luò)數(shù)據(jù)的城市軌道交通服務(wù)質(zhì)量評(píng)價(jià)模型[J],鐵道科學(xué)與工程學(xué)報(bào),2023(5):1871-1879.

        [17] DASHTIPOUR K, GOGATE M, LI J P, et al. Ahybrid Persian sentiment analysis framework: in-tegrating dependency grammar based rules and deepneural networks[J]. Neurocomputing,2020, 380:1-10.

        [18]ABUZAYED A,AL-KHALIFA H. BERT for Ara-bic topic modeling: an experimental study on BERT-opic technique[J]. Procedia computer science,2021,189:191-194.

        [19]張東鑫,張敏.圖情領(lǐng)域LDA主題模型應(yīng)用研究進(jìn)展述評(píng)[J].圖書情報(bào)知識(shí),2022(6):143-157.

        [20]楊楊,錢易鑫,吳明佳.國(guó)際海洋生態(tài)補(bǔ)償研究綜述:基于LDA主題模型的潛在語(yǔ)義分析[J/OL].海洋湖沼通報(bào),2024:1-10[2024-06-18].https://link.cnki.net/urlid/37.1141.p.20240125.0826.002.

        [21] 馬小賓,章錦河.國(guó)外游客對(duì)世界文化遺產(chǎn)蘇州園林的形象認(rèn)知研究:基于自然語(yǔ)言處理的不同粒度分析[J].中國(guó)生態(tài)旅游,2022(4):550-565.

        [22] YANGH,ZENGBQ,YANGJH,et al.A multi-task learning model for Chinese-oriented aspect po-larity classification and aspect term extraction[J].Neurocomputing,2021,419:344-356.

        [23] YE T,ZHAO S Y,LAU C K M,et al. Socialmedia sentiment of hydrogen fuel cell vehicles in Chi-

        na:evidencefrom artificial intelligence algorithmsJ/ OL].Energy economics,2024,133:107564[2024- 10-19].https://doi.org/10.1016/j.eneco. 2024. 107564. [24]QU H M,TEH B T,NORDIN N A,et al. Analysis of Guangzhou city image perception based on weibo text data(2019-2023)[J/OL].Heliyon,2024 (17):e36577[2024-10-19].https://doi.org/10. 1016/j.heliyon.2024.e36577.

        Research on Tourists’ Perception of Destination Images Based on Fine-Grained Sentiment Analysis

        —Taking Shanghai Disneyland as an Example

        Jian Hongbo, Chen Jian, Wu Xiaotong (College of Traffic amp; Transportation, Chongqing Jiaotong University, Chongqing 400074, China)

        Abstract: Sentiment analysis is an important tool to study tourists' perception of destination images. The scientific natureof the analysis processand the accuracy of the results significantly impact on the formation of these perceived images.This paper takes online reviews of Shanghai Disneyland as the data source,employs the LDA (latent dirichlet allocation) model to construct the dimensions of tourists' perceived images. It integrates the LCF-ATEPC (local context focused aspect term extraction and polarity classification) fine-grained sentiment model to conduct an in-depth analysis of tourists' sentiments. The SnowNLP (snow natural language processing) coarse-grained sentiment model is selected as a benchmark to explore the differences between the two types of sentiment analysis approaches. Based on the results of finegrained sentiment analysis, word cloud diagrams are used to identify emotional triggers. The results show that: tourist reviews contain multi-dimensional sentiment polarities. Significant differences are observed between the fine-grained and coarse-grained model results, especiall in the dimension of sentiment conflict. Positive emotional triggers include fun,convenience,rationality and enthusiasm,while negative emotional triggers involve frequent and long queues,and external environmental factors,such as high temperature, cold weather, and holidays, exacerbate negative emotional reactions to a certain extent.

        Keywords: tourism travel; perceived image; fine-grained sentiment; theme mining; LDA

        猜你喜歡
        情感分析模型
        一半模型
        隱蔽失效適航要求符合性驗(yàn)證分析
        如何在情感中自我成長(zhǎng),保持獨(dú)立
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        失落的情感
        北極光(2019年12期)2020-01-18 06:22:10
        情感
        電力系統(tǒng)不平衡分析
        電子制作(2018年18期)2018-11-14 01:48:24
        如何在情感中自我成長(zhǎng),保持獨(dú)立
        電力系統(tǒng)及其自動(dòng)化發(fā)展趨勢(shì)分析
        日韩女同一区二区三区久久| 无遮挡边吃摸边吃奶边做| 日韩在线第二页| 中文字幕精品人妻av在线| 免费观看人妻av网站| 国产精品久久久久久久| 日本一区二区三区视频网站| 国产精品无码无片在线观看3d| 久久久久久久99精品国产片| 香蕉亚洲欧洲在线一区| 国产一区资源在线播放| 韩国三级在线观看久| 无码中文字幕人妻在线一区二区三区| 国产视频在线一区二区三区四区| 一二三四在线观看韩国视频| 激情综合色综合啪啪开心| 国产欧美日韩综合精品二区| 91福利国产在线观一区二区 | 中文字幕日本一区二区在线观看| 久久av不卡人妻出轨一区二区| 夜夜揉揉日日人人青青| 亚洲欧美日韩高清专区一区| 久久精品国产亚洲av热一区| 亚洲一区二区三区精品| 国产精品美女久久久网av| 成全高清在线播放电视剧| 久久99精品中文字幕在| 深夜日韩在线观看视频| 国产精品日本一区二区在线播放| 久久久久亚洲av无码观看| 欧美丝袜秘书在线一区| 亚洲av人片在线观看| 蜜桃久久精品成人无码av| 无码人妻丰满熟妇啪啪7774| 久久99久久99精品观看| 一本色道久在线综合色| 色综合久久久久久久久久 | 国内精品视频成人一区二区| 伊人久久大香线蕉av最新午夜| 亚洲av久久久噜噜噜噜| 狠狠狠色丁香婷婷综合激情|