亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于LDA主題模型的興文石海景區(qū)在線評論情感挖掘分析

        2025-07-25 00:00:00戴慶春郭香君尹瑞琦榮幸
        中國市場 2025年21期
        關鍵詞:石海興文景區(qū)

        摘 要:目前游客通過旅游平臺了解、評價旅游目的地,發(fā)表旅游感受已經(jīng)成為常態(tài),如果能有效挖掘這些游客留下的大量評論信息,對于改善旅游體驗、提升旅游目的地品質(zhì)不無裨益。文章首先抓取2019年6月—2023年6月,攜程、同程、去哪兒關于宜賓興文石海的3175條評論信息;其次運用LDA主題模型進行文本挖掘,提取游玩內(nèi)容、交通狀況、設施服務、自然風光4個主題;再利用Python中的SnowNLP庫對提取的關鍵詞進行情感分析,判定游客的正面和負面情緒,了解景區(qū)需要改進完善之處;最后從軟硬件提升、文化挖掘與展示等方面提出改進建議。

        關鍵詞:興文石海景區(qū);LDA主題模型;文本挖掘技術;SnowNLP情感分析

        中圖分類號:F592.7文獻標識碼:A文章編號:1005-6432(2025)21-0106-04

        DOI:10.13939/j.cnki.zgsc.2025.21.027

        1 引言

        興文石海景區(qū)位于四川省宜賓市興文縣石海鎮(zhèn)境內(nèi),是聯(lián)合國教科文組織批準的第二批世界地質(zhì)公園,國家重點風景名勝區(qū)、國家AAAA級旅游區(qū)??偯娣e約156平方千米,核心景區(qū)14平方千米范圍內(nèi)集中了石海景觀、地下溶洞群、世界級的大漏斗,被專家譽為喀斯特地貌博物館。文章旨在借助網(wǎng)絡文本挖掘技術,通過分析游客在旅游網(wǎng)站上發(fā)布的對于興文石海的評論信息,了解游客關注的主題和他們的情感傾向,以期為興文石海景區(qū)管理者提供游客體驗的數(shù)據(jù)及分析結論,有助于提升興文石海的旅游體驗,為其可持續(xù)發(fā)展提供支持。

        2 研究方法

        2.1 文本挖掘技術

        文本挖掘(TM,text mining)是以計算語言學、數(shù)理統(tǒng)計為理論基礎,結合信息檢索技術、機器學習從文本數(shù)據(jù)中發(fā)現(xiàn)和提取隱含信息。它是一個從文本信息描述到選取提取模式,最終形成用戶可理解的信息知識的過程。

        2.2 LDA主題模型

        主題模型是一種語言模型,是在機器學習和自然語言處理等領域用來在一系列文檔中發(fā)現(xiàn)隱含主題的一種統(tǒng)計模型,可以對文本進行語義挖掘。LDA(latent dirichlet allocation)主題模型由Blei于2003年提出,包含詞項、主題和文檔三層結構,基本思想是把文檔看成其隱含主題的混合,而每個主題則表現(xiàn)為跟該主題相關的詞項的概率分布,文檔和單詞都是可交換的,忽略單詞在文檔中的順序和文檔在語料庫中的順序,從而將文本信息轉化為易于建模的數(shù)字信息。

        2.3 SnowNLP情感分析

        SnowNLP是一個基于TextBlob的中文自然語言處理Python庫,其主要功能包括中文分詞、情感分析、文本分類等。SnowNLP使用的是樸素貝葉斯原理來訓練和預測數(shù)據(jù),可以對中文文本進行情感分析,操作簡單且容易實現(xiàn)。SnowNLP模塊會逐一計算每一條文本的正面情感概率。當正面情感概率P≥0.5 時認為該評論為正面情感評論,Plt;0.5時則為負面情感評論。

        3 研究設計

        首先,通過自行編寫的網(wǎng)絡爬蟲軟件,在去哪兒、攜程和同程等主流旅游平臺上以“興文石海”為關鍵詞,進行評論文本數(shù)據(jù)的采集和抓?。黄浯?,對獲取的評論數(shù)據(jù)進行去重、分詞和去停用詞等預處理;再次,對經(jīng)過預處理的文本數(shù)據(jù)使用Python的gensim庫來構建 LDA主題模型,得到主題數(shù)量及主題關鍵詞;最后,運用Python中的SnowNLP庫對主題及關鍵詞進行情感分析,并基于上述研究結論提出了對策建議。研究流程詳見圖1。

        4 數(shù)據(jù)獲取及預處理

        4.1 在線評論數(shù)據(jù)來源

        攜程、同程和去哪兒這三家旅游資訊平臺經(jīng)過多年的積累,擁有龐大的用戶群體,重視內(nèi)容生態(tài),支持用戶撰寫游記、攻略、評論打分。選擇攜程、同程和去哪兒作為文章數(shù)據(jù)獲取渠道,確保了評論數(shù)據(jù)的有效性、真實性和樣本數(shù)量的充足性。文章運用 Python編寫的爬蟲程序,抓取了2019年6月至2023年6月,上述三大平臺上關于“興文石海”的3175條評論。每條評論數(shù)據(jù)都具有用戶評分、評論內(nèi)容、時間、年以及評論長度這5個特征。

        4.2 數(shù)據(jù)預處理

        4.2.1 數(shù)據(jù)去重

        為了吸引到更多的游客,景區(qū)會選擇刷較多重復的高分好評,使景區(qū)的評分偏高;同時,為了誘導游客對景區(qū)進行評論,景區(qū)對參與評論的游客進行回饋,此類游客為了省事,會直接復制好評的評論。對于以上行為,產(chǎn)生了較多的重復評論,并造成數(shù)據(jù)的失真,因此,這一類評論文本必須進行去重處理。

        4.2.2 去停用詞和分詞

        抓取的評論文本屬于非結構化數(shù)據(jù),存在大量的噪聲數(shù)據(jù),如各種表情符、特殊符號、網(wǎng)頁標簽等;同時還有大量的高頻但無實際意義的詞,如各種語氣助詞、連接詞、介詞等。正式進行文本挖掘前需要進行去停用詞和分詞處理。文章停用詞庫的構建主要是選取哈工大 、百度和四川大學停用詞庫進行停用詞去重整合,再利用Python中Jieba包完成文本信息的分詞。

        在經(jīng)過分詞和去停用詞后,查看輸出結果,對軟件分析不準確或分詞錯誤的部分進行人為修正,將修正的詞語加入到用戶自定義詞典中,與研究無關的詞匯添加到停用詞表中,不斷重復上述過程,直至隨機抽取評論展示的分詞效果良好。

        5 LDA主題模型

        5.1 詞頻分析

        對抓取的數(shù)據(jù)做詞頻分析,為直觀地展現(xiàn)用戶評論所關注的重點與主題,摘取評論分詞后頻率最高的前40個詞語,利用Python中的Wordcloud繪制高頻詞詞云,圖中文字的大小對應詞匯出現(xiàn)頻次的高低(詳見圖2)。

        圖2 詞云

        從表1的高頻詞分布來看,可以得出以下五點結論。

        第一,游客最關注的是景區(qū)的風景,“景點”“景色”“風景”“景觀”“環(huán)境”等詞的詞頻數(shù)較多,排在詞頻統(tǒng)計表的前面,表現(xiàn)出游客對景區(qū)的期待中,風景好的程度占比較高。

        第二,高頻詞“溶洞”“天坑”“天泉”“燈光”“懸棺”等內(nèi)容是景區(qū)的主要游玩地點,景區(qū)薈萃了中國南方最具代表性的喀斯特地質(zhì)景觀,著名景觀有天泉洞、地表石海、天下第一漏斗,與游客感受到的相契合。

        第三,“停車場”“交通”“觀光車”“電梯”“走路”等詞的詞頻數(shù)表現(xiàn)出游客對景區(qū)的基礎設施要求,游客如何到達景區(qū)以及在景區(qū)內(nèi)往返的便捷性。

        第四,“門票”“工作人員”“服務”“特色”“訂票”“價格”“優(yōu)惠”等詞反映出游客對景區(qū)收費與服務的關心,買票的便捷性、工作人員的服務態(tài)度將會影響游客對景區(qū)的評價。

        第五,“朋友”“夫妻”“家人”“孩子”“大家”等詞的出現(xiàn),反映出景區(qū)的游客人群比較廣泛,可以和孩子一起游玩,也可以和朋友們一起游玩,出游形式多樣。

        5.2 主題提取

        文章基于Python的Gensim庫構建LDA主題模型,用于識別游客關注的景區(qū)主題特征。通過主題間距分析發(fā)現(xiàn),當主題數(shù)量設置為4時,模型表現(xiàn)出最優(yōu)的區(qū)分度:各主題在語義空間中的離散程度最大,且主題間重疊程度最低。這一結果表明,4個主題的設定能夠有效捕捉游客關注點的異質(zhì)性特征,同時保持主題間的獨立性和可解釋性。因此,本研究最終采用4個主題的模型架構進行后續(xù)分析。

        將主題數(shù)4代入LDA 模型,在生成主題關鍵詞中選擇前10個關鍵詞,這10個關鍵詞確定了每個主題的核心特征。根據(jù)每個主題的主題關鍵詞表達的相似內(nèi)容為主題命名。根據(jù)主題一的關鍵詞內(nèi)容,大多為對于興文石海景區(qū)游玩內(nèi)容的描述,例如“石?!薄疤烊钡?,故將主題一命名為“游玩內(nèi)容”;主題二的關鍵詞內(nèi)容大都為對于景區(qū)交通與路程的描述,例如“車位”“觀光車”等,故將主題二命名為“交通狀況”;主題三的關鍵詞內(nèi)容大都為景區(qū)服務內(nèi)容與基礎設施,例如“門票”“垃圾桶”等,故將主題三命名為“設施服務”;主題四的關鍵詞與主題一相近,但主要為對于景區(qū)風景的描述,故將主題四命名為“自然風光”。具體內(nèi)容如表2所示。

        6 情感分析

        借助Python中的SnowNLP情感分析器對在線評論進行情感值計算,輸出結果范圍為0~1,所得結果分數(shù)越高即表示情感傾向越積極,所得結果分數(shù)越低即表示情感傾向越消極。

        根據(jù)情感分析,游客對景區(qū)的積極情感傾向主要來源于。

        第一,對于景區(qū)風景秀麗,奇特景觀的贊嘆。評論中提到“國家級風景名勝區(qū),中國最美的十大地質(zhì)公園,里面自然奇觀數(shù)不勝數(shù)”“嘆為觀止,大自然的鬼斧神工”“見證大自然的鬼斧神工,將自身融入大自然中,放松自我,享受生活”。景區(qū)特有的地質(zhì)條件,喀斯特地貌與地下溶洞等奇特景觀是興文石海的核心競爭力。

        第二,對多元游玩方式的喜歡。“周末帶孩子出來玩”“大人孩子都玩兒得很開心”“和朋友一起出去玩”“景區(qū)游玩項目老少皆宜,并設有親子互動項目與戶外探險項目,可用于家人、朋友們一起運動,冒險”“增長見聞,研學有收獲”。景區(qū)自然景觀、地質(zhì)遺跡與僰苗文化相融,有研學價值,值得深挖。

        第三,對票價和購票便捷的滿意?!熬W(wǎng)上訂票要便宜20元,我們?nèi)齻€人就省掉了60元”“同程訂的9.9的門票,超值”“取票很方便,購票的二維碼或者訂票人的身份證”。景區(qū)在多種平臺上售票,聯(lián)合平臺設置優(yōu)惠套餐,對游客有一定吸引力。

        游客對景區(qū)的消極情感傾向主要來源于:

        第一,對景區(qū)管理水平的詬病。“配套太差,住不好吃不好”“服務差,外面歪導游多,也沒有人管理。景區(qū)管理混亂”“配套差,特別是餐飲,宰客”。 景區(qū)內(nèi)外的住宿與餐飲好壞情況對游客是否選擇前來游玩有較大影響。

        第二,對交通不方便的抱怨?!耙宦奉嶔まD了兩趟大巴花了將近四個小時終于進入了石海。長途跋涉后讓人的興致頓時減少”“交通票現(xiàn)場買的,有點坑”“走了五個多小時”。自然風光獨特的景區(qū)往往地處較偏遠,交通問題是個難題。

        7 結論與建議

        文章通過LDA模型對網(wǎng)絡平臺評價文本進行情感挖掘分析,獲取文本信息中所表達的情感傾向,了解游客對興文石海景區(qū)自然風光、旅游項目、設施服務的體驗,得出的研究結論有利于提高興文石海景區(qū)的管理、服務水平?;谝陨涎芯?,對興文石海景區(qū)提出以下建議。

        第一,加大投入,優(yōu)化和完善旅游設施。包括提升交通設施,如增設停車場、優(yōu)化景區(qū)內(nèi)的交通線路;改善住宿條件,提供多樣化的住宿選擇,滿足不同游客的需求;完善餐飲設施,提供豐富多樣的地方特色美食;增設休息娛樂設施,如休息區(qū)、游客服務中心等,以提升游客的舒適度和滿意度。

        第二,加強對石海文化的挖掘和研究,通過舉辦文化講座、展覽等形式,向游客展示石海文化的魅力和價值。同時,結合地方歷史文化,開發(fā)具有特色的文化體驗項目,使游客在游覽過程中能夠深入了解和體驗石海文化。

        第三,建立完善的游客服務管理體系,包括優(yōu)化游客導覽系統(tǒng)、加強安保措施、提高服務人員素質(zhì)等。同時,建立游客反饋機制,及時了解游客的需求和意見,不斷改進服務質(zhì)量,提升游客的滿意度和忠誠度。

        第四,開展異業(yè)合作拓寬旅游項目。利用石海大溶洞空曠的場地、天然的混響效果,聯(lián)合音樂節(jié)主辦機構舉辦一年一度的“溶洞音樂節(jié)”,借助新媒體進行有效傳播,吸引更多的年輕人,打造成特色項目。

        參考文獻:

        [1]司育.基于LDA主題模型的山西省熱門景區(qū)綜合評價體系研究[D].太原:山西財經(jīng)大學,2023.

        [2]孫正軒,馬海群.基于LDA主題模型的信息行為熱點主題及發(fā)展趨勢研究[J].情報探索,2023(11):35-43.

        [3]張大釗,李顯正,趙振斌,等.基于LDA制圖分析的古鎮(zhèn)旅游地游客商業(yè)化體驗及空間結構——以大理古城為例[J].經(jīng)濟地理,2023,43(8):200-209.

        [4]郝若琳,黃萍,何慧敏,等.四川省5A級旅游景區(qū)線上評論的文本情感分析[J].西部旅游,2022(12):1-3.

        [5]張學民,趙明宇.基于LDA和情感分析的西塘古鎮(zhèn)旅游形象研究[J].河北工業(yè)大學學報(社會科學版),2020,12(3):23-30

        猜你喜歡
        石海興文景區(qū)
        千軍萬馬奪陳倉
        商界(2025年8期)2025-08-21 00:00:00
        攀登五大連池火山
        家庭百事通(2025年8期)2025-08-18 00:00:00
        1元冰棍如何拯救一個破產(chǎn)5A級景區(qū)
        領導文萃(2025年15期)2025-08-12 00:00:00
        民族村寨旅游社區(qū)化與景區(qū)化路徑特征與成因研究
        馬嵬驛:玩轉“唐風+” 喚醒千年古驛站
        低空經(jīng)濟視域下無人機技術在旅游景區(qū)中的創(chuàng)新融合應用
        国产免费爽爽视频在线观看 | 亚洲av无码不卡久久| 综合网在线视频| 日本视频一区二区二区| 丰满少妇在线播放bd| 99久久精品午夜一区二区| 国产成人精品三级麻豆| 亚洲大尺度动作在线观看一区| 日本一区二区三区爱爱视频| 日日噜噜夜夜狠狠va视频v| 国产老熟女狂叫对白| 国产精品av在线一区二区三区 | 日本一区二区在线高清观看| 色avav色av爱avav亚洲色拍| 国产一级大片免费看| 国产在线视频网站不卡| 白白发在线视频免费观看2| 区二区三区玖玖玖| 中文字幕在线日韩| 亚洲情精品中文字幕99在线| 亚洲乱码无人区卡1卡2卡3| 亚洲日韩v无码中文字幕| 午夜国产精品久久久久| 日本一区二区高清精品| 国产三级av在线播放| 99久久婷婷国产综合亚洲91 | 玩弄丝袜美腿超短裙校花| 人妻少妇偷人精品免费看| 97夜夜澡人人爽人人喊中国片| 久久久久一| 人妻中文字幕一区二区视频| 中文字幕日本人妻久久久免费| 亚洲色在线视频| 中文字幕 在线一区二区| 国产成人无码一区二区三区| 在线亚洲人成电影网站色www | 亚洲精品美女久久久久99| 亚洲天堂av在线网站| 成人免费看片又大又黄| 在线观看国产三级av| 久久日本视频在线观看|