亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于社交媒體的海南旅游景區(qū)評價(jià)數(shù)據(jù)集

        2019-11-18 08:10:46林振宇解吉波覃佐淼楊騰飛趙靜
        關(guān)鍵詞:海南島數(shù)據(jù)量文件夾

        林振宇,解吉波,覃佐淼,楊騰飛,趙靜

        1.海南省地球觀測重點(diǎn)實(shí)驗(yàn)室,海南三亞 572000

        2.中國科學(xué)院遙感與數(shù)字地球研究所,數(shù)字地球重點(diǎn)實(shí)驗(yàn)室,北京 100094

        3.河南理工大學(xué),河南焦作 454000

        數(shù)據(jù)庫(集)基本信息簡介

        數(shù)據(jù)庫(集)名稱 基于社交媒體的海南旅游景區(qū)評價(jià)數(shù)據(jù)集數(shù)據(jù)作者 林振宇,解吉波,覃佐淼,楊騰飛,趙靜數(shù)據(jù)通信作者 解吉波(xiejb@radi.ac.cn)數(shù)據(jù)時(shí)間范圍 2012年1月至2018年10月地理區(qū)域 地理范圍包括海南島(北緯 18°10′-20°10′,東經(jīng) 108.37°-111.03°)。數(shù)據(jù)量 58.8 MB數(shù)據(jù)格式 *.rar, *.sql, *.xlsx數(shù)據(jù)服務(wù)系統(tǒng)網(wǎng)址 http://www.sciencedb.cn/dataSet/handle/714基金項(xiàng)目 海南省重大科技計(jì)劃項(xiàng)目(ZDKJ2016021)數(shù)據(jù)庫(集)組成數(shù)據(jù)集由1個(gè)壓縮包組成,主要包括5個(gè)文件夾,數(shù)據(jù)量約125 MB,壓縮后數(shù)據(jù)量約58.8 MB。5個(gè)文件夾分別為美團(tuán)、同程、途牛、攜程、樣例數(shù)據(jù),每個(gè)文件夾下由各旅游網(wǎng)站的景區(qū)評論數(shù)據(jù)組成,以兩種數(shù)據(jù)形式存放(*.sql, *.xlsx)。

        引 言

        旅游是海南省的經(jīng)濟(jì)支柱產(chǎn)業(yè)之一,對其他相關(guān)產(chǎn)業(yè)的發(fā)展有著較強(qiáng)的帶動(dòng)作用。研究和提高海南各景區(qū)的服務(wù)質(zhì)量,滿足游客多元化的旅游需求,對進(jìn)一步促進(jìn)海南旅游產(chǎn)業(yè)的發(fā)展至關(guān)重要。

        隨著旅游互聯(lián)網(wǎng)的快速發(fā)展,大量和旅游景區(qū)相關(guān)的用戶評論信息為旅游業(yè)的發(fā)展研究提供了有力數(shù)據(jù)支持。更多的潛在游客,會(huì)在出行前根據(jù)這些評論信息制定旅游路線,協(xié)助旅游決策[1-3]。通常,這些數(shù)據(jù)信息多以文本、圖片的形式出現(xiàn)在各大社交媒體平臺上。這些信息通常表達(dá)了游客對于相關(guān)景區(qū)的意見、建議和滿意度,從而為景區(qū)質(zhì)量和服務(wù)的進(jìn)一步提升提供有效參考。目前,國內(nèi)外已有不少學(xué)者對景區(qū)的社交媒體信息展開相關(guān)研究,并從不同方面探討它們的應(yīng)用。如文獻(xiàn)[4]以眾包的形式收集秦皇島高校大學(xué)生對當(dāng)?shù)芈糜尉皡^(qū)的評論信息,并結(jié)合這些數(shù)據(jù)提供者的個(gè)人信息開展用戶畫像的旅游情境化推薦服務(wù)研究;文獻(xiàn)[5]利用多模態(tài)的景點(diǎn)信息(文本、地理標(biāo)記圖片以及視頻生成景點(diǎn)的信息摘要),根據(jù)用戶的查詢?yōu)橛脩魝€(gè)性化地推薦景點(diǎn);文獻(xiàn)[6-8]基于簽到記錄數(shù)據(jù)來進(jìn)行旅游路線的推薦等。然而目前,可用的基于社交媒體的開放旅游景區(qū)評論數(shù)據(jù)集并不多,這嚴(yán)重制約了旅游信息挖掘的研究。為此,本文以海南島為研究對象,從主流旅游網(wǎng)站(包括美團(tuán)網(wǎng)、途牛網(wǎng)、同程網(wǎng)以及攜程網(wǎng)等)上收集和處理了2012-2018年間所有4A和5A級旅游景區(qū)的評論數(shù)據(jù)構(gòu)建了數(shù)據(jù)集。

        1 數(shù)據(jù)采集和處理方法

        本數(shù)據(jù)集的生產(chǎn)流程包括數(shù)據(jù)采集與清洗,數(shù)據(jù)管理和數(shù)據(jù)分類。數(shù)據(jù)制作流程如圖1所示。

        圖1 數(shù)據(jù)集制作流程圖

        1.1 景區(qū)評論數(shù)據(jù)的采集與清洗

        該部分?jǐn)?shù)據(jù)以海南島4A和5A級景區(qū)為研究對象,將4A和5A級景區(qū)分為4種類型,分別為自然景區(qū)、歷史人文景區(qū)、民俗風(fēng)情景區(qū)、休閑度假景區(qū)。獲取了2012-2018共7年的評論數(shù)據(jù),這些數(shù)據(jù)主要來源于包括美團(tuán)、攜程、同程以及途牛在內(nèi)的4個(gè)旅游網(wǎng)站。原始數(shù)據(jù)形式為HTML,本文通過Java編程語言對其進(jìn)行了解析和清洗,最終形成了283 072條結(jié)構(gòu)化文本數(shù)據(jù)。其中,數(shù)據(jù)清洗操作包括全半角字符的轉(zhuǎn)化、繁簡體文字的轉(zhuǎn)化、去除同一用戶的多次評論以及文本去重等。同時(shí),為方便讀者使用,該部分?jǐn)?shù)據(jù)以sql和xlsx兩種格式存儲。如下表1-4顯示了數(shù)據(jù)的基本結(jié)構(gòu)信息,如圖2展示了旅游景區(qū)在海南島的分布情況。

        表1 海南島自然景區(qū)名稱及評論數(shù)據(jù)量

        表2 海南島歷史人文景區(qū)名稱及評論數(shù)據(jù)量

        表3 海南島民俗風(fēng)情景區(qū)名稱及評論數(shù)據(jù)量

        表4 海南島休閑度假景區(qū)名稱及評論數(shù)據(jù)量

        序號 名稱 等級 美團(tuán) 攜程 同程 途牛 地址7 清水灣旅游區(qū) 4A 0 330 0 0 陵水

        圖2 旅游景區(qū)在海南島分布情況

        1.2 數(shù)據(jù)分類

        景區(qū)社交媒體評論信息蘊(yùn)含著公眾對于景區(qū)不同方面的評價(jià),這對于發(fā)現(xiàn)和解決旅游景區(qū)存在的問題,提高游客滿意度等具有重要的參考價(jià)值。為此,本數(shù)據(jù)集從多個(gè)主題對這些評論信息進(jìn)行公眾情感分類。

        我們根據(jù)整個(gè)文本的情感傾向,將該文本分為積極情感、消極情感和中性情感3個(gè)類別[9],用以從宏觀上對該景區(qū)作出評價(jià)。從細(xì)粒度主題上分,我們則根據(jù)國家A級景區(qū)的評價(jià)指標(biāo),基于這些評價(jià)指標(biāo)對該景區(qū)作出情感分類,旨在從多個(gè)主題方面刻畫景區(qū)質(zhì)量,以提供個(gè)性化服務(wù)需求。其中細(xì)粒度的主題指標(biāo)包括景區(qū)飲食(飲食口味、飲食價(jià)格)、景區(qū)娛樂(娛樂趣味性、項(xiàng)目價(jià)格)、景區(qū)購物(物價(jià)、商業(yè)氛圍)、景區(qū)游覽(購票、景色、導(dǎo)游解說)、景區(qū)特色、景區(qū)衛(wèi)生、景區(qū)交通、景區(qū)住宿、景區(qū)服務(wù)質(zhì)量、景區(qū)安全10個(gè)方面。圖3為根據(jù)國家A級景區(qū)評價(jià)指標(biāo)的細(xì)粒度分類標(biāo)準(zhǔn)。

        圖3 細(xì)粒度分類標(biāo)準(zhǔn)

        2 數(shù)據(jù)樣本描述

        2.1 數(shù)據(jù)集信息

        本數(shù)據(jù)集從美團(tuán)、攜程、同程和途牛4個(gè)旅游網(wǎng)站上收集并處理了海南島所有4A和5A級景區(qū)的評論數(shù)據(jù),數(shù)據(jù)的時(shí)間跨度為7年(2012-2018年)。

        整個(gè)數(shù)據(jù)集由1個(gè)壓縮文件包組成,壓縮文件包由5個(gè)文件夾組成。其中4個(gè)文件夾分別以上述4個(gè)旅游網(wǎng)站命名,每個(gè)文件夾下分別為24個(gè)景區(qū)在該旅游網(wǎng)站中的所有評論數(shù)據(jù),數(shù)據(jù)儲存格式包括sql和xlsx,命名規(guī)則為“旅游網(wǎng)站+景區(qū)名稱”;第5個(gè)文件夾以樣例數(shù)據(jù)命名,該文件夾下為經(jīng)過分類處理的數(shù)據(jù),命名規(guī)則為“旅游網(wǎng)站+景區(qū)名稱+積極/消極/中性+分類細(xì)則序號〔1 景區(qū)飲食(11飲食口味,12飲食價(jià)格),2 景區(qū)交通,3 景區(qū)特色,4 景區(qū)游覽(41購票,42 景色,43 導(dǎo)游解說),5 景區(qū)住宿,6 景區(qū)衛(wèi)生,7 景區(qū)娛樂(71娛樂趣味性,72 項(xiàng)目價(jià)格),8 景區(qū)服務(wù)質(zhì)量,9 景區(qū)購物(91 物價(jià),92商業(yè)氛圍),10 景區(qū)安全〕”。數(shù)據(jù)集詳細(xì)信息如表5。

        表5 海南島旅游數(shù)據(jù)集信息

        2.2 分類樣本描述

        樣本集以途牛網(wǎng)上分界洲島旅游區(qū)的評論數(shù)據(jù)為基礎(chǔ),將這些原始數(shù)據(jù)進(jìn)行多個(gè)主題的情感分類,從而得到表6所示的結(jié)果。

        表6 示例樣本情況

        3 數(shù)據(jù)質(zhì)量控制和評估

        評論海南景區(qū)旅游質(zhì)量的社交媒體平臺有很多。為保障數(shù)據(jù)的豐富性,我們通過比較選出了具有代表性的4個(gè)旅游網(wǎng)站,以確保最大程度地獲取相關(guān)信息。數(shù)據(jù)收集完成后,我們?nèi)斯z查了數(shù)據(jù)的有效性并刪除了不完整的及與海南旅游景區(qū)無關(guān)的評論數(shù)據(jù)。在分類樣例中,本文所用的細(xì)粒度主題則是根據(jù)國家A級景區(qū)的評價(jià)指標(biāo)來擬定。對于分類樣例中的文本情感類別標(biāo)簽,我們安排了2個(gè)同事進(jìn)行人工判讀,并對結(jié)果進(jìn)行復(fù)議和討論,以確保最終分類的正確性。

        4 數(shù)據(jù)使用方法和建議

        本數(shù)據(jù)集包含海南島4A級以上所有景區(qū)2012-2018年以來283 072條社交媒體評論數(shù)據(jù)。研究人員可通過互聯(lián)網(wǎng)文本情感分析算法抽取公眾對景區(qū)不同主題特征的態(tài)度信息,同時(shí)結(jié)合時(shí)間維度從公眾觀測的角度探究景區(qū)質(zhì)量的變化特征,為景區(qū)網(wǎng)絡(luò)口碑、形象管理等提供數(shù)據(jù)參考。通過互聯(lián)網(wǎng)主題聚類算法,如LDA(Latent Dirichlet Allocation)、K-means聚類算法、或者簡單的詞頻計(jì)算等語義挖掘算法從各景區(qū)海量評論信息中抽取公眾關(guān)注熱點(diǎn),以服務(wù)于旅游景區(qū)的個(gè)性化推薦、景區(qū)發(fā)展規(guī)劃等。官方發(fā)布的諸如旅游景區(qū)統(tǒng)計(jì)年鑒等數(shù)據(jù),可以與本數(shù)據(jù)集作為相互驗(yàn)證和補(bǔ)充的數(shù)據(jù),將會(huì)在景區(qū)容量管理、景區(qū)傳播效果評價(jià)、景區(qū)形象管理、景區(qū)熱度分析、景區(qū)質(zhì)量評價(jià)分析、景區(qū)發(fā)展趨勢等研究上發(fā)揮重要作用。

        猜你喜歡
        海南島數(shù)據(jù)量文件夾
        磁力文件夾
        基于大數(shù)據(jù)量的初至層析成像算法優(yōu)化
        計(jì)算Lyapunov指數(shù)的模糊C均值聚類小數(shù)據(jù)量法
        高刷新率不容易顯示器需求與接口標(biāo)準(zhǔn)帶寬
        寬帶信號采集與大數(shù)據(jù)量傳輸系統(tǒng)設(shè)計(jì)與研究
        電子制作(2019年13期)2020-01-14 03:15:18
        調(diào)動(dòng)右鍵 解決文件夾管理三大難題
        是海南省還是海南島?
        TC一鍵直達(dá)常用文件夾
        電腦迷(2015年1期)2015-04-29 21:24:13
        關(guān)于海南島戰(zhàn)役作戰(zhàn)方針的考察
        軍事歷史(1994年6期)1994-08-15 08:56:38
        回憶海南島渡海登陸戰(zhàn)役
        軍事歷史(1987年2期)1987-08-20 06:10:48
        一二三四区中文字幕在线| 91国在线啪精品一区| 91日本在线精品高清观看| 天堂av一区二区在线| 中文字幕一区久久精品| 国产精品久久久亚洲| 精品人妻无码一区二区三区蜜桃一| 狠狠躁夜夜躁人人爽天天| 国产在线白浆一区二区三区在线| 熟女少妇av一区二区三区| 国产欧美va欧美va香蕉在线| 少妇内射兰兰久久| 国产肉体ⅹxxx137大胆| 久久久久久AV无码成人| 中文字幕有码手机视频| 久久久久亚洲av无码a片| 国精产品推荐视频| 国产精品青草视频免费播放| 亚洲精彩视频一区二区| 国产精品视频白浆免费视频| 一本色道久久88加勒比—综合| 久久久久亚洲精品无码网址色欲| 正在播放淫亚洲| 免费人妻精品区一区二区三 | 国产两女互慰高潮视频在线观看| 亚洲人成绝费网站色www| 尤物蜜芽福利国产污在线观看 | 国产午夜视频在线观看.| 国产草草影院ccyycom| 日日摸夜夜添狠狠添欧美| 国产美女自拍国语对白| 亚州无吗一区二区三区| 超碰97人人射妻| av天堂久久天堂av色综合| 亚洲AV秘 片一区二区三区 | 亚洲婷婷五月综合狠狠爱 | 日韩av中文字幕少妇精品| 懂色av一区二区三区尤物| 亚洲国产成人无码av在线影院| 91精品全国免费观看青青| 一区二区三区观看在线视频|