亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于領(lǐng)域詞典的留園構(gòu)成要素情感分析

        2021-04-22 03:32:06劉文龍
        科學(xué)技術(shù)與工程 2021年8期
        關(guān)鍵詞:情感評(píng)價(jià)分析

        劉文龍, 黃 維

        (清華大學(xué)深圳國(guó)際研究生院,深圳 518000)

        近年來,中外在風(fēng)景園林這一傳統(tǒng)學(xué)科的研究中逐步引入信息技術(shù)的量化思維、技術(shù)處理方法[1]。有部分研究運(yùn)用大數(shù)據(jù)挖掘與自然語(yǔ)言處理技術(shù)對(duì)風(fēng)景園林進(jìn)行多景點(diǎn)系統(tǒng)分析,研究中較多基于地理分布的多景點(diǎn)橫向評(píng)價(jià)對(duì)比為用戶選擇景點(diǎn)服務(wù),如王少兵等[2]基于評(píng)論的景點(diǎn)推薦研究、楊鑫等[3]對(duì)民宿評(píng)論情感分析方法的研究。目前較為缺少對(duì)單一景點(diǎn)展開多維度的深入分析,為園林管理方有針對(duì)性提升服務(wù)的研究。同時(shí),互聯(lián)網(wǎng)多平臺(tái)的景點(diǎn)評(píng)價(jià)數(shù)據(jù)量大、涵蓋面廣、時(shí)效性高,整合可深度挖掘游人對(duì)景點(diǎn)多維度的認(rèn)識(shí),對(duì)傳統(tǒng)高定性分析提供一種用戶視角的量化分析補(bǔ)充,也因此選用了較為成熟且穩(wěn)定性高的基于領(lǐng)域詞典的分析方法[4]。

        現(xiàn)對(duì)單景點(diǎn)——留園的關(guān)注度進(jìn)行分析,并對(duì)整體與基于構(gòu)成要素的進(jìn)行聚類的局部展開情感分析,重點(diǎn)是對(duì)基礎(chǔ)自然語(yǔ)言處理的技術(shù)方法在園林應(yīng)用領(lǐng)域的方法論展開實(shí)踐應(yīng)用研究。實(shí)驗(yàn)探究留園多要素間游人關(guān)注度情況,以及對(duì)各要素的情感評(píng)價(jià)傾向,并對(duì)極性為負(fù)面的展開相關(guān)聯(lián)因素分析,補(bǔ)充了傳統(tǒng)園林領(lǐng)域的分析中較少有實(shí)驗(yàn)案例運(yùn)用網(wǎng)路評(píng)價(jià)數(shù)據(jù)及計(jì)算機(jī)技術(shù)對(duì)單景點(diǎn)用戶評(píng)價(jià)進(jìn)行分析,運(yùn)用交叉學(xué)科的理論與方法為留園的游人評(píng)價(jià)調(diào)研、規(guī)劃決策提供幫助,為園林領(lǐng)域其他景點(diǎn)亟需分要素精準(zhǔn)優(yōu)化提供分析思路。

        1 分析方法

        研究方法如圖1所示。

        圖1 留園關(guān)注度與構(gòu)成要素情感分析模式圖Fig.1 The Liuyuan Garden attention model and sentiment analysis pattern diagram of component

        (1)語(yǔ)料獲取。Webscraper獲取攜程網(wǎng)與去哪兒網(wǎng)的公開數(shù)據(jù)作為分析語(yǔ)料數(shù)據(jù),共計(jì)7 057條。

        (2)對(duì)語(yǔ)料數(shù)據(jù)進(jìn)行清洗,主要為基于園林專業(yè)特點(diǎn)進(jìn)行去重、標(biāo)記、降噪、對(duì)齊等。分析粒度為語(yǔ)句級(jí),對(duì)文檔內(nèi)單獨(dú)的語(yǔ)句,標(biāo)記其情感極性,把句子區(qū)分為正面、中立和負(fù)面3類,并按分句與評(píng)論段落分別分析情感加權(quán)結(jié)果。分詞使用了多個(gè)開源模塊,結(jié)巴分詞以及中科院計(jì)算所NLPIR為主,并進(jìn)行停用詞過濾,詞性標(biāo)注用HANLP的開源版本[5-6]。

        (3)對(duì)留園整體評(píng)論展開詞頻分析(term frequency-inverse document frequency,TF-IDF),并根據(jù)詞性進(jìn)行分類篩,獲取評(píng)論數(shù)據(jù)中關(guān)注度最高的序列。而后以語(yǔ)句顆粒度展開情感分析。情感分析(sentiment analysis)基于情感詞典匹配,計(jì)算結(jié)果依賴于情感詞典和每個(gè)情感詞的權(quán)重。本文研究詞典基于開源詞典并結(jié)合園林領(lǐng)域常用專業(yè)詞匯不斷優(yōu)化調(diào)整詞條和權(quán)重整理得到[7]。

        (4)對(duì)負(fù)面情感相關(guān)聯(lián)因素進(jìn)行挖掘,將上步驟的分詞,以及詞頻篩選后的負(fù)面情感關(guān)聯(lián)的篩選詞,進(jìn)行共詞矩陣分析,形成共詞網(wǎng)絡(luò),對(duì)負(fù)面情感來源挖掘分析。

        (5)根據(jù)園林構(gòu)成要素篩選相關(guān)的標(biāo)簽詞庫(kù),構(gòu)建基于園林構(gòu)成要素(建筑、山石、植物、水體、空間組構(gòu)、人文要素)的聚類,對(duì)單聚類數(shù)據(jù)進(jìn)行情感分析并橫向?qū)Ρ龋诰蛄魣@各構(gòu)成要素的游人認(rèn)知與評(píng)價(jià)情況,為分要素精準(zhǔn)提升提供方向。

        2 數(shù)據(jù)來源

        通過web scraper對(duì)旅游平臺(tái)攜程網(wǎng)與去哪兒網(wǎng)獲取的留園評(píng)價(jià)數(shù)據(jù)進(jìn)行獲取,共收集7 057條評(píng)價(jià)數(shù)據(jù),此2處平臺(tái)為旅游信息與服務(wù)的頭部平臺(tái),評(píng)價(jià)數(shù)據(jù)全面且評(píng)價(jià)質(zhì)量較高。對(duì)數(shù)據(jù)進(jìn)行清洗,進(jìn)行去重、標(biāo)記、降噪、對(duì)齊,去除1 494項(xiàng),實(shí)際有效數(shù)據(jù)5 563條,形成留園評(píng)論分析語(yǔ)料庫(kù)(corpus)。

        3 結(jié)果分析與討論

        3.1 各要素的受關(guān)注度

        對(duì)數(shù)據(jù)進(jìn)行詞性標(biāo)注,通過詞頻分析的方法對(duì)留園評(píng)價(jià)數(shù)據(jù)中主要的要素進(jìn)行順序篩選,得到受關(guān)注度序列如圖2和表1所示。

        圖2 留園各要素的受關(guān)注度詞云圖Fig.2 The word cloud map of the attention of each element of the garden

        表1 各要素的受關(guān)注度詞頻分析表(部分)

        如表1所示,通過評(píng)價(jià)數(shù)據(jù)展開的云圖與數(shù)據(jù)分析可以直觀看到,受關(guān)注度較高的前10位為建筑、假山、盆景、山水、庭園、太湖石、亭臺(tái)樓閣、空間、花園,涵蓋了留園構(gòu)成要素的主要方面。但不可避免的同一類構(gòu)成要素會(huì)多次出現(xiàn),如假山與太湖石,后者是前者的主要構(gòu)成材料。

        為便于對(duì)同一要素評(píng)論情感進(jìn)行分析,進(jìn)行分要素劃分與聚類處理。

        3.2 留園按要素聚類

        為便于對(duì)同一要素評(píng)論情感進(jìn)行分析,進(jìn)行分要素劃分與聚類處理。對(duì)園林主要構(gòu)成要素分為建筑、山石、植物、水體、空間組構(gòu)、人文要素6大類[8-9]。并對(duì)每類基于園林專業(yè)知識(shí)進(jìn)行人工匹配分類,檢索標(biāo)簽詞如表2所示。

        表2 留園構(gòu)成要素分類標(biāo)簽詞

        根據(jù)留園構(gòu)成要素的標(biāo)簽詞分類檢索得到關(guān)于6項(xiàng)構(gòu)成要素的相關(guān)評(píng)論數(shù)據(jù)數(shù)量,作為各要素評(píng)論關(guān)注度的參照,結(jié)果如圖3所示。

        圖3 留園各構(gòu)成要素受關(guān)注度圖Fig.3 The attention degree of each component of the garden

        (1)出乎意料,評(píng)論中6項(xiàng)構(gòu)成要素中對(duì)于“山石”的關(guān)注度最高,建筑其次??臻g組構(gòu)的各構(gòu)成元素“回廊、小徑、小路、庭院”等也受到了較多的關(guān)注,結(jié)合詞頻分析可以發(fā)現(xiàn)冠云峰、太湖石、假山的出現(xiàn)次數(shù)貢獻(xiàn)了主要的關(guān)注量,考慮假山相較于其他形態(tài)的空間營(yíng)造較為獨(dú)有,且冠云峰充分體現(xiàn)了太湖石“瘦、漏、透、皺”的特點(diǎn),為江南四大奇石而著名,吸引力強(qiáng)烈[10]。

        (2)日常中,園林學(xué)者對(duì)園林中人文藝術(shù)構(gòu)成部分研究占有重要地位,如書法、典故、古韻、圖案、評(píng)彈、雕刻等,而評(píng)論關(guān)注度中對(duì)此方面關(guān)注處于6個(gè)構(gòu)成要素關(guān)注度的末位,與直觀認(rèn)知有所不同。

        3.3 整體與園林構(gòu)成要素的聚類情感分析

        3.3.1 留園整體情感分析

        對(duì)留園整體評(píng)價(jià)數(shù)據(jù)進(jìn)行分詞后對(duì)語(yǔ)句進(jìn)行了切分,并進(jìn)行情感分析,詞匯的情感值公式為

        s(w)=v(w)p(w)

        (1)

        式(1)中:s(w)表示詞匯的情感值;v(w)表示詞匯的情感強(qiáng)度;p(w)表示詞匯的情感極性。遍歷每條切分句中情感詞之間的否定詞和程度副詞,并對(duì)其相應(yīng)的權(quán)重值進(jìn)行計(jì)算。每個(gè)語(yǔ)句情感傾向的情感值計(jì)算公式為

        l(w)=n(w)a(w)s(w)m(w)

        (2)

        式(2)中:l(w)表示情感傾向的情感值,n(w) 表示否定詞的權(quán)重值;s(w) 表示情感詞匯的情感值,a(w)表示情感詞前所有程度副詞權(quán)重值的累加和;m(w) 表示情感詞前否定詞和程度副詞間的相對(duì)位置。如果程度副詞前有否定詞修飾時(shí),m(w) 賦值為 0. 5,反之m(w)賦值為 1,對(duì)切分語(yǔ)句情感極性正面記為1,按評(píng)論切分句子計(jì)算情感值,然后合并后進(jìn)行加總處理,形成評(píng)論語(yǔ)句段落的情感值,情感值分布情況如表3所示[11-12]。

        忽略段落按分句分值分布可以得到情感評(píng)價(jià)數(shù)據(jù)如表4所示。通過分析可得:

        表3 留園整體評(píng)論分句情感數(shù)據(jù)

        (1)正面評(píng)價(jià)占比69.930%,中性評(píng)價(jià)占比24.163%,負(fù)面評(píng)價(jià)僅為5.908%,游客對(duì)留園整體評(píng)價(jià)呈價(jià)是積極的。

        (2)負(fù)面評(píng)價(jià)有一定誤差,中文自然語(yǔ)言在使用中常使用多重否定與夸張,目前情感詞典對(duì)復(fù)雜語(yǔ)句判斷有一定難度,如游客評(píng)論中“嘈雜是不存在的”“好不美麗”。

        對(duì)正面評(píng)價(jià)語(yǔ)句進(jìn)行詞頻分析,得到結(jié)果如表5所示,并繪制可視化詞云圖,如圖4所示。

        游客正面評(píng)價(jià)中呈現(xiàn)了游客的意猶未盡,“再來”“流連忘返”的詞頻為前兩位,綜合評(píng)價(jià)詞匯也可以歸納出留園美學(xué)及現(xiàn)觀賞情況的一些特點(diǎn),如“精湛”“秀美”“鬧中取靜”“細(xì)細(xì)品味”“干凈”“麻雀雖小五臟俱全”“細(xì)膩”。

        負(fù)面評(píng)價(jià)的詞頻分析結(jié)果如表6所示,可視化詞云圖如圖5所示。

        表4 留園整體評(píng)論情感數(shù)據(jù)

        圖4 留園正面情感詞云圖Fig.4 The positive emotion word cloud in Liuyuan Garden

        表5 留園評(píng)論正面情感詞頻數(shù)據(jù)

        其中通過分析結(jié)果可以直觀得出負(fù)面評(píng)論核心的有擁擠、嘈雜、不好玩。

        對(duì)照詞頻文本數(shù)據(jù)可以得到:

        (1)節(jié)假日、周末留園較為擁擠,游客體驗(yàn)受到影響??赏ㄟ^節(jié)假日預(yù)約、限流等方式控制一定的游覽人數(shù),保證游客體驗(yàn)。

        (2)人流量因素造成部分游客感覺到嘈雜。

        (3)部分游客感覺不好玩,對(duì)評(píng)論段落定位挖掘其原因,一方面為留園觀賞行為占據(jù)主導(dǎo),較少有互動(dòng)式、參與式的游玩項(xiàng)目,該部分可加強(qiáng);另一方面留園營(yíng)造中講求“雖由人作宛自天開”,形態(tài)上主要以自然景觀面貌呈現(xiàn),蘊(yùn)含的文化典故、山石植物欣賞基礎(chǔ)需要一定的積累鋪墊,對(duì)此可增加對(duì)園林了解較少游客的講解,通過生動(dòng)的圖像、影像等方式讓游人了解園林之美。

        對(duì)照表6可得,負(fù)面情感標(biāo)簽詞匯中形容詞占據(jù)多數(shù),如一般、不對(duì)、不行。具體關(guān)聯(lián)的負(fù)面情感成因未能體現(xiàn)。因此對(duì)負(fù)面詞頻頻率較高的詞匯進(jìn)一步展開共詞矩陣分析,形成共詞復(fù)雜網(wǎng)絡(luò)探究負(fù)面情緒的主要原因。對(duì)幾個(gè)比較典型且共詞網(wǎng)絡(luò)頻率高的標(biāo)簽詞單獨(dú)展開,分析結(jié)果可得。

        表6 留園評(píng)論負(fù)面情感詞頻數(shù)據(jù)

        圖5 留園負(fù)面情感詞云圖Fig.5 Liuyuan Garden negative word cloud

        (1)出乎意料的,拙政園在各標(biāo)簽詞共詞網(wǎng)絡(luò)中出現(xiàn)頻繁,游人在對(duì)留園進(jìn)行評(píng)價(jià)時(shí)較多的傾向于將留園與同為四大名園的拙政園進(jìn)行比較。獅子林也較多作為一同比較的對(duì)象。

        (2)“小”“人多”“擁擠”“講解”“雨”“不行”是幾個(gè)標(biāo)簽詞出現(xiàn)較多的共性標(biāo)簽詞匯,對(duì)照可以說明用戶的“一般”“差”的評(píng)論點(diǎn)集中在上述標(biāo)簽詞的方面。

        3.3.2 園林構(gòu)成要素的聚類情感分析

        根據(jù)標(biāo)簽詞對(duì)各要素相關(guān)句子進(jìn)行檢索并單獨(dú)歸類為數(shù)據(jù)集,而后對(duì)單個(gè)構(gòu)成要素進(jìn)行情感評(píng)價(jià)分析,分句情感極性相加的值大于1為正面,小于-1為負(fù)面,0為中性。各構(gòu)成要素的游人評(píng)論情感評(píng)價(jià)結(jié)果如圖6所示。

        對(duì)留園各要素情感評(píng)價(jià)橫向?qū)Ρ确治觯绫?與圖7所示,可以得到:

        圖6 留園各要素的情感分析百分比圖Fig.6 Percentage analysis of sentiment analysis of various elements of the Liuyuan Garden

        表7 留園各要素的情感分析百分比數(shù)據(jù)

        圖7 留園各要素的情感分析橫向?qū)Ρ菷ig.7 Horizontal comparison of sentiment analysis of various elements of the Liuyuan Garden

        (1)整體上留園6項(xiàng)主要構(gòu)成要素游人評(píng)論正面情感為主,平均正面情感為78.3%,接近80%。其次各要素情感評(píng)價(jià)有明顯波動(dòng),既留園中構(gòu)成要素的評(píng)價(jià)具有不均衡性。

        (2)山石正面情感占比相對(duì)較低,為66%,中性評(píng)價(jià)占比較高為27%,但負(fù)面評(píng)價(jià)并非最高,為7%。前文關(guān)注度分析中山石排列為首位,但評(píng)價(jià)相對(duì)較弱。較多的關(guān)注度與評(píng)論體量的增大使得不同的游人情感傾向多樣性得到體現(xiàn),該結(jié)果為按要素精準(zhǔn)提升與優(yōu)化園林提供方向參照。

        (3)人文相關(guān)部分涵蓋面較廣,正面情感占比81%,同時(shí)負(fù)面在各要素中未最高,占比9%。可以看出人文部分評(píng)價(jià)的多元性,既游人情感中喜歡的非常喜歡,不喜歡的也會(huì)態(tài)度鮮明,即人文部分正負(fù)面評(píng)論具有明確的獨(dú)立性。

        4 結(jié)論

        通過橫向的留園各構(gòu)成要素的游人評(píng)論情感分析,可以清晰地查找出整體情感傾向中不足的短板部分,如山石部分正面情感占比66%相對(duì)較低,人文部分負(fù)面情感占比9%相對(duì)較高,為進(jìn)一步精準(zhǔn)優(yōu)化提升提供參照。同時(shí),結(jié)合共詞網(wǎng)絡(luò)分析,可以對(duì)比出負(fù)面情感的問題方向,有針對(duì)性地繼續(xù)展開深入分析。

        此外,基于互聯(lián)網(wǎng)與計(jì)算機(jī)技術(shù)的評(píng)論大數(shù)據(jù)挖掘與分析對(duì)園林領(lǐng)域用戶視角的優(yōu)化研究起到很好的方法論補(bǔ)充,傳統(tǒng)園林學(xué)科與信息技術(shù)的結(jié)合具有趨勢(shì)性。

        也為傳統(tǒng)風(fēng)景園林領(lǐng)域以定性為主的研究提供一種基于用戶的量化分析方法,推進(jìn)園林管理方分園林要素提升與優(yōu)化的相關(guān)研究。

        猜你喜歡
        情感評(píng)價(jià)分析
        SBR改性瀝青的穩(wěn)定性評(píng)價(jià)
        石油瀝青(2021年4期)2021-10-14 08:50:44
        隱蔽失效適航要求符合性驗(yàn)證分析
        如何在情感中自我成長(zhǎng),保持獨(dú)立
        失落的情感
        北極光(2019年12期)2020-01-18 06:22:10
        情感
        電力系統(tǒng)不平衡分析
        電子制作(2018年18期)2018-11-14 01:48:24
        如何在情感中自我成長(zhǎng),保持獨(dú)立
        電力系統(tǒng)及其自動(dòng)化發(fā)展趨勢(shì)分析
        基于Moodle的學(xué)習(xí)評(píng)價(jià)
        保加利亞轉(zhuǎn)軌20年評(píng)價(jià)
        亚洲人成网线在线播放va蜜芽| 美腿丝袜美腿国产在线| 日本精品人妻一区二区| 国产av熟女一区二区三区| 中国凸偷窥xxxx自由视频| 最新精品国偷自产在线婷婷| 亚洲av自偷自拍亚洲一区| 国产免费三级av在线| 无码人妻久久一区二区三区不卡| 中文字幕久久久久人妻无码| 手机在线观看成年人视频| www夜插内射视频网站| 少妇性l交大片| 一区二区三区婷婷在线| 亚洲中文字幕视频第一二区| 人妻少妇久久中文字幕| 亚洲欧美日韩国产综合一区二区| 国产美女被遭强高潮露开双腿| 亚州中文热码在线视频| 久久天天躁狠狠躁夜夜躁2014| 亚洲精品国产美女久久久| 99久久免费中文字幕精品| 91精品亚洲成人一区二区三区 | 黑人玩弄人妻中文在线| 爆乳日韩尤物无码一区| 国产黄色一区二区在线看| 国产va免费精品高清在线观看| 欧美日韩国产免费一区二区三区欧美日韩| 国产最新一区二区三区| 欧美牲交a欧美牲交| 亚洲国产激情一区二区三区| 亚洲综合一| 免费观看人妻av网站| 99精品国产一区二区| 久久精品国产6699国产精| 亚洲成在人线天堂网站| 欧美69久成人做爰视频| 亚洲精品456| 一区二区三区视频免费观看在线| 性做久久久久久免费观看| 国产精品麻花传媒二三区别 |