亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于隨機(jī)森林的風(fēng)景體驗(yàn)影響因子判斷方法
        ——以張家界國家森林公園為例

        2022-04-27 02:30:56彭佳玉中南林業(yè)科技大學(xué)風(fēng)景園林學(xué)院碩士研究生
        建筑與文化 2022年4期
        關(guān)鍵詞:排序重要性影響

        文/彭佳玉 中南林業(yè)科技大學(xué)風(fēng)景園林學(xué)院 碩士研究生

        沈守云 中南林業(yè)科技大學(xué)風(fēng)景園林學(xué)院 教 授

        廖秋林 中南林業(yè)科技大學(xué)風(fēng)景園林學(xué)院 副教授(通訊作者)

        王薇薇 中南林業(yè)科技大學(xué)風(fēng)景園林學(xué)院 講 師

        引言

        目前的風(fēng)景體驗(yàn)研究面臨著許多挑戰(zhàn),許多學(xué)者嘗試用不同的方法解決風(fēng)景體驗(yàn)評價(jià)的問題。第一類是使用基于傳統(tǒng)的調(diào)查研究方法,如通過問卷調(diào)查法[1]、半結(jié)構(gòu)化訪談法[2]、觀察法[3]、結(jié)構(gòu)方程模型[4]等方法研究影響大眾風(fēng)景體驗(yàn)的因素。此類方法依據(jù)研究目的預(yù)先設(shè)定評價(jià)指標(biāo),通過專家打分對指標(biāo)權(quán)重賦值,構(gòu)建評價(jià)指標(biāo)體系,得出評價(jià)結(jié)果。由于評價(jià)指標(biāo)的選擇和指標(biāo)權(quán)重的賦值具有一定的主觀性,且數(shù)據(jù)采集的時(shí)間過于集中、數(shù)據(jù)樣本量少,會導(dǎo)致結(jié)果出現(xiàn)一定的偏差,構(gòu)建的評價(jià)體系不具有遷移性,使之在風(fēng)景體驗(yàn)評價(jià)的應(yīng)用中具有局限性。而隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展和移動(dòng)終端的普及,在線社交媒體迅速發(fā)展,越來越多的人通過社交媒體記錄風(fēng)景游覽過程中的風(fēng)景體驗(yàn),從而產(chǎn)生了大量風(fēng)景體驗(yàn)數(shù)據(jù),這為廣泛開展大眾的風(fēng)景體驗(yàn)評價(jià)研究帶來了機(jī)會?;诖?,很多學(xué)者開始使用基于機(jī)器學(xué)習(xí)的方法,如采用樸素貝葉斯(Naive Bayes)[5]、長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)(LSTM)[6]、ROST CM6[7]、二元語言模型(Bigram)[8]等方法,根據(jù)用戶生成內(nèi)容提取風(fēng)景體驗(yàn)影響因子,結(jié)合情感分析,獲得大眾的風(fēng)景體驗(yàn)評價(jià)。此類方法雖然較為全面地考慮了評價(jià)指標(biāo)選擇不受人為主觀的影響,解決了數(shù)據(jù)采集的時(shí)間過于集中等問題,提取出了影響風(fēng)景體驗(yàn)的相關(guān)因子,但因沒有量化計(jì)算風(fēng)景體驗(yàn)影響因子的重要值,未能解決風(fēng)景體驗(yàn)影響因子的重要性判斷問題。

        針對上述方法的局限和未能解決的問題,我們嘗試采用基于隨機(jī)森林的方法展開研究,將風(fēng)景體驗(yàn)的因子進(jìn)行提取和重要性排序,并與樸素貝葉斯進(jìn)行比較。樸素貝葉斯是經(jīng)典的分類模型,算法簡單,在數(shù)據(jù)集較大的時(shí)候也能保持一定的穩(wěn)定性。隨機(jī)森林已廣泛運(yùn)用在醫(yī)學(xué)、信息管理、生態(tài)學(xué)等領(lǐng)域,隨機(jī)森林的學(xué)習(xí)過程快,處理大量數(shù)據(jù)依舊能保持高效,相比于樸素貝葉斯基于先驗(yàn)條件輸出判斷結(jié)果,隨機(jī)森林可以在數(shù)據(jù)缺少的情況下仍維持一定的準(zhǔn)確度,給出合理的判斷。因此選用以上兩種方法作對比研究,通過對兩種方法的比較,探討隨機(jī)森林在風(fēng)景體驗(yàn)影響因子判斷研究上的可行性,為風(fēng)景體驗(yàn)影響因子的判斷方法提供一種新的方法。

        1 研究區(qū)域概況與研究方法

        1.1 研究區(qū)域概況

        張家界國家森林公園位于湖南省西北部張家界市境內(nèi),北緯29°31′,東經(jīng)110°4′,面積約130 平方公里,地處武陵山脈東段,是武陵源山脈的重要組成部分[9]。地形地貌由西北向東南傾斜,東連索溪峪,北部與天子山相鄰,有著獨(dú)特的砂巖峰林地貌;該區(qū)域氣候?qū)俦眮啛釒Ъ撅L(fēng)性濕潤氣候,動(dòng)植物資源豐富,森林覆蓋率達(dá)98%。公園內(nèi)包含金鞭溪、袁家界、黃石寨等多個(gè)知名景點(diǎn),以獨(dú)特的地形地貌、婉轉(zhuǎn)曲折的水景、云海、日出等自然奇觀,給大眾以視覺、嗅覺、聽覺等多方面、深層次的風(fēng)景體驗(yàn),是研究風(fēng)景體驗(yàn)的絕佳場地。

        1.2 數(shù)據(jù)來源

        利用Python 語言的Scrapy 框架,采集攜程和去哪兒網(wǎng)站上張家界國家森林公園2015 年3月12 日至2020 年8 月19 日的共5179 多條數(shù)據(jù),其中來自去哪兒網(wǎng)的有1453 條數(shù)據(jù),攜程網(wǎng)的評論數(shù)據(jù)為3729 條,刪除與研究無關(guān)的數(shù)據(jù),得到3924 條有效評論。對收集到的評論數(shù)據(jù)進(jìn)行預(yù)處理,利用Python 的第三方庫工具文本進(jìn)行分詞、詞性標(biāo)注及詞頻統(tǒng)計(jì),得到研究對象的高頻詞排序,根據(jù)高頻詞內(nèi)容提取風(fēng)景體驗(yàn)影響因子,選取影響因子后進(jìn)行人工特征標(biāo)注。

        1.3 風(fēng)景體驗(yàn)影響因子的判斷方法

        1.3.1 基于隨機(jī)森林的判斷方法

        隨機(jī)森林是由多個(gè)決策樹分類器組成的分類器集合,是一種重要的基于套袋(Bagging)的集成學(xué)習(xí)方法。隨機(jī)森林用于分類問題時(shí),選取多個(gè)決策數(shù)模型組合成集成分類器,模型之間不存在依賴關(guān)系,彼此獨(dú)立并利用相同的數(shù)據(jù)搭建多個(gè)獨(dú)立的決策樹分類模型,通過少數(shù)服從多數(shù)的投票方法決定分類結(jié)果[10],在對數(shù)據(jù)進(jìn)行分類的同時(shí),還可以給出每個(gè)變量的重要性評分,評估每個(gè)變量對分類的貢獻(xiàn)。隨機(jī)森林的算法步驟如下:

        (1)影響因子的分類方法。利用Bootstrap對原始訓(xùn)練集中有放回的重復(fù)隨機(jī)抽取k 個(gè)樣本,經(jīng)過k 輪訓(xùn)練,得到k 個(gè)決策樹模型,將生成的多棵決策樹模型組成分類器集合{h1(x)、h2(x),..,hk(x)},對影響因子進(jìn)行積極、消極和中性的分類,最終的分類結(jié)果采用多數(shù)投票數(shù)法。最終的決策結(jié)果計(jì)算方式如下:

        其中,H(x)表示組合的分類模型,X 為選取的影響因子,hi 是單個(gè)的決策樹模型,i 表示分類器的序號,Y 是影響因子的判斷結(jié)果(積極、消極、中性),I(·)為示性函數(shù),avmax 表示結(jié)果的平均值。

        (2)影響因子的重要值計(jì)算方法。隨機(jī)森林模型中,選用基尼不純度平均減小值(Mean Decrease Gini)作為衡量特征重要性的指標(biāo)?;岵患兌扔?jì)算每個(gè)變量對分類樹每個(gè)節(jié)點(diǎn)上觀測值的異質(zhì)性的影響,從而比較變量的重要性。計(jì)算方式如下:

        其中,D 為評論數(shù)據(jù)的樣本集合,pk是樣本集合D 中第k 類樣本所占的比例(k=1,2,...,|Y|)。在本文k 的取值為k=(積極、中性、消極),Gini_index(D,a)是影響因子a 的重要值,值越大說明影響因子Dv 越重要,是數(shù)據(jù)集D 被a 劃分為V 個(gè)分支節(jié)點(diǎn),第v 個(gè)分支節(jié)點(diǎn)包含了D 所有在屬性a 上取值為av 的樣本。

        1.3.2 基于樸素貝葉斯的判斷方法

        樸素貝葉斯是基于貝葉斯定理和特征條件獨(dú)立假設(shè)的分類方法。具體來說,對于給定的訓(xùn)練數(shù)據(jù),首先基于特征條件獨(dú)立假設(shè)學(xué)習(xí)輸入以及輸出的聯(lián)合概率分布;然后基于此模型,對給定的輸入特征,利用貝葉斯定理求出后驗(yàn)概率最大的輸出類別[11]。

        (1)影響因子的分類方法。由于樸素貝葉斯是基于屬性條件獨(dú)立性假設(shè),則:

        其中,d 為屬性的數(shù)目,即選取的影響因子的數(shù)量。xi 為X 在第i 個(gè)屬性上的取值。P(x)表示事件x 發(fā)生的概率,由于分母對于所有類別為常數(shù),則只需將P(x|yi)最大化即可。

        (2)影響因子的重要值計(jì)算方法。樸素貝葉斯模型中,選用條件熵作為衡量特征重要性的指標(biāo)。計(jì)算公式如下:

        以上式子中,H(X)表示某一影響因子的熵,Y 的取值為積極、中性、消極,H(Y|X)表示在某一影響因子X 出現(xiàn)時(shí),Y 的取值期望值,H(Y|X)越大,說明該影響因子的重要性越大。

        1.4 風(fēng)景體驗(yàn)影響因子判斷的模型構(gòu)建

        本實(shí)驗(yàn)通過R 語言實(shí)現(xiàn)模型構(gòu)建。運(yùn)用上文所提及的影響因子的提取方法,提取了15個(gè)風(fēng)景體驗(yàn)影響因子,如表1 所示。風(fēng)景本體體驗(yàn)影響因子包括:植物、空氣、地形地貌、天氣、水體、動(dòng)物、民俗文化共計(jì)7 個(gè)因子;風(fēng)景環(huán)境體驗(yàn)影響因子包括:人流量、服務(wù)態(tài)度、標(biāo)識服務(wù)、價(jià)格、衛(wèi)生、內(nèi)部交通、游覽設(shè)施、管理,共計(jì)8 個(gè)因子。對選取的影響因子,進(jìn)行人工標(biāo)注,評論中出現(xiàn)標(biāo)注為1,未出現(xiàn)標(biāo)注為0,再通過人工對評論集進(jìn)行風(fēng)景體驗(yàn)的類別判斷,即上文所提及的類別Y,消極、中性、積極分別標(biāo)注為0、1、2。隨機(jī)將原始數(shù)據(jù)集的一半劃分為訓(xùn)練數(shù)據(jù),得到1956 條訓(xùn)練數(shù)據(jù),剩下的為測試集數(shù)據(jù)。將標(biāo)注好的訓(xùn)練數(shù)據(jù)輸入模型,反復(fù)運(yùn)行直到達(dá)到一個(gè)穩(wěn)定值。

        表1 風(fēng)景體驗(yàn)影響因子屬性表(表格來源:作者自繪)

        2 結(jié)果與分析

        2.1 風(fēng)景體驗(yàn)總體評價(jià)結(jié)果

        本研究對象采集的有效評論數(shù)據(jù)為3924條,經(jīng)人工標(biāo)注,得到風(fēng)景體驗(yàn)是積極評價(jià)的評論數(shù)量為2961 條,占總評論數(shù)的75.5%,消極評價(jià)的評論數(shù)量為725 條,所占比例為18.5%,中性評價(jià)的評論數(shù)為238 條,所占比例為6%。隨機(jī)森林的AUC 值為0.80,樸素貝葉斯模型的AUC 值為0.79,準(zhǔn)確度分別為80%和79%。由積極風(fēng)景體驗(yàn)的評論數(shù)占比可知游客對公園的風(fēng)景體驗(yàn)為積極體驗(yàn),但消極體驗(yàn)的評價(jià)比例也比較重。

        2.2 風(fēng)景本體體驗(yàn)影響因子排序結(jié)果

        風(fēng)景本體體驗(yàn)影響因子的重要性排序如表2 所示。兩種方法對風(fēng)景本體影響因子的判斷結(jié)果基本一致。在隨機(jī)森林的方法中,通過基尼指數(shù)(Gini Index)對影響因子進(jìn)行重要性排序,地形地貌的重要值最高13.15,其次為天氣13.14,空氣重要值為10.02,高于動(dòng)物的重要值4.28,地形地貌讓大眾的印象最深刻,說明公園的奇特地貌得到了廣泛的認(rèn)可。天氣對大眾的風(fēng)景體驗(yàn)影響也很重要,由于大眾對天氣的評價(jià)差異性較大,如有些游客喜歡霧天,但一部分游客認(rèn)為霧天影響觀景,因此并不能確定天氣對風(fēng)景體驗(yàn)的效果是積極影響還是消極影響。民俗文化的重要值0.50,重要性最低,說明在風(fēng)景本體體驗(yàn)中,大眾對風(fēng)景的人文體驗(yàn)感不高,對自然風(fēng)景的體驗(yàn)感更高,景區(qū)今后要加強(qiáng)人文景觀的建設(shè)。

        表2 風(fēng)景本體體驗(yàn)影響因子排序?qū)Ρ龋ū砀駚碓矗鹤髡咦岳L)

        2.3 風(fēng)景環(huán)境影響因子排序結(jié)果

        如表3 所示,兩種方法對價(jià)格、人流量、衛(wèi)生的重要性排序一致,其他影響因子的重要性排序結(jié)果略有差異。管理在隨機(jī)森林方法的重要性排序?yàn)榈谌?,樸素貝葉斯方法則將管理排在第四位。服務(wù)態(tài)度在隨機(jī)森林方法的排序結(jié)果中為第四位,而在樸素貝葉斯方法的重要性排序中為第六位。游覽設(shè)施在隨機(jī)森林方法和樸素貝葉斯方法的重要性排序分別為第五和第三,標(biāo)識服務(wù)的排序分別為第六和第七。這種差異有可能是兩種算法基于不同的特征重要性計(jì)算方法導(dǎo)致的,且大部分游客對風(fēng)景環(huán)境體驗(yàn)是消極評價(jià),會造成評價(jià)結(jié)果的誤差。

        表3 風(fēng)景環(huán)境體驗(yàn)影響因子排序?qū)Ρ龋ū砀駚碓矗鹤髡咦岳L)

        結(jié)合評論文本“態(tài)度差”“標(biāo)識不清晰”“排隊(duì)”以及“貴”“服務(wù)”等高頻詞分析,大眾對價(jià)格、人流量、管理、服務(wù)態(tài)度、標(biāo)識服務(wù)、內(nèi)部交通為消極評價(jià)。大眾對游覽設(shè)施的評價(jià)沒有明顯偏向積極或者消極。在隨機(jī)森林的方法中,價(jià)格在整體的風(fēng)景體驗(yàn)影響因子重要性排序中占首位,重要值為48.78,人流量和管理的重要值為31.20和23.23,這三項(xiàng)風(fēng)景環(huán)境影響因子的重要值高于風(fēng)景本體影響因子的重要值,說明風(fēng)景環(huán)境的體驗(yàn)感和公園的管理服務(wù)會極大地影響大眾對風(fēng)景體驗(yàn)的評價(jià)。

        3 討論與結(jié)論

        3.1 采用隨機(jī)森林的方法可以實(shí)現(xiàn)對風(fēng)景體驗(yàn)的評價(jià)和影響因子的排序

        本文基于隨機(jī)森林算法提出風(fēng)景體驗(yàn)影響因子的判斷方法,并以張家界國家森林公園為例進(jìn)行了驗(yàn)證,分析結(jié)果與已有研究的結(jié)果基本一致[12,13],說明本方法判斷結(jié)果基本正確。相比較于Kun Kim 等[14]運(yùn)用文本挖掘和共現(xiàn)分析,只能給出定性的判斷,不能定量計(jì)算影響因子的重要值;Lars Brabyn等[15]運(yùn)用GIS 對指定空間范圍內(nèi)的風(fēng)景體驗(yàn)進(jìn)行研究,使用范圍局限大。隨機(jī)森林的判斷方法可以減少個(gè)人在研究中的主觀干擾,通過網(wǎng)絡(luò)用戶生成內(nèi)容和詞頻分析提取影響因子,從大眾的角度對風(fēng)景體驗(yàn)進(jìn)行較為客觀的記錄,靈活性更強(qiáng),隨機(jī)森林算法根據(jù)風(fēng)景體驗(yàn)影響因子的重要性排序,可以滿足更多情況下的研究需求,景區(qū)可以優(yōu)先解決對大眾風(fēng)景體驗(yàn)影響更大的因素,使工作更有針對性,建設(shè)成效更符合大眾的需求。

        3.2 以管理和服務(wù)為導(dǎo)向的風(fēng)景規(guī)劃設(shè)計(jì)啟示

        風(fēng)景體驗(yàn)影響因子判斷結(jié)果表明,大部分大眾對公園的整體風(fēng)景體驗(yàn)是積極的,但消極的評價(jià)所占比例仍接近兩成。風(fēng)景本體體驗(yàn)影響因子中的空氣、植物、水體等與大眾的風(fēng)景體驗(yàn)呈正相關(guān),對大眾的風(fēng)景體驗(yàn)產(chǎn)生積極影響;風(fēng)景環(huán)境體驗(yàn)影響因子中的價(jià)格、管理、人流量、服務(wù)態(tài)度等與風(fēng)景體驗(yàn)呈負(fù)相關(guān),對大眾的風(fēng)景體驗(yàn)產(chǎn)生消極影響,且在整體的影響因子中排序靠前(價(jià)格、管理、人流量都處于整體的前三),產(chǎn)生的消極影響較大,這一結(jié)果表明公園的管理、服務(wù)、基礎(chǔ)設(shè)施阻礙公眾開展體驗(yàn)風(fēng)景活動(dòng),給公園造成了負(fù)面影響,降低了公眾的風(fēng)景體驗(yàn)度。公園應(yīng)當(dāng)努力提升管理和服務(wù)水平,使得公眾可以不被風(fēng)景外部環(huán)境干擾,獲得完整的風(fēng)景體驗(yàn),增強(qiáng)公眾的體驗(yàn)感。

        猜你喜歡
        排序重要性影響
        是什么影響了滑動(dòng)摩擦力的大小
        排序不等式
        “0”的重要性
        哪些顧慮影響擔(dān)當(dāng)?
        論七分飽之重要性
        恐怖排序
        幼兒教育中閱讀的重要性
        甘肅教育(2020年21期)2020-04-13 08:09:24
        節(jié)日排序
        刻舟求劍
        兒童繪本(2018年5期)2018-04-12 16:45:32
        擴(kuò)鏈劑聯(lián)用對PETG擴(kuò)鏈反應(yīng)與流變性能的影響
        中國塑料(2016年3期)2016-06-15 20:30:00
        61精品人妻一区二区三区蜜桃| 国产午夜精品理论片| 久久久免费精品re6| 日产无人区一线二线三线乱码蘑菇| 久久久精品免费观看国产| 杨幂Av一区二区三区| 亚洲天堂av在线免费观看| 久久久国产精品123| 69一区二三区好的精华| 毛片在线播放a| 亚洲成a人网站在线看| 一本色道88久久加勒比精品| 欧美噜噜久久久xxx| 老熟妇仑乱视频一区二区 | 中文字幕欧美一区| 99久久国产一区二区三区| 青青操视频手机在线免费观看| 天天做天天爱夜夜爽女人爽| 欧美孕妇xxxx做受欧美88| 久久99精品波多结衣一区| 中文字幕综合一区二区| 日本护士xxxxhd少妇| 曰本无码人妻丰满熟妇啪啪| 亚洲精品自产拍在线观看| 国产精品一区二区午夜久久| 美女被强吻并脱下胸罩内裤视频| 国产av熟女一区二区三区 | 国产欧美日韩视频一区二区三区| 午夜视频免费观看一区二区| 综合成人亚洲网友偷自拍| 高h喷水荡肉爽文np肉色学校| 成人无码区免费a片www| 9久9久女女热精品视频免费观看 | 亚洲综合久久精品少妇av | 人与禽交av在线播放| 国产福利酱国产一区二区| 日本变态网址中国字幕| 亚洲成人av在线第一页| 免费看黑人男阳茎进女阳道视频 | 免费无码又爽又刺激高潮的视频网站| 麻豆成年人视频在线观看|