亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        地理視角下深圳市房價及其影響因素研究
        ——基于隨機(jī)森林模型

        2022-05-09 02:08:22鐘艾妮答星喻靜敏
        城市勘測 2022年2期
        關(guān)鍵詞:住宅小區(qū)決策樹深圳市

        鐘艾妮,答星,喻靜敏

        (武漢市測繪研究院,湖北 武漢 430022)

        1 引 言

        隨著我國經(jīng)濟(jì)發(fā)展和人民生活質(zhì)量的穩(wěn)步提升,城市房價成為社會關(guān)切的重要問題。房價是多因素作用下的高度復(fù)雜問題,其變化規(guī)律具有非線性、動態(tài)性和偶然性[1]。關(guān)于住房的調(diào)查研究顯示,房價不僅受經(jīng)濟(jì)、政策的影響,還和房屋地理區(qū)位、房屋配套設(shè)施、人的行為、城市規(guī)劃等諸多因素有關(guān)。從空間視角探索城市房價特征和影響因素,是地理空間分析的重要研究范疇。

        傳統(tǒng)的房價研究著重于分析房屋銷售價格的特征和趨勢,相關(guān)方法主要來源于經(jīng)濟(jì)學(xué)與統(tǒng)計學(xué),包括灰色理論[2]、傳統(tǒng)的時間序列法[3]等。以往的文獻(xiàn)研究是研究區(qū)域的經(jīng)濟(jì)發(fā)展指標(biāo)和住宅本身的建筑屬性等進(jìn)行房價預(yù)測和影響因素分析,大多是基于前期累積的房價統(tǒng)計結(jié)果進(jìn)行推演[4~7]。而我國區(qū)域房價格通常呈現(xiàn)出空間分異特征,城市內(nèi)部房屋銷售價格也頻繁出現(xiàn)起伏,傳統(tǒng)的研究方法在小尺度的房價分析上不具有適用性。

        從當(dāng)前的房屋市場交易情況來看,城鎮(zhèn)居民在選擇住房時,已經(jīng)不單單是考慮房屋自身的內(nèi)部結(jié)構(gòu)等建筑屬性,更多的關(guān)注與房屋地理空間位置相關(guān)的交通、公共服務(wù)、未來規(guī)劃等配置屬性。這些空間配置屬性對居民生活品質(zhì)的提升有極大影響,與房價存在關(guān)聯(lián)關(guān)系[8,9],近年來學(xué)者們開始關(guān)注住宅的空間屬性,探究房價的地理影響因素。方曉萍等人根據(jù)全國35個大中城市房價波動發(fā)現(xiàn)其具有地理擴(kuò)散特征[10];顧衡宇等人基于改進(jìn)的空間句法研究路網(wǎng)形態(tài)對房價的影響[11];楊兵分析了大連市二手房價格的空間相關(guān)性及聚集特征[12]。GIS領(lǐng)域研究者大多利用多元線性回歸、地理加權(quán)回歸等模型探索地理環(huán)境對房價影響的空間差異并實現(xiàn)房價預(yù)測[13~15],但這類方法進(jìn)行回歸分析會存在多重共線性,不能較好分析預(yù)測房價。與全局線性和多項式回歸模型相比,隨機(jī)森林模型是多個決策樹的集成,借助決策樹算法,可以將輸入空間分割為更小的區(qū)域,使結(jié)果可管可控,更適用于動態(tài)非線性特征的房價預(yù)測和分析。

        借助隨機(jī)森林模型,本文以深圳市二手房房價為研究對象,充分考慮房屋住宅的地理空間屬性,參考已有研究[16,17],選取教育資源、醫(yī)療設(shè)施、交通便捷度、環(huán)境因素、規(guī)劃因素方面的7個指標(biāo)作為房價影響因子。通過研究深圳市房價的空間分布特征及規(guī)律,分析小尺度上居民對房屋不同地理環(huán)境因素的關(guān)注度差異,從地理視角下推測房價,以期輔助城市住宅規(guī)劃建設(shè),為相關(guān)部門提供參考以便科學(xué)制定相應(yīng)方針政策。

        2 基于隨機(jī)森林模型的房價研究

        作為新興起的、高度靈活的一種機(jī)器學(xué)習(xí)算法,隨機(jī)森林(Random Forest)是由Leo Breiman提出的一種機(jī)器學(xué)習(xí)算法[18],其本質(zhì)屬于集成學(xué)習(xí),具有學(xué)習(xí)速度快、分類準(zhǔn)確度高、泛化誤差小、參數(shù)敏感度低、計算開銷少等特點。隨機(jī)森林模型主要用于回歸和分類,在估計推斷映射方面有準(zhǔn)確率優(yōu)勢,目前已被廣泛應(yīng)用到眾多領(lǐng)域,如生物信息、金融經(jīng)濟(jì)、新能源、化工產(chǎn)業(yè)等,都取得了非常好的效果[19]。

        2.1 隨機(jī)森林相關(guān)知識

        隨機(jī)森林模型的基本單元是決策樹。決策樹是通過構(gòu)造一種樹形結(jié)構(gòu)來進(jìn)行問題決策,是直觀運用概率分析的一種圖解法,每個內(nèi)部節(jié)點表示某種特征的測試,每個分支代表一個測試輸出,每個葉節(jié)點是輸出結(jié)果。

        決策樹中進(jìn)行特征選取的依據(jù)和條件是熵值下降最快,提高數(shù)據(jù)集的純度。CART樹通過基尼(Gini)指數(shù)計算每個變量對決策樹每個節(jié)點上觀測值的異質(zhì)性的影響,該指數(shù)值越小純度越高。若選取的屬性為A,那么分裂后的數(shù)據(jù)集D的基尼指數(shù)的計算公式為:

        (1)

        2.2 房價研究的隨機(jī)森林模型原理

        由于單決策樹分類或回歸結(jié)果可能不穩(wěn)定,隨機(jī)森林的基本思想則是將許多決策樹集成為一個強(qiáng)組合。通過多個相互獨立的決策樹之間的互補(bǔ)作用,隨機(jī)性選擇訓(xùn)練集并隨機(jī)選取特征,以隨機(jī)森林模型進(jìn)行房價分析預(yù)測,避免了過擬合問題且能一定程度上糾正局部過擬合,相較以往研究使用的方法,具有很好的泛化性能、魯棒性和模型穩(wěn)定性[20]。

        本文采用的隨機(jī)森林模型是由分類回歸樹(classification and regression trees,CART)(基決策樹)集合{h(X,βk),k=1,2,…,i}組成的集成器。以Gini指數(shù)作為指標(biāo)來分裂屬性,h(X,βk)表示第k棵基決策樹,βk表示第k棵基決策樹的隨機(jī)向量,X是獨立分布的隨機(jī)向量,i表示隨機(jī)森林中基決策樹的個數(shù)。對于輸入向量X的分類結(jié)果,隨機(jī)森林模型基于每棵基決策樹的判斷投票結(jié)果做出最終輸出決策。

        圖1 隨機(jī)森林模型原理

        算法流程如下:

        (1)以樣本房價作為訓(xùn)練集,隨機(jī)分成k個訓(xùn)練樣本分別訓(xùn)練房價決策樹,選取的房價地理環(huán)境影響因素作為特征,輸入特征構(gòu)成的多維向量;

        (2)在每棵決策樹的節(jié)點隨機(jī)選取特征進(jìn)行Gini指標(biāo)計算,不斷劃分,得到最終的所有決策樹;

        (3)本文使用隨機(jī)森林模型進(jìn)行回歸分析,預(yù)測值取所有樹預(yù)測值的平均。

        3 研究區(qū)域與數(shù)據(jù)源

        本文選取的研究區(qū)域為深圳市,深圳市作為一線城市,社會經(jīng)濟(jì)發(fā)展迅速,建設(shè)用地資源緊缺,房價存在明顯空間差異。

        研究的數(shù)據(jù)源包括深圳市房價數(shù)據(jù)和電子地圖數(shù)據(jù)。①房價數(shù)據(jù)。深圳市二手房住宅交易活躍,是市場交易的主流,因此本文以住宅小區(qū)二手房交易價格為研究對象,通過爬蟲技術(shù)從深圳市二手房交易網(wǎng)站獲取住宅小區(qū)地址坐標(biāo)并計算2019年各小區(qū)單價平均值,共 1 225條記錄。②深圳市電子地圖數(shù)據(jù)。深圳市基礎(chǔ)設(shè)施及相關(guān)空間數(shù)據(jù),包括深圳市小學(xué)、中學(xué)、醫(yī)院、軌道站點的POI數(shù)據(jù),路網(wǎng)數(shù)據(jù),及公園綠地、重點規(guī)劃區(qū)面狀數(shù)據(jù)。

        本文以居民享受的生活服務(wù)及基礎(chǔ)設(shè)施為切入點,考慮環(huán)境和規(guī)劃因素,選取深圳市各小區(qū)的7個地理空間因子作為影響房價的指標(biāo),以住宅小區(qū)一公里范圍緩沖區(qū)為基礎(chǔ)研究單元,具體信息如表1所示。

        影響房價的地理空間因素及指標(biāo) 表1

        4 實驗設(shè)計與結(jié)果分析

        4.1 深圳市房價空間分異特征

        根據(jù)安居客網(wǎng)站公開的深圳市房價數(shù)據(jù)可知,各區(qū)縣存在顯著差異,南山區(qū)均價最高,坪山區(qū)最低。通過對爬取的 1 225條房價實驗數(shù)據(jù)及公開的均價統(tǒng)計數(shù)據(jù)進(jìn)行可視化(如圖2所示),結(jié)果顯示二手房均價較高的住宅小區(qū)集中在南山區(qū)和福田區(qū),且交易量也較多。深圳市房價在整體上呈現(xiàn)出南高北低、西高東低的特征,以南山區(qū)和福田區(qū)為中心向外逐漸減低。從空間視角看,這與深圳市公共服務(wù)設(shè)施的分布特征呈現(xiàn)出相似性。

        圖2 深圳市房價空間分異特征

        4.2 房價研究隨機(jī)森林模型建立

        通過整理所有1 225條房價及其影響因素數(shù)據(jù),隨機(jī)選取共925條數(shù)據(jù)作為隨機(jī)森林模型的訓(xùn)練樣本,以7個影響因素指標(biāo)作為自變量,住宅小區(qū)均價作為因變量,利用OpenCV2的隨機(jī)森林模型工具進(jìn)行回歸分析。用剩余的300條數(shù)據(jù)作為測試數(shù)據(jù)進(jìn)行后續(xù)預(yù)測分析。深圳市房價隨機(jī)森林模型的訓(xùn)練參數(shù)如表2所示。

        隨機(jī)森林模型訓(xùn)練參數(shù) 表2

        根據(jù)本文選取的房價影響指標(biāo),預(yù)選的特征變量個數(shù)為7,設(shè)置最大分類數(shù)為10,由于特征數(shù)量相對較少,決策樹的最大分類深度設(shè)為5,節(jié)點最小樣本數(shù)為10,其余均選擇默認(rèn)值,訓(xùn)練完成后隨機(jī)森林中生成了50顆決策樹。對所有的輸入特征變量進(jìn)行分析,計算決策樹中每個節(jié)點處的Gini指數(shù)反映不純度轉(zhuǎn)化值,取均值即獲取每一個自變量對因變量的解釋程度,用來評價各特征變量的相對重要性。

        4.3 影響因素重要性分析

        根據(jù)建立的房價研究隨機(jī)森林模型的輸出數(shù)據(jù)進(jìn)行計算,結(jié)果如表3所示,Gini指數(shù)的取值越小,代表自變量對因變量的影響越大。

        對各特征變量Gini指數(shù)進(jìn)行標(biāo)準(zhǔn)化處理,通過直方圖反映相對重要性,如圖3所示,7個指標(biāo)因子在房價模型中的重要性排序如下:X3>X2>X7>X6>X1>X5>X4。該結(jié)果反映出深圳市的二手住宅小區(qū)單價在選取的以上7個指標(biāo)因子中,受到醫(yī)療設(shè)施因素的影響最甚,小區(qū)附近的醫(yī)療資源越充分,房價越高,這和深圳市醫(yī)療資源分布的不均衡有很大關(guān)系。其次小區(qū)附近的中學(xué)分布數(shù)量也是影響房價的一個重要因素,僅次于醫(yī)院,教育資源配置對房價有提升作用。重點規(guī)劃區(qū)因素是重要性排在第三位的因素,反映深圳市的房價越昂貴的小區(qū),往往是位于深圳市重點規(guī)劃區(qū)的附近,政府的規(guī)劃決策等對城市的房價有著重要的影響。公園綠地的分布面積影響次之,然后是小學(xué)的分布數(shù)量,交通便捷方面的影響因素對小區(qū)單價的影響最低。

        各個特征變量在模型中的Gini指數(shù) 表3

        圖3 變量相對重要性

        4.4 預(yù)測分析

        利用生成的深圳房價隨機(jī)森林預(yù)測模型對300條測試數(shù)據(jù)進(jìn)行運算,根據(jù)各影響因子的指標(biāo)值得出了預(yù)測房價。通過對預(yù)測結(jié)果和實際房價數(shù)據(jù)建立折線圖進(jìn)行可視化表達(dá),結(jié)果如圖4所示。在整體上預(yù)測結(jié)果能夠大致吻合測試數(shù)據(jù)中的實際房價,但隨機(jī)森林生成的預(yù)測結(jié)果在各個極大值處均小于實際房價值,各個極小值處均高于實際房價,即預(yù)測結(jié)果偏向于均值上下浮動,不如實際房價值的差異那么顯著。針對價格相對穩(wěn)定在深圳市房價均值上下的住宅小區(qū),本文使用的模型能夠較好地實現(xiàn)價格預(yù)測;對于較高的住宅小區(qū)單價,隨機(jī)森林模型的預(yù)測結(jié)果會存在較大偏差,僅利用地理視角的因素不能較好推測該類房價,存在其他主要影響因素。

        圖4 預(yù)測結(jié)果與實際價格對比折線圖

        預(yù)測房價和實際房價的統(tǒng)計特征計算結(jié)果如表4所示,預(yù)測房價的均值與實際房價的均值大致相同;然而實際房價的標(biāo)準(zhǔn)差遠(yuǎn)大于預(yù)測房價,標(biāo)準(zhǔn)差是用來衡量一組數(shù)自身的離散程度的指標(biāo),因此說明實際房價數(shù)據(jù)較為離散,數(shù)據(jù)間偏差大于預(yù)測房價,預(yù)測房價值相對趨于均值;預(yù)測房價的最大值低于實際房價最高值約2萬元,而對于最小值的情況,預(yù)測房價的最小值要高于實際房價。結(jié)合圖4和表4中結(jié)果,顯示出模型對于處于高值和低值的房價難以進(jìn)行很好的模擬,但對于位于均值附近的房價能夠?qū)崿F(xiàn)較好的預(yù)測,相對誤差較小。

        預(yù)測房價和實際房價的統(tǒng)計特征 表4

        (2)

        圖5 實際價格與預(yù)測誤差散點圖

        5 結(jié) 論

        本文通過網(wǎng)絡(luò)爬取深圳市二手房住宅小區(qū)均價 1 225條,以小區(qū)一公里范圍內(nèi)的醫(yī)療設(shè)施、教育資源、交通便捷度、環(huán)境、規(guī)劃的享有程度,從地理視角下選取小學(xué)、中學(xué)共7個指標(biāo),通過機(jī)器學(xué)習(xí)中的隨機(jī)森林建立研究模型,分析深圳市房價的地理空間影響因素。

        根據(jù)本文建立的深圳市房價研究隨機(jī)森林模型,對所選7個地理空間變量的回歸分析,通過輸出的變量重要性評價指標(biāo)反映各個特征變量對深圳市二手房住宅小區(qū)均價的影響程度,結(jié)果顯示醫(yī)院分布特征是對房價影響最大的因子,反映出深圳市醫(yī)療設(shè)施的不充分和不均衡,在今后的城市規(guī)劃中需重點考慮布局;其次是中學(xué)的分布,教育資源配置是居民選購房屋時會著重考慮的因素,對住宅小區(qū)的價格有重要影響;重點規(guī)劃區(qū)因素是重要性排在第三位的因素,政府的規(guī)劃決策等對城市的房價有著重要的影響,周邊區(qū)域的發(fā)展?fàn)顩r影響居住區(qū)銷售價格;公園綠地面積排在第四位,居民享有的公共綠色開敞空間也對房價有一定影響;再次是小學(xué)分布數(shù)量特征,反映交通便捷度的路網(wǎng)、軌道站點在房價影響上相對重要性最低。通過對測試數(shù)據(jù)進(jìn)行房價預(yù)測,本文提出的方法在住宅小區(qū)單價處于均值附近的情況下,能夠較好吻合實際房價統(tǒng)計數(shù)據(jù),地理環(huán)境影響因子對該類房價具有較好的解釋和預(yù)測效果。

        猜你喜歡
        住宅小區(qū)決策樹深圳市
        住宅小區(qū)的建筑電氣設(shè)計探析
        深圳市鑫鉆農(nóng)牧科技有限公司
        住宅小區(qū)巖土勘察分析與評價
        住宅小區(qū)弱電智能化工程建設(shè)實現(xiàn)
        某住宅小區(qū)地下車庫結(jié)構(gòu)設(shè)計
        深圳市朗仁科技有限公司
        深圳市元征科技股份有限公司
        深圳市元征科技股份有限公司
        一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
        決策樹和隨機(jī)森林方法在管理決策中的應(yīng)用
        電子制作(2018年16期)2018-09-26 03:27:06
        99精品热这里只有精品| 日韩av一区二区观看| 97久久国产亚洲精品超碰热| 污污内射在线观看一区二区少妇| 日韩AVAV天堂AV在线| 免费人人av看| 久久精品国产69国产精品亚洲| 中国午夜伦理片| 国产成人综合久久精品免费| 国产人成无码视频在线1000| 国产夫妻自偷自拍第一页| 久久精品国产亚洲av麻豆色欲| 18禁无遮挡无码网站免费| 国产成人亚洲合集青青草原精品 | 狠狠色综合网站久久久久久久| 婷婷综合缴情亚洲狠狠| 美女性色av一区二区三区| 国产麻豆精品久久一二三| 中文字幕亚洲在线第一页| 比较有韵味的熟妇无码| 69精品丰满人妻无码视频a片| 完整在线视频免费黄片| 偷拍韩国美女洗澡一区二区三区 | 波多野结衣久久精品99e| 欧美综合自拍亚洲综合图片区 | 日本高清视频在线观看一区二区 | 日韩一二三四区免费观看| 国产一区二区视频在线免费观看| 99国产精品人妻噜啊噜| 久久精品无码一区二区三区不 | 国产精品国产三级国产专区不| 老师露出两个奶球让我吃奶头 | 手机在线免费观看的av| 久久婷婷五月综合97色一本一本| 国产精品一区二区久久精品| 日韩少妇人妻一区二区| 日本一区二区三区视频国产| 中文字幕在线播放| 丰满少妇又紧又爽视频| 小池里奈第一部av在线观看| 99国产精品久久久蜜芽|