亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于機器學(xué)習(xí)的房產(chǎn)估價模型研究

        2024-10-10 00:00:00柳越劉從軍
        軟件工程 2024年10期
        關(guān)鍵詞:存量房

        關(guān)鍵詞:房產(chǎn)估價;XGBoost;估價模型;存量房

        中圖分類號:TP391 文獻標(biāo)志碼:A

        0 引言(Introduction)

        在商品房交易市場中,商品房的價格相對固定,其房產(chǎn)稅則依據(jù)國家規(guī)定的固定比例進行征收。相比之下,存量房的價格具有波動性[1],其交易過程需先對房屋的價值進行評估,再根據(jù)規(guī)定的稅收政策交稅[2]。ANDERSON等[3]的研究認為房產(chǎn)稅最早起源于中世紀(jì)的歐美發(fā)達國家。在我國存量房交易中,有一個存量房交易稅收的“取大優(yōu)先”規(guī)則:如果交易金額小于房產(chǎn)評估值,仍將基于評估值收稅;反之,則依據(jù)交易金額收稅。在此規(guī)則下,房產(chǎn)估價顯得尤為重要,它不僅有助于防止稅收流失,還對中國經(jīng)濟實現(xiàn)高質(zhì)量發(fā)展具有積極的意義[4],這也是本課題的核心研究意義所在。

        房產(chǎn)價格是在眾多特征因素綜合影響下的量化結(jié)果[5]。當(dāng)前,主流的房產(chǎn)價格研究大多聚焦于房屋的影響因素,并基于特征價格理論、區(qū)位理論、地租理論等知識體系構(gòu)建估價模型[6]。本文使用XGBoost模型研究并建立存量房的估價模型,并改進了XGBoost模型的參數(shù)組合,使用真實樣本數(shù)據(jù)對模型進行訓(xùn)練和測試。結(jié)果顯示,改進后的模型性能得到了顯著的提高。

        1 相關(guān)理論(Related theory

        其中:L(θ)為訓(xùn)練損失函數(shù),是衡量模型對訓(xùn)練數(shù)據(jù)擬合性能的關(guān)鍵指標(biāo);Ω(θ)為正則化懲罰項,旨在控制模型的復(fù)雜性,防止過擬合。通過優(yōu)化訓(xùn)練損失函數(shù)和正則化懲罰項得到XGBoost模型的目標(biāo)函數(shù)。

        1.2 貝葉斯優(yōu)化理論

        超參數(shù)調(diào)整是機器學(xué)習(xí)中的一個重要概念[9]。XGBoost模型包含眾多超參數(shù),通過調(diào)整參數(shù),找到合適的參數(shù)組合,可以顯著提升模型性能。在機器學(xué)習(xí)模型中,常用的超參數(shù)優(yōu)化方法有網(wǎng)格搜索(Grid Search,GS)、隨機搜索(Random Search,RS)和貝葉斯優(yōu)化,但GS和RS并不適合超參數(shù)較多的XGBoost模型。相比之下,貝葉斯優(yōu)化更適用于參數(shù)空間連續(xù)、復(fù)雜或大型的場景;它通過建模和利用參數(shù)之間的關(guān)系,智能化地選擇下一個參數(shù)組合,從而在相對較少的迭代次數(shù)內(nèi)找到更好的結(jié)果。貝葉斯優(yōu)化提供的是一種更優(yōu)雅和高效的調(diào)參方法,因此本研究中,采用貝葉斯優(yōu)化調(diào)整XGBoost模型的參數(shù)。此外,設(shè)置動態(tài)學(xué)習(xí)率和隨機種子提高模型的性能和可復(fù)現(xiàn)性。

        貝葉斯優(yōu)化是一種用于超參數(shù)調(diào)整的強大技術(shù),它通過對模型性能進行反復(fù)評估,動態(tài)地搜索超參數(shù)空間,以找到最優(yōu)的超參數(shù)組合。本文使用貝葉斯優(yōu)化工具Bayesian Optimization庫,可以在給定的超參數(shù)范圍內(nèi)尋找最佳組合,從而提升模型的性能。貝葉斯參數(shù)優(yōu)化流程如圖1所示。

        2 房產(chǎn)估價模型構(gòu)建(Construction of propertyvaluation model)

        2.1 選取特征變量

        國外學(xué)者較早地開展了住宅價格影響因素的研究,很多學(xué)者借鑒了國外學(xué)者的評估理論并結(jié)合我國的實際情況,客觀地分析影響我國房地產(chǎn)市場價格的主要特征因素,并總結(jié)了合適的特征變量[10]。在國內(nèi),很多學(xué)者依據(jù)理論從建筑、鄰里、區(qū)位3個方面選擇特征價格變量[11],但各地政府會根據(jù)每個城市的特性,因地制宜地制定一些房地產(chǎn)政策,這會涉及一些二手住宅的交易稅率、補貼政策等方面。本文參考了國內(nèi)學(xué)者的研究成果,并調(diào)研某市房地產(chǎn)市場的特點,對變量的選擇進行了總結(jié),一共有12個特征變量(表1)。

        2.2 特征工程

        本文實驗中使用的房屋信息數(shù)據(jù)通過Python爬取某房產(chǎn)網(wǎng)的數(shù)據(jù)獲得,因此數(shù)據(jù)集存在數(shù)據(jù)項缺失或者異常情況。這些數(shù)據(jù)對后期的建模過程有一定的影響,進而造成模型效果不理想。為了解決這一問題,需要先對數(shù)據(jù)進行預(yù)處理,處理缺失值,進行離散化和歸一化。為了使數(shù)據(jù)格式統(tǒng)一,利用特征工程將數(shù)據(jù)處理為易于訓(xùn)練的數(shù)據(jù),針對各項特征變量采用了不同的方式進行量化。特征變量包含建筑面積、房間數(shù)、所在樓層、房齡、朝向、裝修、電梯、價格、公交線路條數(shù)、附近公園、附近學(xué)校、附近醫(yī)院共計12個指標(biāo),各項指標(biāo)的具體量化方式如表2所示。例如,中間樓層因兼顧采光及樓梯層高而被視為最優(yōu)樓層;低樓層因樓層較低而被視為較差樓層;高樓層雖然采光好,但是因樓層高而被視為一般樓層[12]。價格采用的是某房產(chǎn)網(wǎng)的掛牌房價,雖然并不是真正的交易價格,但是由于掛牌價和交易價格是線性相關(guān)的,所以不會影響評估模型的效果[13]。

        2.3 貝葉斯優(yōu)化調(diào)參

        在模型訓(xùn)練之前,設(shè)置超參數(shù)至關(guān)重要。為了提升XGBoost模型的性能,本文根據(jù)貝葉斯優(yōu)化思想和流程對其參數(shù)進行調(diào)整。此外,引入動態(tài)學(xué)習(xí)率可在訓(xùn)練過程中根據(jù)模型的性能自適應(yīng)地調(diào)整學(xué)習(xí)率,這有助于模型加速收斂并提高魯棒性。本文使用XGBoost的內(nèi)置參數(shù)learning_rates 實現(xiàn)動態(tài)學(xué)習(xí)率的設(shè)置。設(shè)置隨機種子實現(xiàn)對模型的復(fù)現(xiàn),確保每次的訓(xùn)練結(jié)果可預(yù)測,這有助于在不同運行中獲得相似結(jié)果,具體通過XGBoost中的seed 參數(shù)實現(xiàn)。經(jīng)過這組操作,可得到一組優(yōu)化后的參數(shù),XGBoost的超參數(shù)優(yōu)化搜索空間如表3所示。

        2.4 構(gòu)建模型

        在本研究中,對XGBoost回歸模型的優(yōu)化是在已有研究的基礎(chǔ)上開展的。首先篩選出對XGBoost模型準(zhǔn)確率和性能影響顯著的關(guān)鍵參數(shù)。這一過程旨在從眾多參數(shù)中識別出對模型性能影響最為關(guān)鍵的參數(shù),為后續(xù)優(yōu)化提供方向。其次利用貝葉斯優(yōu)化算法找到最優(yōu)的超參數(shù)組合,以提升模型性能。最后構(gòu)建XGBoost房產(chǎn)估價模型,其流程如圖2所示,其具體步驟如下。

        (1)收集研究相關(guān)數(shù)據(jù),了解數(shù)據(jù)特征和結(jié)構(gòu)。

        (2)清理數(shù)據(jù),處理缺失值、異常值,進行數(shù)據(jù)標(biāo)準(zhǔn)化或歸一化處理,確保數(shù)據(jù)質(zhì)量。

        (3)選擇研究相關(guān)特征,進行特征工程,提取新的特征以提升模型的性能。

        (4)劃分訓(xùn)練集和測試集,其中80%作為訓(xùn)練集,20%作為測試集,確保模型在未見過的數(shù)據(jù)上進行驗證。

        (5)構(gòu)建XGBoost模型,用訓(xùn)練集訓(xùn)練XGBoost模型。

        (6)使用測試集評估模型性能,設(shè)置評價指標(biāo),與其他模型進行對比。

        3 實驗設(shè)計及結(jié)果分析(Experimental designand result analysis)

        3.1 實驗環(huán)境與數(shù)據(jù)

        本研究數(shù)據(jù)來源于某房產(chǎn)網(wǎng)的某市存量房部分歷史成交數(shù)據(jù),交易時間跨度為2023年5月1日至2023年12月5日。

        本實驗在一臺“聯(lián)想”筆記本電腦展開,系統(tǒng)為64位Windows 10操作系統(tǒng)。采用Python3編程語言,Python版本為3.7.6,軟件平臺為Pycharm。在機器學(xué)習(xí)模型方面使用XGBoost庫、LightGBM庫、sklearn.ensemble庫的函數(shù)分別構(gòu)建不同的機器學(xué)習(xí)評估模型。

        3.3 實驗結(jié)果

        本研究中采用XGBoost庫中的XGBRegressor函數(shù)、LightGBM庫中的LGBMRegressor函數(shù),以及sklearn.ensemble庫的RandomForestRegressor函數(shù),分別構(gòu)建了XGBoost、LightGBM和隨機森林回歸模型。以影響房屋價格波動的多個特征變量為自變量,房屋價格為因變量,建立3種房產(chǎn)估價模型。完成模型構(gòu)建后,使用模型對測試集的房屋樣本進行價格評估預(yù)測,并輸出模型評價指標(biāo)數(shù)值。評估效果如表4和圖3所示。從這些評估結(jié)果中可以看出,XGBoost模型在三者中的表現(xiàn)較為出色。因此,經(jīng)過優(yōu)化后的XGBoost模型性能得到了顯著提升。

        4 結(jié)論(Conclusion)

        對于存量房房產(chǎn)估價問題,本文基于房屋的建筑、區(qū)位、鄰里等因素,并采用XGBoost、LightGBM 和隨機森林回歸等模型展開研究。本研究旨在探討機器學(xué)習(xí)算法在房地產(chǎn)批量評估中的應(yīng)用潛力,以期實現(xiàn)估價準(zhǔn)確性和效率的提升。這些算法在處理復(fù)雜數(shù)據(jù)集和非線性關(guān)系方面展現(xiàn)出顯著優(yōu)勢。為了進一步提高房產(chǎn)估價的效果,本研究引入了貝葉斯優(yōu)化方法,通過調(diào)整XGBoost模型的超參數(shù),提升了模型性能。此外,采用動態(tài)學(xué)習(xí)率策略,以適應(yīng)不同情境下的數(shù)據(jù)特征,提高了模型的泛化能力和魯棒性。通過對XGBoost模型的優(yōu)化,使模型的估價效果得到顯著提升,其中MAE 指數(shù)提高了0.4百分點,MAPE指數(shù)提高了1百分點,RMSE指數(shù)提高了0.6百分點,有效地提高了房產(chǎn)估價的準(zhǔn)確率,為存量房估價問題提供了更為精準(zhǔn)和高效的解決方案。

        作者簡介:

        柳越(1999-),女,碩士生。研究領(lǐng)域:智能信息處理。

        劉從軍(1974-),男,碩士,高級實驗師。研究領(lǐng)域:智能信息處理。

        猜你喜歡
        存量房
        自動核驗交易主體之路徑與問題思考
        淺談存量房交易監(jiān)管資金財務(wù)管理
        上海存量住房市場發(fā)展的相關(guān)分析與思考
        上海房地(2019年9期)2019-10-22 02:48:22
        加強存量房交易稅收征管的對策
        關(guān)于存量房網(wǎng)上備案系統(tǒng)建設(shè)的建議
        存量房轉(zhuǎn)租賃房的方式與激勵措施研究
        存量房網(wǎng)上合同備案系統(tǒng)的研究
        論存量房買賣網(wǎng)上備案制度
        “存量房”時代來臨,房產(chǎn)中介將取代開發(fā)商成為市場主角霸主鏈家
        存量房資金監(jiān)管系統(tǒng)的分析與設(shè)計
        国内精品视频一区二区三区八戒| 久久精品午夜免费看| 久久精品国产亚洲av热九九热| 国产三级韩三级日产三级| 中文字幕一区二区人妻秘书 | 亚洲中文字幕在线一区| 高清精品一区二区三区| 国内揄拍国内精品人妻浪潮av| 日韩精品欧美激情亚洲综合| 久久久国产视频久久久| 中文字幕一区二区综合| 欧美激情综合色综合啪啪五月| 少妇人妻偷人精品免费视频| 91最新免费观看在线| 免费看男女啪啪的视频网站| 青青草高中生在线视频| 亚洲精品www久久久久久| 精品久久亚洲中文无码| 3亚洲日韩在线精品区| 亚洲性感毛片在线视频| 日本边添边摸边做边爱| 亚洲人午夜射精精品日韩| 精品无码久久久久久久久粉色| 风韵丰满妇啪啪区老老熟女杏吧| 久久精品国产亚洲av影院毛片| 少妇做爰免费视频了| 国语少妇高潮对白在线| 成人aaa片一区国产精品| 亚洲av无码一区二区三区在线| 亚洲美女国产精品久久久久久久久| 蜜桃网站入口可看18禁| 国产高清在线精品一区app| 日本爽快片18禁免费看| 欧美日韩国产另类在线观看 | 美女被插到高潮嗷嗷叫| 刚出嫁新婚少妇很紧很爽| 国产xxx69麻豆国语对白| 毛片免费全部无码播放| 亚洲精品二区三区在线观看| 亚洲视频在线免费不卡| 亚洲人成色7777在线观看不卡|