谷甜甜,李德智,楊 茜,蔣 英
(1.中國礦業(yè)大學(xué) 力學(xué)與土木工程學(xué)院,江蘇 徐州 221116,E-mail:gusweet@126.com;2. 東南大學(xué) 土木工程學(xué)院,江蘇 南京 211189;3.江蘇城鄉(xiāng)建設(shè)職業(yè)學(xué)院 管理工程學(xué)院,江蘇 常州 213147)
當(dāng)前我國城鎮(zhèn)化進行的加速使得商品住宅需求旺盛,總體住房短缺問題仍存在[1,2]。因此識別住房需求的關(guān)鍵影響因素,構(gòu)建合理的預(yù)測模型分析住宅需求未來走勢,對于促進住房供給科學(xué)決策、住房建設(shè)合理投資、乃至形成平穩(wěn)健康發(fā)展的房地產(chǎn)市場具有十分重要的意義。
在商品住宅需求及其預(yù)測的研究上,國內(nèi)外許多學(xué)者進行了深入且積極的探索,發(fā)現(xiàn)國家、消費者、供給方等多方面因素對城鎮(zhèn)商品住宅需求量產(chǎn)生綜合影響,其預(yù)測方法也多種多樣。其中,國家層面的影響因素主要包括GDP、國內(nèi)生產(chǎn)總值增長率、城鎮(zhèn)化率、房地產(chǎn)開發(fā)投資完成額[2~4];消費者方面影響因素主要包括人均居民可支配收入、家庭規(guī)模、人均居住面積、居民消費價格指數(shù)等[5,6];住宅市場的供給方主要是指房地產(chǎn)開發(fā)商,對于住宅需求的影響因素包括住宅平均價格、住宅竣工面積、新開工面積等[7,8]。考慮到影響商品住宅需求的因素較多且通常呈現(xiàn)非線性關(guān)系,傳統(tǒng)的線性回歸、主成分分析法(PCA)、德爾菲和層次分析法等無法從本質(zhì)上反映真實問題。近年來部分學(xué)者在進行商品住房需求影響因素分析及未來趨勢預(yù)測上,采用人工神經(jīng)網(wǎng)絡(luò)方法并取得了一定效果,例如葛懷志等[2]應(yīng)用基于PCA-BP模型分析了湖北省城鎮(zhèn)居民住房需求的9個影響因素,為住房需求的預(yù)測提供了一定的參考。
然而,國內(nèi)外在住宅需求影響因素指標(biāo)選取上往往缺乏科學(xué)根據(jù),僅僅考慮少數(shù)幾個和需求相關(guān)因素的面板數(shù)據(jù)。因此,本文從簡單且切實可行角度出發(fā),提出基于鄰域粗糙集(Neighborhood Rough Set,NRS)和“誤差反向傳播”(Back Propagation,BP)神經(jīng)網(wǎng)絡(luò)的住宅需求預(yù)測模型,從住宅需求的眾多影響因素中篩選出主要影響因素,利用BP神經(jīng)網(wǎng)絡(luò)方法,預(yù)測城鎮(zhèn)居民住宅需求的未來走勢,并選取某市A區(qū)作為算例分析。
在粗糙集理論基礎(chǔ)上,鄰域粗糙集(NRS)作為約簡方法被提出用于處理混合型屬性值[9],其廣泛地應(yīng)用在決策模型構(gòu)建、評價指標(biāo)體系構(gòu)建、影響因素提取等方面[10],然而 NRS無法對屬性數(shù)據(jù)進行預(yù)測。BP神經(jīng)網(wǎng)絡(luò)作為人工智能的一種方法,用于對數(shù)據(jù)進行運算和規(guī)律識別,在人力資源需求、能源需求、建設(shè)用地需求等方面具有較好的預(yù)測能力[11,12]。本文基于NRS-BP構(gòu)建商品住宅需求預(yù)測模型如圖1所示。
圖1 基于NRS-BP的商品住宅需求預(yù)測流程
考慮到我國住宅需求中微觀層面數(shù)據(jù)難以獲取和政策層面因素難以度量兩方面情況,從商品住宅需求數(shù)據(jù)的有效性及可得性出發(fā),采用宏觀經(jīng)濟時間序列數(shù)據(jù)來構(gòu)建預(yù)測模型,選取城鎮(zhèn)常住人口(a1)、住宅竣工面積(a2)、GDP(a3)、城鎮(zhèn)化率(a4)、住宅投資額(a5)、家庭規(guī)模(a6)、主要年份城鎮(zhèn)非私營單位職工年平均工資(a7)、人均居民可支配收入(a8)、人均居住面積(a9)、國內(nèi)生產(chǎn)總值增長率(a10)、城鎮(zhèn)居民恩格爾系數(shù)(a11)、商品住房均價(a12)、居民消費價格指數(shù)(a13)、住宅施工面積(a14)、住宅新開工面積(a15)等作為商品住宅需求的影響因素。商品住宅需求指的是某一時期消費者能夠并有意愿購買的商品住宅產(chǎn)品,通常表征指標(biāo)為商品住宅銷售面積[13],因此本文將商品住宅銷售面積作為決策變量(D),并以時間為單位對某地區(qū)商品住宅需求量進行預(yù)測。
利用需求數(shù)據(jù)集構(gòu)建決策信息表,明確商品住宅需求決策系統(tǒng)。針對表述的需求影響因素約簡問題,將其轉(zhuǎn)化成一個決策系統(tǒng)。論域U={x1,x2,…,xn}是全部樣本構(gòu)成的集合,其中xi=(i=1,2,…,n)代表某地區(qū) n年的樣本數(shù)據(jù);A={a1,a2,…,am}代表樣本所有因素的集合,其中 ai(i=1,2,…,15)代表 15個商品住宅需求影響因素;D代表商品住宅需求(分類決策屬性)。任意給定N維歐式空間中兩點,記作xi和xj,其距離為:
其中,f(x,a)為對象x在屬性a上的取值。對于U上任意樣本xi,其δ鄰域為δ={x|x∈U,Δ(x,xi)≤δ},其中 δ≥0。N被定義為 A的鄰域關(guān)系,則NDT=(U,N,D)是商品住房需求影響因素鄰域決策系統(tǒng),N個等價類(因素集)則根據(jù)D對U劃分而來:{x1,x2,…,xN},B?A,鄰域關(guān)系NB由B得到,那么在決策D中,B的NB下(NBD)、上近似邊界及決策邊界BN(D)分別為:
式中,
對于條件屬性B,商品住宅需求D的依賴度為:
對于商品住宅需求D,條件屬性a的重要性為:
依據(jù)商品住宅需求D計算的各屬性重要性,由大到小進行排列,在約簡集合中加入選擇重要度大的屬性值,直到屬性重要性Sig(a,B,D)小于重要度下限(通常由?表示,取0.05或者0.01),則剩余屬性不加入約簡集合,由此得到某一鄰域半徑下的屬性約簡結(jié)果。之后,按照一定的步長調(diào)整條件屬性的鄰域半徑δ,計算δ不同情況下單個屬性重要度,得到相應(yīng)的屬性約簡集合。而后,對每個約簡集合構(gòu)建相應(yīng)的訓(xùn)練集和測試集,并將約簡集合中的屬性值作為輸入指標(biāo),商品住宅需求(決策屬性)作為輸出指標(biāo),利用weka軟件中的分類功能,采用決策樹(C4.5)算法、支持向量機(Support Vector Machine,SVM)和樸素貝葉斯(Naive Bayes,NB)分別對訓(xùn)練集進行處理,再利用測試集計算在三類算法下的分類精度。最后根據(jù)約簡后的分類精度及屬性個數(shù),選取合適的鄰域半徑值,記錄對應(yīng)的屬性約簡結(jié)果,完成模型的評估,輸出最佳約簡結(jié)果,提取影響商品住宅需求的主要因素。
將約簡后的商品住宅需求主要影響因素(輸入端)及商品住宅銷售量歷年數(shù)據(jù)(輸出端)放入BP神經(jīng)網(wǎng)絡(luò)中訓(xùn)練,直到擬合優(yōu)度值接近 1,保存訓(xùn)練好的商品住宅需求預(yù)測訓(xùn)練模型。再基于灰色預(yù)測模型GM(1,1)預(yù)測商品住宅需求主要影響因素時序數(shù)據(jù),并通過計算后驗差比C(C≤0.65)和小誤差概率p(0.70<p)來評定主要影響因素預(yù)測的精確度,訓(xùn)練好的BP神經(jīng)網(wǎng)絡(luò)輸入端數(shù)據(jù)則為通過檢驗的主要影響因素時序數(shù)據(jù),以此來預(yù)測未來年份商品住宅的需求量。
在此基礎(chǔ)上,對比普通BP預(yù)測模型(將全部影響因素作為BP神經(jīng)網(wǎng)絡(luò)輸入指標(biāo)預(yù)測商品住宅需求的模型)和NRS-BP預(yù)測模型(將約簡后的關(guān)鍵商品住宅需求影響因素作為BP神經(jīng)網(wǎng)絡(luò)輸入指標(biāo)進行商品住宅需求預(yù)測的模型)的預(yù)測平均相對誤差,從可靠性角度分析NRS-BP商品住房需求預(yù)測模型。
本文將江蘇省某市統(tǒng)計局有關(guān)商品住宅需求的數(shù)據(jù)作為選用對象,包括2005~2017年該市A區(qū)商品住宅需求影響因素a1~a15的數(shù)據(jù)和商品住宅銷售面積D等相關(guān)數(shù)據(jù),分析這16項數(shù)據(jù)得到圖2和圖3。
圖2 2005~2017年某市A區(qū)商品住宅需求全部影響因素統(tǒng)計圖
圖3 2005~2017年某市A區(qū)商品住宅銷售面積統(tǒng)計圖
由圖 2 可知,a1、a3、a4、a7、a8、a9、a12近年來持續(xù)增長,a10、a11、a14近年來逐漸下降,而a2、a5、a6、a13和a15變化不明顯。由圖3可知,某市A區(qū)商品住宅銷售面積在 2009年高達 490797m2,2009年之后持續(xù)下降,2014年達到近 5年最低(183817 m2),在此之后略有回升。
由分析模型第二步可知,鄰域δ大小會影響屬性約簡的樣本數(shù)量,若δ過小,劃分到同一鄰域的樣本數(shù)量較少,商品住宅需求過多依靠該類條件屬性,影響因素約簡分類的精度會變低,無法實現(xiàn)約簡目標(biāo),因此選取適宜的δ有利于需求影響因素的約簡。李靜等[14]在鄰域半徑的計算上考慮數(shù)據(jù)標(biāo)準(zhǔn)差,其計算公式為:
式中,Stdai指的是ai的標(biāo)差;λ為鄰域半徑δ計算參數(shù)。當(dāng)樣本量較小時,λ取值盡可能在0.5~1.5之間,當(dāng)樣本量較大時,λ取值可調(diào)大為2~4。
考慮到本文僅有 12年的樣本數(shù)據(jù),在實驗的基礎(chǔ)上確定λ取值區(qū)間為0.5~1.15,同時確定重要度下限?閾值為0.01。在Matlab中運算得到商品住宅需求影響因素約簡結(jié)果(見表1),任意一個特征集合均可以作為商品住宅需求影響因素集。由表 1可知,當(dāng)λ取值為0.65時,約簡后的指標(biāo)個數(shù)最多,為9個影響因素。當(dāng)λ取值為1.15時,約簡后指標(biāo)個數(shù)僅為2個,即認(rèn)為a4城鎮(zhèn)化率和a6家庭規(guī)模主要對商品住宅需求產(chǎn)生影響。
表1 影響商品住宅需求因素約簡表
根據(jù)約簡結(jié)果構(gòu)建14個決策系統(tǒng){s1,s2,…,s14},Si={Ri,D}(其中i=1,2,…,14),針對各決策系統(tǒng)Si,劃分訓(xùn)練集(用于建模)和測試集(用于評估),輸入指標(biāo)確定為Ri,商品住宅需求D作為輸出指標(biāo)分別輸入到 weka軟件中,選擇分類精度和穩(wěn)定性都較好的C4.5、SVM和NB算法進行十折交叉檢驗,分別計算三類算法下的分類精度值,各λ值參數(shù)下約簡前后三類算法的正確分類比率和屬性約簡個數(shù)結(jié)果如圖4和圖5所示。
圖4 ?=0.01下的分類精度比較
圖5 ?=0.01下約簡前后的屬性個數(shù)
由兩張圖可知,當(dāng)λ值為0.70,0.85和1.05時,基于 C4.5算法分類器計算得到的正確分類比率為極值處,均大于64.39%(因素約簡前平均正確分類比率),選中的屬性個數(shù)分別為8、5和4,尤其當(dāng)λ值為0.70時,正確分類率達到最大為81.79%;當(dāng)λ值為0.70,0.80,0.95和1.10時,基于NB分類器的分類準(zhǔn)確率均大于70%,選中的屬性個數(shù)分別為8、6、3和3,其中當(dāng)λ值為0.70時,正確分類率達到最大為76.53%;然而,在各λ取值下,基于SVM分類器的正確分類比率均小于64.39%(約簡前平均正確分類比率)。通過對比圖4和圖5可知,屬性集中的屬性數(shù)量增加并不會導(dǎo)致分類準(zhǔn)確率的提升,例如約簡后屬性個數(shù)最多時(λ值為0.65時),對應(yīng)的分類準(zhǔn)確率小于基于 C4.5分類器的最大正確分類率。當(dāng)λ值較小時,屬性值的增加提升了正確分類比率,然而隨著屬性個數(shù)的增加,正確分類比率不增反降。綜合考慮正確分類比率和條件屬性個數(shù),決策系統(tǒng)S5在NB分類器下的結(jié)果最好,分類準(zhǔn)確率最高(81.79%),因素個數(shù)在約簡后較少,因此S5為最佳約簡情況,即商品住宅需求預(yù)測的關(guān)鍵影響因素為a1、a3、a4、a6、a8、a9、a11、a12。
在確定影響商品住宅需求的關(guān)鍵因素后,將2005~2017年某市A區(qū)8個關(guān)鍵影響因素數(shù)據(jù)a1、a3、a4、a6、a8、a9、a11、a12作為 BP 神經(jīng)網(wǎng)絡(luò)的輸入節(jié)點,將商品住宅需求作為輸出節(jié)點,設(shè)置隱藏層為 3,利用歷年樣本數(shù)據(jù)訓(xùn)練 BP模型。訓(xùn)練結(jié)果顯示,停止時訓(xùn)練達到140次,訓(xùn)練過程中擬合優(yōu)度為0.93698,輸出值與目標(biāo)值相近,BP模型的訓(xùn)練效果良好,將模型進行保存。
本文基于灰色預(yù)測 GM(1,1)模型,利用Matlab軟件預(yù)測了2018~2022年某市A區(qū)商品住宅需求主要影響因素數(shù)據(jù)(見表2)。而后,計算各影響因素預(yù)測后驗差比C及小誤差概率p,均達到預(yù)測要求,各影響因素預(yù)測結(jié)果較為可靠。
表2 2018~2022年某市A區(qū)住宅需求的影響因素預(yù)測數(shù)據(jù)
將表2的數(shù)據(jù)作為輸入指標(biāo),輸入訓(xùn)練好的BP模型中,預(yù)測得到2018~2022年商品住宅銷售面積數(shù),分別為 266382 m2、266939 m2、269470 m2、274208 m2和 281659 m2。
通過比較普通BP預(yù)測模型及NRS-BP預(yù)測模型計算出的預(yù)測值與歷史值,二者平均相對誤差可以直觀顯示預(yù)測效果的差異(見表3)。由表可知,普通BP預(yù)測模型的平均相對誤差為27.70%,遠(yuǎn)大于NRS-BP預(yù)測模型的平均相對誤差7.85%,NRS-BP預(yù)測模型更接近真實值。
表3 普通BP預(yù)測值與NRS-BP預(yù)測值的結(jié)果匯總表
從模型構(gòu)建上來看,利用NRS-BP對因素約簡可以有效去除原有影響因素之間的信息重疊,最大限度保留BP神經(jīng)網(wǎng)絡(luò)輸入端信息,從而提高預(yù)測模型的訓(xùn)練速度,進一步說明本文選取的 NRS-BP商品住宅需求預(yù)測模型相較于普通BP神經(jīng)網(wǎng)絡(luò)預(yù)測模型具有更高的精度和效率。
本文基于NRS和BP神經(jīng)網(wǎng)絡(luò)提出一種預(yù)測商品住宅需求的方法,通過對某市A區(qū)算例分析,驗證了本文提出的商品住宅需求預(yù)測模型精度較高且可行性較好。但由于國家宏觀調(diào)控政策及住宅需求中微觀層面因素對房地產(chǎn)市場的作用,部分年份的預(yù)測值可能會出現(xiàn)一定程度的波動,在今后的住房需求預(yù)測中,需要進一步加強對政策影響的量化,同時不斷改進微觀層面數(shù)據(jù)獲取的手段,將對住宅需求產(chǎn)生影響的各類因素充分考慮在內(nèi)。