陸尚輝
摘要:本文應用RStutio軟件并基于ARIMA模型對南寧房地產銷售額進行了分析與預測。本文建立了兩個模型,然后通過模型對比得到最優(yōu)模型,且模型的MAPE值和TIC值均顯示模型的擬合精度良好。因此,模型對相關房地產的模型研究起到有一定的參考意義。
關鍵詞:ARIMA模型;房地產銷售;RStudio
中圖分類號:F299.23 文獻識別碼:A 文章編號:1001-828X(2017)007-0-03
房地產業(yè)既是我國基礎性和先導性產業(yè),也是我國經濟發(fā)展的支柱之一,對房地產產業(yè)的觀察有助于我們從側面了解一個地區(qū)的經濟發(fā)展情況。房地產產業(yè)的健康發(fā)展對區(qū)域經濟的影響有著舉足輕重的作用。一個地區(qū)的房地產的銷售反映了該地區(qū)的房地產市場的火熱程度和經濟的發(fā)展情況。南寧的房地產在進入新世紀之后,開始進入了快速發(fā)展的軌道。特別是南寧作為自治區(qū)首府且將房地產作為支柱產業(yè)進行扶持之后,南寧的房地產更是有了飛躍式的發(fā)展。近兩年,根據官方公布的數據,隨著全面二孩的開放和各項利好政策的出臺,南寧房地產的銷售實現了20%左右的增長。
而隨著自治區(qū)政府和南寧市政府決定將南寧建成面向東盟開放合作的區(qū)域性國際城市和中央提出“一帶一路”的政策之后,人們對南寧房地產的發(fā)展充滿信心。另外,從近些年房地產的銷售數據來看,也反映的人們對南寧房地產發(fā)展的信心。本文以南寧近四年的房地產銷售額數據作為研究對象,采用RStudio軟件和ARIMA模型對南寧房地產銷售額進行建模,最后對南寧房地產銷售額進行預測,最后分析了南寧房地產銷售額的增長發(fā)展特點和造成這個特點的原因。
一、模型分析
1.模型理論
本文所使用的模型為簡單季節(jié)疏系數模型,即通過趨勢差分、季節(jié)差分將序列轉化為平穩(wěn)序列后,再對序列進行建模。其模型結構如下:
式中
(1)D為季節(jié)周期,d為為對序列進行去趨勢信息而進行的差分階數
(2)為白噪聲序列,且E(
(3),為q階移動平均平均系數多項式,且至少有一個系數為0
(4)Φ(B)=1-φ1B-…φpBp為p階自回歸系數多項式,且至少有一個系數為0
2.分析思路
由ARIMA模型的理論知,ARIMA模型一般是對平穩(wěn)的序列進行建模,因此在進行ARIMA建模之前,需先對序列進行平穩(wěn)化。常用的平穩(wěn)化方法為:首先對原始序列進行d階差分去趨勢,如果d階差分后的數據具有周期性,則需再對差分后的數據進行周期差分以去季節(jié)。在ARIMA模型中,要求模型中的符合上述(2)的要求。建立ARIMA模型的關鍵點在于,需要對移動平均多項式和自回歸多項的階數q和p進行定階和參數的估計,然后對參數進行顯著性檢驗并剔除不顯著的參數。
要使模型中的符合上述(2)的要求,本文采用對殘差進行白噪聲檢驗,當p值小于0.05時認為其為白噪聲序列,即符合(2)的要求。q和p的定階按如下規(guī)則進行。
由于真實的數據的自相關系數和樣本偏自相關系數幾乎不會呈現出理論上的完美截尾性,因此一般以它們落入二倍標準差范圍內作為判斷是否截尾的依據。一般情況下,它們在最初的d階明顯大于2倍標準差范圍,d階之后幾乎有95%的樣本相關系數或樣本自相關系數落入2倍標準差范圍內,且它們衰減到0值附近波動非常突然,則可以認為d階截尾。反之,有超過5%的樣本相關系數或樣本偏自相關系數落入2倍標準差之外,或者在衰減到0值附近波動的過程非常的緩慢或者連續(xù),則可以認為它們具有拖尾性。
二、實證分析
1.樣本數據獲取及數據預處理
樣本數據選自廣西統(tǒng)計局公布的全區(qū)月度統(tǒng)計數據,每兩個月作為一次樣本數據獲取點,且得到的數據為當前月與前一月的累計投資額,比如2013年2月的數據即為2013年1月和2月的累計銷售額。得到的數據如下:
首先,觀察原數據的分布情況。從下圖可以看到南寧房地產銷售額呈明顯的波動增長趨勢。另外從原始數據中我們可以看到每年的2月份為南寧房地產銷售的低谷,而每年的12月份則是南寧房地產的銷售高峰。因此,可以認為南寧房地產銷售額數據為具有年度周期的數據。
基于上述理由,決定對數據進行一階差分后在進行周期為6的季節(jié)差分。數據處理后的時序圖如圖2所示,從圖中可以看到經過去趨勢和季節(jié)差分后,序列基本在0值附近波動,即認為預處理后的數據的均值為0,另外可以看出預處理后的數據基本上沒有明顯的趨勢和周期,初步認定處理后的數據平穩(wěn)。
為進一步確認判斷是否正確,現對經過預處理后的數據進行無趨勢無常數項的單位根檢驗,檢驗結果如下:
結果顯示預處理后的數據平穩(wěn)。進一步地,對預處理后的數據進行白噪聲檢驗,檢驗結果如下:
圖3的結果顯示預處理后的數據不是白噪聲數據,這說明預處理后的數據存在著相關信息。綜上可知預處理后的數據平穩(wěn)且非白噪聲數據,適合建立ARIMA模型。
為對模型的p和q進行定階,現在觀察預處理后的數據的自相關系數圖和偏自相關系數圖如下:
從圖4可以看出自相關系數均具有一定的拖尾性,從圖5可以看出偏相關系數4階截尾。這表明預處理后的數據具有短期相關性,這與ADF檢驗的結果一致。根據圖4和圖5,因考慮對預處理后的數據進行無常數均值的ARMA(1,4)和AR(4)模型。并對模型和模型系數的顯著性進行檢驗,然后根據AIC準則選擇最優(yōu)模型。
2.數據建模
首先對數據進行ARIMA(1,(1,6),4)模型擬合,其結果如下:
圖6 ARIMA(1,(1,6),4)模型系數擬合結果
接下來對模型的各項系數進行顯著性檢驗。其結果如下:
根據表4,剔除檢驗p值大于0.05的系數項,由此擬合疏系數季節(jié)模型ARIMA(1,(1,6),(2,4)),得到結果如下: