亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

基于多元線(xiàn)性回歸的房?jī)r(jià)預(yù)測(cè)模型改進(jìn)

2019-03-15 01:30:06張若天

電子制作 2019年4期

關(guān)鍵詞：方法模型

張若天

（濟(jì)寧孔子國(guó)際學(xué)校，山東濟(jì)寧，272000）

0 引言

過(guò)去的十年里，我國(guó)經(jīng)濟(jì)蓬勃發(fā)展，房?jī)r(jià)也隨之飛速提高，讓大量的投資者從中攫取利益，也讓無(wú)數(shù)人成為“房奴”，幾乎人人都開(kāi)始關(guān)注房?jī)r(jià)的波動(dòng)走勢(shì)，力圖對(duì)房?jī)r(jià)做出科學(xué)有效的預(yù)測(cè)。因?yàn)榉績(jī)r(jià)的變動(dòng)原因在經(jīng)濟(jì)學(xué)上仍有很大的爭(zhēng)議，所以，預(yù)測(cè)也成為領(lǐng)域炙手可熱的問(wèn)題。

縱觀全局，從2007年至2017年，各地房?jī)r(jià)都有了長(zhǎng)足的提高，尤其是上海、浙江、江蘇為首的東南沿海地區(qū)和以北京、天津?yàn)槭椎娜A北地區(qū)。

由于房?jī)r(jià)與國(guó)計(jì)民生休戚相關(guān)，房?jī)r(jià)預(yù)測(cè)無(wú)論是在經(jīng)濟(jì)學(xué)、數(shù)學(xué)還是計(jì)算機(jī)科學(xué)都成為了熱門(mén)也同樣十分困難的問(wèn)題，因?yàn)槠渲猩婕傲嗽S多隨機(jī)影響因素，而且影響因素多元，無(wú)法通過(guò)簡(jiǎn)單的統(tǒng)計(jì)學(xué)模型進(jìn)行預(yù)測(cè)。目前，學(xué)界對(duì)房?jī)r(jià)預(yù)測(cè)有了多種方法，如多元回歸線(xiàn)性模型、灰色理論預(yù)測(cè)模型、馬爾科夫預(yù)測(cè)模型、遺傳算法和神經(jīng)網(wǎng)絡(luò)等等模型。

多元線(xiàn)性回歸模型是一種常用的多元統(tǒng)計(jì)方法，原理明確，結(jié)構(gòu)簡(jiǎn)單，在房?jī)r(jià)預(yù)測(cè)方面被十分廣泛地運(yùn)用，可是效果卻不盡人意，常常在使用的過(guò)程當(dāng)中出現(xiàn)各種各樣的問(wèn)題，而且近期一些“先進(jìn)”的方法并不能從根本上解決這個(gè)問(wèn)題，反而引入了額外的解釋復(fù)雜性，多元線(xiàn)性回歸模型的改進(jìn)亟待解決。

本文瞄準(zhǔn)中國(guó)樓市，基于多元線(xiàn)性回歸模型，提出了自己的改進(jìn)辦法，本方法并未拋棄多元線(xiàn)性回歸模型，而是從模型結(jié)果和因變量處理上提出了自己的看法，通過(guò)與其他的一些方法相結(jié)合，使組合模型的結(jié)果與實(shí)際情況更加吻合，更能使人信服，為人們提供更加優(yōu)質(zhì)的預(yù)測(cè)方法，必免一些不必要的麻煩。經(jīng)過(guò)檢驗(yàn)，本文提供的方法，可以在一定程度上提高房?jī)r(jià)預(yù)測(cè)的穩(wěn)定性和準(zhǔn)確性，使其更加實(shí)用。

1 模型介紹

1.1 多元線(xiàn)性回歸模型

1.1.1 術(shù)語(yǔ)介紹

回歸分析：一種統(tǒng)計(jì)學(xué)上分析數(shù)據(jù)的方法，目的在于了解兩個(gè)或者多個(gè)變量之間是否相關(guān)、相關(guān)方向與強(qiáng)度，并建立數(shù)學(xué)模型以便于觀察特定變量預(yù)測(cè)研究者感興趣的變量。

1.1.2 模型引入

多元線(xiàn)性回歸模型形式如下：

其中 β0,, β1…βm-1為待估參數(shù)，ε為誤差，服從標(biāo)準(zhǔn)正態(tài)分布，對(duì)于待估參數(shù)的確定，有以下求解方法：

1.1.3 缺點(diǎn)論述

顯然，多元線(xiàn)性回歸模型有著難以避免的缺點(diǎn)。

第一，運(yùn)用多元線(xiàn)性回歸模型時(shí)，需要涉及大量的矩陣公式計(jì)算，因此，多元線(xiàn)性回歸模型本身就具有計(jì)算量大和不易編程的特點(diǎn)，對(duì)人們的研究造成了極大的困擾，常常在一些不必要的地方進(jìn)行不必要的計(jì)算，大大降低了模型的預(yù)測(cè)效率。

第二，多元線(xiàn)性回歸模型極易受個(gè)別異常數(shù)據(jù)的影響，常常會(huì)在存在異常數(shù)據(jù)的情況中出現(xiàn)模型不符合其實(shí)際意義的問(wèn)題，造成其自變量與因變量之間出現(xiàn)不合理的關(guān)系系數(shù)。如，符號(hào)相反，數(shù)值過(guò)大或過(guò)小，這時(shí)就需要更加穩(wěn)健的回歸方法對(duì)其進(jìn)行優(yōu)化和修改。

第三，多元線(xiàn)性回歸模型計(jì)算過(guò)程中對(duì)最小二乘法有著極大的依賴(lài)性，但是，最小二乘估計(jì)中也有著一定的缺陷。其平方運(yùn)算會(huì)使估計(jì)值與實(shí)際值之間產(chǎn)生一定的誤差，若計(jì)算較為復(fù)雜的話(huà)，誤差就會(huì)越積越大，嚴(yán)重脫離實(shí)際。

第四，多元回歸線(xiàn)性模型不能實(shí)現(xiàn)跟蹤響應(yīng)變量變化，其估計(jì)值只能對(duì)一段時(shí)間內(nèi)的結(jié)果產(chǎn)生較好的分析，如果是長(zhǎng)期分析，就會(huì)顯得有些捉襟見(jiàn)肘。

接下來(lái)，本文將提出一些改進(jìn)這些問(wèn)題的方法。

1.2 多元線(xiàn)性回歸模型的改進(jìn)

1.2.1 主流改進(jìn)方法

為了改進(jìn)樸素多元線(xiàn)性回歸的若干缺點(diǎn)，目前有一些比較成熟的改進(jìn)方法，如嶺回歸、穩(wěn)健回歸、主成分回歸等，這些方法的復(fù)雜度都比較高，還可以使用偏最小二乘估計(jì)代替最小二乘估計(jì)進(jìn)行待估參數(shù)的計(jì)算。要規(guī)避多元共線(xiàn)性，可以使用刪減變量或者引入附加方程的房?jī)r(jià)進(jìn)行處理。

1.2.2 基于灰色預(yù)測(cè)的多元線(xiàn)性回歸模型

灰色預(yù)測(cè)是一種對(duì)含有不確定因素的系統(tǒng)進(jìn)行預(yù)測(cè)的方法?；疑A(yù)測(cè)通過(guò)對(duì)各個(gè)變量進(jìn)行關(guān)聯(lián)分析，并對(duì)原始數(shù)據(jù)進(jìn)行生成處理來(lái)尋找整個(gè)系統(tǒng)的變化規(guī)律，生成具有強(qiáng)烈規(guī)律性的數(shù)據(jù)數(shù)列，然后通過(guò)對(duì)預(yù)測(cè)的數(shù)據(jù)建立方程，從而得到其他關(guān)聯(lián)數(shù)據(jù)的變化情況，來(lái)預(yù)測(cè)未來(lái)某一特定時(shí)間的某數(shù)據(jù)。灰色關(guān)聯(lián)理論是鄧教授創(chuàng)立的。其對(duì)少數(shù)據(jù)、貧信息不確定性問(wèn)題的研究作出了重要的貢獻(xiàn)。

（1）GM（1,1）模型

GM（1,1）模型有一個(gè)單變量的一階微分方程構(gòu)成。它主要用于復(fù)雜系統(tǒng)某一主導(dǎo)因素特征值擬合和預(yù)測(cè)，以揭示主導(dǎo)因素變化規(guī)律和未來(lái)發(fā)展變化趨勢(shì)。

GM（1,1）模型不僅有連續(xù)的形式，還具有離散形式，而兩者之間有著一定的聯(lián)系。從其中的聯(lián)系入手，便可得到離散GM（1,1）模型。

（2）灰色組合預(yù)測(cè)

與回歸分析一樣，灰色組合預(yù)測(cè)模型也是通過(guò)各個(gè)因素之間的關(guān)系而建立的預(yù)測(cè)模型，他將根據(jù)自變量與因變量所占的比重來(lái)建立模型。

其使用方法大致如下：得到各組序列后，通過(guò)灰色分析得出關(guān)聯(lián)度系數(shù)序列，再得出自身的預(yù)測(cè)值。通過(guò)加權(quán)計(jì)算，得到一個(gè)最合理的權(quán)重，再對(duì)因變量序列中的預(yù)測(cè)值進(jìn)行分析，基于灰色關(guān)聯(lián)系數(shù)建立因變量預(yù)測(cè)值的回歸模型，從而得到計(jì)算后位置元素的預(yù)測(cè)值。

運(yùn)用灰色組合模型可以使預(yù)測(cè)值與自變量聯(lián)系更加緊密，擬合度更高，從而參考價(jià)值更高，與其他更先進(jìn)的回歸模型得到的結(jié)果十分相近。

（3）灰色預(yù)測(cè)運(yùn)用到多元線(xiàn)性回歸

上文對(duì)灰色預(yù)測(cè)模型相關(guān)內(nèi)容進(jìn)行了介紹，易知，灰色預(yù)測(cè)模型具有能夠跟蹤響應(yīng)變量動(dòng)態(tài)變化、能夠避免少量異常數(shù)據(jù)對(duì)預(yù)測(cè)值的影響，并且建模難度小的優(yōu)點(diǎn)。因此，將其與多元線(xiàn)性回歸模型相結(jié)合，可以對(duì)其缺點(diǎn)進(jìn)行極大的彌補(bǔ)。

（4）應(yīng)用方法

假設(shè)因變量y受到p個(gè)自變量的影響，現(xiàn)在有n組已知數(shù)據(jù)。首先，先計(jì)算灰色關(guān)聯(lián)度，以確定影響因變量的主要因素，再將其按照灰色關(guān)聯(lián)度排序，從而得到m個(gè)主要因素。然后在對(duì)數(shù)據(jù)進(jìn)行分析，建立多元線(xiàn)性回歸模型

便得到了一個(gè)以（m個(gè)系數(shù)）為總體回歸參數(shù)，且（m個(gè)誤差）服從均值為0，方差為σ2的序列通過(guò)代入公式計(jì)算，得到各個(gè)回歸參數(shù)的估計(jì)值。然后在用過(guò)灰色組合模型進(jìn)行對(duì)自變量的預(yù)測(cè)，得到m個(gè)預(yù)測(cè)值，代入，便可得到灰色組合多元回歸模型

然后再對(duì)其進(jìn)行擬合度計(jì)算，檢驗(yàn)?zāi)Ｐ偷臏?zhǔn)確度，做最后的調(diào)整，最終得出想要的預(yù)測(cè)值。

2 數(shù)據(jù)處理

2.1 介紹數(shù)據(jù)

數(shù)據(jù)是指對(duì)客觀事件進(jìn)行記錄并可以鑒別的符號(hào)，是對(duì)客觀事物的性質(zhì)、狀態(tài)以及相互關(guān)系等進(jìn)行記載的物理符號(hào)或這些物理符號(hào)的組合。它是可識(shí)別的、抽象的符號(hào)。

數(shù)據(jù)雖然是抽象概念，但是，它也具有規(guī)模和屬性。通俗來(lái)講，數(shù)據(jù)規(guī)模就是數(shù)據(jù)的多少，數(shù)據(jù)越多，規(guī)模就越大，現(xiàn)在所說(shuō)的大數(shù)據(jù)就是規(guī)模極大的數(shù)據(jù)；數(shù)據(jù)屬性就是數(shù)據(jù)所具有的性質(zhì)，數(shù)據(jù)具有的性質(zhì)越多，我們稱(chēng)其屬性越多，或維度越大，人們常說(shuō)的數(shù)據(jù)降維處理就是盡可能地減少數(shù)據(jù)的無(wú)關(guān)屬性，以達(dá)到篩選的目的。

同樣，數(shù)據(jù)也有用來(lái)描述自己的單位，這個(gè)人們就接觸的比較多。數(shù)據(jù)的單位常常被稱(chēng)作數(shù)據(jù)的寬度，日常生活中的網(wǎng)絡(luò)速度、下載速度、存儲(chǔ)空間等等都應(yīng)用到了數(shù)據(jù)的單位方面的內(nèi)容。

2.2 數(shù)據(jù)預(yù)處理的方法

數(shù)據(jù)預(yù)處理的主要方法就是數(shù)據(jù)清洗和數(shù)據(jù)歸約。

數(shù)據(jù)清洗主要包括對(duì)數(shù)據(jù)集進(jìn)行異常檢測(cè)、識(shí)別并消除數(shù)據(jù)集中近似重復(fù)對(duì)象、對(duì)缺失數(shù)據(jù)進(jìn)行清洗。數(shù)據(jù)集的異常檢測(cè)主要就是消除少數(shù)異常數(shù)據(jù)對(duì)總體的影響，常常運(yùn)用均值和標(biāo)準(zhǔn)差進(jìn)行檢測(cè)；重復(fù)記錄的清洗主要就是篩掉重復(fù)的數(shù)據(jù)，使數(shù)據(jù)集更加精簡(jiǎn)，減少不必要的數(shù)據(jù)分析；對(duì)缺失數(shù)據(jù)的清洗與灰色預(yù)測(cè)模型有些相似，旨在對(duì)缺失數(shù)據(jù)進(jìn)行預(yù)測(cè)，其中涉及了許多高級(jí)的理論方法，這里就不再一一描述。

數(shù)據(jù)歸約主要包括高維數(shù)據(jù)的降維處理和離散化技術(shù)減少給定連續(xù)屬性值的個(gè)數(shù)。高維數(shù)據(jù)降維處理其本質(zhì)就是刪除數(shù)據(jù)的冗余屬性，避免其對(duì)預(yù)測(cè)過(guò)程造成影響，簡(jiǎn)化對(duì)數(shù)據(jù)分析的過(guò)程；而離散化技術(shù)減少給定連續(xù)屬性值的個(gè)數(shù)這種方法大多數(shù)是遞歸進(jìn)行的，看似花費(fèi)了大量的時(shí)間，其實(shí)卻節(jié)省了后面步驟的時(shí)間。

2.3 分析房?jī)r(jià)數(shù)據(jù)

對(duì)于房?jī)r(jià)數(shù)據(jù)而言，每一個(gè)數(shù)據(jù)維度都是具有現(xiàn)實(shí)意義的，因此如果想要降低數(shù)據(jù)維度，不能直接使用PCA、SVD等降維方法來(lái)降低數(shù)據(jù)復(fù)雜性，而是應(yīng)該使用特征子集選擇、特征創(chuàng)建方法。在處理某些特殊屬性時(shí)，如“是否是學(xué)區(qū)房”、“是否有重大國(guó)家政策”等屬性時(shí)，應(yīng)該將原有數(shù)據(jù)處理成離散形式，如1代表“是”，0代表“否”等。在降低數(shù)據(jù)的復(fù)雜度之后，還應(yīng)該使用簡(jiǎn)單的變量變換，對(duì)各個(gè)維度的數(shù)據(jù)進(jìn)行規(guī)范化以消弭不同維度之間的數(shù)量級(jí)差別。在進(jìn)行萬(wàn)以上處理之后，房?jī)r(jià)數(shù)據(jù)已經(jīng)可以應(yīng)用到我們的模型中。

3 結(jié)論

3.1 模型優(yōu)勢(shì)

本文的改進(jìn)不僅保留了多元線(xiàn)性回歸模型結(jié)構(gòu)簡(jiǎn)單、原理明確的優(yōu)點(diǎn)，而且避免了多元線(xiàn)性回歸模型的各種缺點(diǎn)，使多元線(xiàn)性回歸模型的應(yīng)用更加廣泛。同時(shí)，本文提出的模型還汲取了灰色預(yù)測(cè)模型的優(yōu)勢(shì)，使數(shù)據(jù)擬合度更高，更有價(jià)值去預(yù)測(cè)。

經(jīng)過(guò)實(shí)例的驗(yàn)證，本文模型的構(gòu)造是成功的，比傳統(tǒng)多元線(xiàn)性回歸模型要準(zhǔn)確得多大大增強(qiáng)了本文提出模型的可行性，但還不能做到絕對(duì)的準(zhǔn)確，還需進(jìn)一步的研究。

3.2 改進(jìn)方向

目前的數(shù)據(jù)量比較小，而且分布范圍狹窄，基于統(tǒng)計(jì)學(xué)的模型無(wú)法發(fā)揮出最大的優(yōu)勢(shì)，因此之后的一個(gè)改進(jìn)方向是尋找更多更可靠的數(shù)據(jù)來(lái)源，收集比較多的前期數(shù)據(jù)。除此之外，要想更加深刻地發(fā)現(xiàn)房?jī)r(jià)變動(dòng)背后的規(guī)律，尋找更多的房?jī)r(jià)關(guān)聯(lián)屬性，即發(fā)掘更高的數(shù)據(jù)維度也是一個(gè)重要的改進(jìn)方向，當(dāng)數(shù)據(jù)維度足夠高時(shí)，才能夠還原出影響房?jī)r(jià)的更多細(xì)節(jié)。

目前本文在改進(jìn)多元線(xiàn)性回歸模型上做出的主要努力是結(jié)合了灰度預(yù)測(cè)模型，但是模型的整體復(fù)雜度尚有欠缺，無(wú)法擬合出數(shù)據(jù)更加復(fù)雜的變化，因此在現(xiàn)有的改進(jìn)基礎(chǔ)上，嘗試將模型做得更加復(fù)雜也是使得模型具有更加良好表現(xiàn)的一種方法。除了以上的改進(jìn)方向，對(duì)于迭代出的模型還應(yīng)該有一個(gè)更加智能的函數(shù)來(lái)對(duì)當(dāng)前模型進(jìn)行打分以評(píng)判模型的好壞，有了這樣的評(píng)價(jià)函數(shù)之后，模型的表現(xiàn)也會(huì)變得更好。