亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于多元線(xiàn)性回歸的房?jī)r(jià)預(yù)測(cè)模型改進(jìn)

        2019-03-15 01:30:06張若天
        電子制作 2019年4期
        關(guān)鍵詞:方法模型

        張若天

        (濟(jì)寧孔子國(guó)際學(xué)校,山東濟(jì)寧,272000)

        0 引言

        過(guò)去的十年里,我國(guó)經(jīng)濟(jì)蓬勃發(fā)展,房?jī)r(jià)也隨之飛速提高,讓大量的投資者從中攫取利益,也讓無(wú)數(shù)人成為“房奴”,幾乎人人都開(kāi)始關(guān)注房?jī)r(jià)的波動(dòng)走勢(shì),力圖對(duì)房?jī)r(jià)做出科學(xué)有效的預(yù)測(cè)。因?yàn)榉績(jī)r(jià)的變動(dòng)原因在經(jīng)濟(jì)學(xué)上仍有很大的爭(zhēng)議,所以,預(yù)測(cè)也成為領(lǐng)域炙手可熱的問(wèn)題。

        縱觀全局,從2007年至2017年,各地房?jī)r(jià)都有了長(zhǎng)足的提高,尤其是上海、浙江、江蘇為首的東南沿海地區(qū)和以北京、天津?yàn)槭椎娜A北地區(qū)。

        由于房?jī)r(jià)與國(guó)計(jì)民生休戚相關(guān),房?jī)r(jià)預(yù)測(cè)無(wú)論是在經(jīng)濟(jì)學(xué)、數(shù)學(xué)還是計(jì)算機(jī)科學(xué)都成為了熱門(mén)也同樣十分困難的問(wèn)題,因?yàn)槠渲猩婕傲嗽S多隨機(jī)影響因素,而且影響因素多元,無(wú)法通過(guò)簡(jiǎn)單的統(tǒng)計(jì)學(xué)模型進(jìn)行預(yù)測(cè)。目前,學(xué)界對(duì)房?jī)r(jià)預(yù)測(cè)有了多種方法,如多元回歸線(xiàn)性模型、灰色理論預(yù)測(cè)模型、馬爾科夫預(yù)測(cè)模型、遺傳算法和神經(jīng)網(wǎng)絡(luò)等等模型。

        多元線(xiàn)性回歸模型是一種常用的多元統(tǒng)計(jì)方法,原理明確,結(jié)構(gòu)簡(jiǎn)單,在房?jī)r(jià)預(yù)測(cè)方面被十分廣泛地運(yùn)用,可是效果卻不盡人意,常常在使用的過(guò)程當(dāng)中出現(xiàn)各種各樣的問(wèn)題,而且近期一些“先進(jìn)”的方法并不能從根本上解決這個(gè)問(wèn)題,反而引入了額外的解釋復(fù)雜性,多元線(xiàn)性回歸模型的改進(jìn)亟待解決。

        本文瞄準(zhǔn)中國(guó)樓市,基于多元線(xiàn)性回歸模型,提出了自己的改進(jìn)辦法,本方法并未拋棄多元線(xiàn)性回歸模型,而是從模型結(jié)果和因變量處理上提出了自己的看法,通過(guò)與其他的一些方法相結(jié)合,使組合模型的結(jié)果與實(shí)際情況更加吻合,更能使人信服,為人們提供更加優(yōu)質(zhì)的預(yù)測(cè)方法,必免一些不必要的麻煩。經(jīng)過(guò)檢驗(yàn),本文提供的方法,可以在一定程度上提高房?jī)r(jià)預(yù)測(cè)的穩(wěn)定性和準(zhǔn)確性,使其更加實(shí)用。

        1 模型介紹

        1.1 多元線(xiàn)性回歸模型

        1.1.1 術(shù)語(yǔ)介紹

        回歸分析:一種統(tǒng)計(jì)學(xué)上分析數(shù)據(jù)的方法,目的在于了解兩個(gè)或者多個(gè)變量之間是否相關(guān)、相關(guān)方向與強(qiáng)度,并建立數(shù)學(xué)模型以便于觀察特定變量預(yù)測(cè)研究者感興趣的變量。

        1.1.2 模型引入

        多元線(xiàn)性回歸模型形式如下:

        其中 β0,, β1…βm-1為待估參數(shù),ε為誤差,服從標(biāo)準(zhǔn)正態(tài)分布,對(duì)于待估參數(shù)的確定,有以下求解方法:

        1.1.3 缺點(diǎn)論述

        顯然,多元線(xiàn)性回歸模型有著難以避免的缺點(diǎn)。

        第一,運(yùn)用多元線(xiàn)性回歸模型時(shí),需要涉及大量的矩陣公式計(jì)算,因此,多元線(xiàn)性回歸模型本身就具有計(jì)算量大和不易編程的特點(diǎn),對(duì)人們的研究造成了極大的困擾,常常在一些不必要的地方進(jìn)行不必要的計(jì)算,大大降低了模型的預(yù)測(cè)效率。

        第二,多元線(xiàn)性回歸模型極易受個(gè)別異常數(shù)據(jù)的影響,常常會(huì)在存在異常數(shù)據(jù)的情況中出現(xiàn)模型不符合其實(shí)際意義的問(wèn)題,造成其自變量與因變量之間出現(xiàn)不合理的關(guān)系系數(shù)。如,符號(hào)相反,數(shù)值過(guò)大或過(guò)小,這時(shí)就需要更加穩(wěn)健的回歸方法對(duì)其進(jìn)行優(yōu)化和修改。

        第三,多元線(xiàn)性回歸模型計(jì)算過(guò)程中對(duì)最小二乘法有著極大的依賴(lài)性,但是,最小二乘估計(jì)中也有著一定的缺陷。其平方運(yùn)算會(huì)使估計(jì)值與實(shí)際值之間產(chǎn)生一定的誤差,若計(jì)算較為復(fù)雜的話(huà),誤差就會(huì)越積越大,嚴(yán)重脫離實(shí)際。

        第四,多元回歸線(xiàn)性模型不能實(shí)現(xiàn)跟蹤響應(yīng)變量變化,其估計(jì)值只能對(duì)一段時(shí)間內(nèi)的結(jié)果產(chǎn)生較好的分析,如果是長(zhǎng)期分析,就會(huì)顯得有些捉襟見(jiàn)肘。

        接下來(lái),本文將提出一些改進(jìn)這些問(wèn)題的方法。

        1.2 多元線(xiàn)性回歸模型的改進(jìn)

        1.2.1 主流改進(jìn)方法

        為了改進(jìn)樸素多元線(xiàn)性回歸的若干缺點(diǎn),目前有一些比較成熟的改進(jìn)方法,如嶺回歸、穩(wěn)健回歸、主成分回歸等,這些方法的復(fù)雜度都比較高,還可以使用偏最小二乘估計(jì)代替最小二乘估計(jì)進(jìn)行待估參數(shù)的計(jì)算。要規(guī)避多元共線(xiàn)性,可以使用刪減變量或者引入附加方程的房?jī)r(jià)進(jìn)行處理。

        1.2.2 基于灰色預(yù)測(cè)的多元線(xiàn)性回歸模型

        灰色預(yù)測(cè)是一種對(duì)含有不確定因素的系統(tǒng)進(jìn)行預(yù)測(cè)的方法?;疑A(yù)測(cè)通過(guò)對(duì)各個(gè)變量進(jìn)行關(guān)聯(lián)分析,并對(duì)原始數(shù)據(jù)進(jìn)行生成處理來(lái)尋找整個(gè)系統(tǒng)的變化規(guī)律,生成具有強(qiáng)烈規(guī)律性的數(shù)據(jù)數(shù)列,然后通過(guò)對(duì)預(yù)測(cè)的數(shù)據(jù)建立方程,從而得到其他關(guān)聯(lián)數(shù)據(jù)的變化情況,來(lái)預(yù)測(cè)未來(lái)某一特定時(shí)間的某數(shù)據(jù)。灰色關(guān)聯(lián)理論是鄧教授創(chuàng)立的。其對(duì)少數(shù)據(jù)、貧信息不確定性問(wèn)題的研究作出了重要的貢獻(xiàn)。

        (1)GM(1,1)模型

        GM(1,1)模型有一個(gè)單變量的一階微分方程構(gòu)成。它主要用于復(fù)雜系統(tǒng)某一主導(dǎo)因素特征值擬合和預(yù)測(cè),以揭示主導(dǎo)因素變化規(guī)律和未來(lái)發(fā)展變化趨勢(shì)。

        GM(1,1)模型不僅有連續(xù)的形式,還具有離散形式,而兩者之間有著一定的聯(lián)系。從其中的聯(lián)系入手,便可得到離散GM(1,1)模型。

        (2)灰色組合預(yù)測(cè)

        與回歸分析一樣,灰色組合預(yù)測(cè)模型也是通過(guò)各個(gè)因素之間的關(guān)系而建立的預(yù)測(cè)模型,他將根據(jù)自變量與因變量所占的比重來(lái)建立模型。

        其使用方法大致如下:得到各組序列后,通過(guò)灰色分析得出關(guān)聯(lián)度系數(shù)序列,再得出自身的預(yù)測(cè)值。通過(guò)加權(quán)計(jì)算,得到一個(gè)最合理的權(quán)重,再對(duì)因變量序列中的預(yù)測(cè)值進(jìn)行分析,基于灰色關(guān)聯(lián)系數(shù)建立因變量預(yù)測(cè)值的回歸模型,從而得到計(jì)算后位置元素的預(yù)測(cè)值。

        運(yùn)用灰色組合模型可以使預(yù)測(cè)值與自變量聯(lián)系更加緊密,擬合度更高,從而參考價(jià)值更高,與其他更先進(jìn)的回歸模型得到的結(jié)果十分相近。

        (3)灰色預(yù)測(cè)運(yùn)用到多元線(xiàn)性回歸

        上文對(duì)灰色預(yù)測(cè)模型相關(guān)內(nèi)容進(jìn)行了介紹,易知,灰色預(yù)測(cè)模型具有能夠跟蹤響應(yīng)變量動(dòng)態(tài)變化、能夠避免少量異常數(shù)據(jù)對(duì)預(yù)測(cè)值的影響,并且建模難度小的優(yōu)點(diǎn)。因此,將其與多元線(xiàn)性回歸模型相結(jié)合,可以對(duì)其缺點(diǎn)進(jìn)行極大的彌補(bǔ)。

        (4)應(yīng)用方法

        假設(shè)因變量y受到p個(gè)自變量的影響,現(xiàn)在有n組已知數(shù)據(jù)。首先,先計(jì)算灰色關(guān)聯(lián)度,以確定影響因變量的主要因素,再將其按照灰色關(guān)聯(lián)度排序,從而得到m個(gè)主要因素。然后在對(duì)數(shù)據(jù)進(jìn)行分析,建立多元線(xiàn)性回歸模型

        便得到了一個(gè)以(m個(gè)系數(shù))為總體回歸參數(shù),且(m個(gè)誤差)服從均值為0,方差為σ2的序列通過(guò)代入公式計(jì)算,得到各個(gè)回歸參數(shù)的估計(jì)值。然后在用過(guò)灰色組合模型進(jìn)行對(duì)自變量的預(yù)測(cè),得到m個(gè)預(yù)測(cè)值,代入,便可得到灰色組合多元回歸模型

        然后再對(duì)其進(jìn)行擬合度計(jì)算,檢驗(yàn)?zāi)P偷臏?zhǔn)確度,做最后的調(diào)整,最終得出想要的預(yù)測(cè)值。

        2 數(shù)據(jù)處理

        2.1 介紹數(shù)據(jù)

        數(shù)據(jù)是指對(duì)客觀事件進(jìn)行記錄并可以鑒別的符號(hào),是對(duì)客觀事物的性質(zhì)、狀態(tài)以及相互關(guān)系等進(jìn)行記載的物理符號(hào)或這些物理符號(hào)的組合。它是可識(shí)別的、抽象的符號(hào)。

        數(shù)據(jù)雖然是抽象概念,但是,它也具有規(guī)模和屬性。通俗來(lái)講,數(shù)據(jù)規(guī)模就是數(shù)據(jù)的多少,數(shù)據(jù)越多,規(guī)模就越大,現(xiàn)在所說(shuō)的大數(shù)據(jù)就是規(guī)模極大的數(shù)據(jù);數(shù)據(jù)屬性就是數(shù)據(jù)所具有的性質(zhì),數(shù)據(jù)具有的性質(zhì)越多,我們稱(chēng)其屬性越多,或維度越大,人們常說(shuō)的數(shù)據(jù)降維處理就是盡可能地減少數(shù)據(jù)的無(wú)關(guān)屬性,以達(dá)到篩選的目的。

        同樣,數(shù)據(jù)也有用來(lái)描述自己的單位,這個(gè)人們就接觸的比較多。數(shù)據(jù)的單位常常被稱(chēng)作數(shù)據(jù)的寬度,日常生活中的網(wǎng)絡(luò)速度、下載速度、存儲(chǔ)空間等等都應(yīng)用到了數(shù)據(jù)的單位方面的內(nèi)容。

        2.2 數(shù)據(jù)預(yù)處理的方法

        數(shù)據(jù)預(yù)處理的主要方法就是數(shù)據(jù)清洗和數(shù)據(jù)歸約。

        數(shù)據(jù)清洗主要包括對(duì)數(shù)據(jù)集進(jìn)行異常檢測(cè)、識(shí)別并消除數(shù)據(jù)集中近似重復(fù)對(duì)象、對(duì)缺失數(shù)據(jù)進(jìn)行清洗。數(shù)據(jù)集的異常檢測(cè)主要就是消除少數(shù)異常數(shù)據(jù)對(duì)總體的影響,常常運(yùn)用均值和標(biāo)準(zhǔn)差進(jìn)行檢測(cè);重復(fù)記錄的清洗主要就是篩掉重復(fù)的數(shù)據(jù),使數(shù)據(jù)集更加精簡(jiǎn),減少不必要的數(shù)據(jù)分析;對(duì)缺失數(shù)據(jù)的清洗與灰色預(yù)測(cè)模型有些相似,旨在對(duì)缺失數(shù)據(jù)進(jìn)行預(yù)測(cè),其中涉及了許多高級(jí)的理論方法,這里就不再一一描述。

        數(shù)據(jù)歸約主要包括高維數(shù)據(jù)的降維處理和離散化技術(shù)減少給定連續(xù)屬性值的個(gè)數(shù)。高維數(shù)據(jù)降維處理其本質(zhì)就是刪除數(shù)據(jù)的冗余屬性,避免其對(duì)預(yù)測(cè)過(guò)程造成影響,簡(jiǎn)化對(duì)數(shù)據(jù)分析的過(guò)程;而離散化技術(shù)減少給定連續(xù)屬性值的個(gè)數(shù)這種方法大多數(shù)是遞歸進(jìn)行的,看似花費(fèi)了大量的時(shí)間,其實(shí)卻節(jié)省了后面步驟的時(shí)間。

        2.3 分析房?jī)r(jià)數(shù)據(jù)

        對(duì)于房?jī)r(jià)數(shù)據(jù)而言,每一個(gè)數(shù)據(jù)維度都是具有現(xiàn)實(shí)意義的,因此如果想要降低數(shù)據(jù)維度,不能直接使用PCA、SVD等降維方法來(lái)降低數(shù)據(jù)復(fù)雜性,而是應(yīng)該使用特征子集選擇、特征創(chuàng)建方法。在處理某些特殊屬性時(shí),如“是否是學(xué)區(qū)房”、“是否有重大國(guó)家政策”等屬性時(shí),應(yīng)該將原有數(shù)據(jù)處理成離散形式,如1代表“是”,0代表“否”等。在降低數(shù)據(jù)的復(fù)雜度之后,還應(yīng)該使用簡(jiǎn)單的變量變換,對(duì)各個(gè)維度的數(shù)據(jù)進(jìn)行規(guī)范化以消弭不同維度之間的數(shù)量級(jí)差別。在進(jìn)行萬(wàn)以上處理之后,房?jī)r(jià)數(shù)據(jù)已經(jīng)可以應(yīng)用到我們的模型中。

        3 結(jié)論

        3.1 模型優(yōu)勢(shì)

        本文的改進(jìn)不僅保留了多元線(xiàn)性回歸模型結(jié)構(gòu)簡(jiǎn)單、原理明確的優(yōu)點(diǎn),而且避免了多元線(xiàn)性回歸模型的各種缺點(diǎn),使多元線(xiàn)性回歸模型的應(yīng)用更加廣泛。同時(shí),本文提出的模型還汲取了灰色預(yù)測(cè)模型的優(yōu)勢(shì),使數(shù)據(jù)擬合度更高,更有價(jià)值去預(yù)測(cè)。

        經(jīng)過(guò)實(shí)例的驗(yàn)證,本文模型的構(gòu)造是成功的,比傳統(tǒng)多元線(xiàn)性回歸模型要準(zhǔn)確得多大大增強(qiáng)了本文提出模型的可行性,但還不能做到絕對(duì)的準(zhǔn)確,還需進(jìn)一步的研究。

        3.2 改進(jìn)方向

        目前的數(shù)據(jù)量比較小,而且分布范圍狹窄,基于統(tǒng)計(jì)學(xué)的模型無(wú)法發(fā)揮出最大的優(yōu)勢(shì),因此之后的一個(gè)改進(jìn)方向是尋找更多更可靠的數(shù)據(jù)來(lái)源,收集比較多的前期數(shù)據(jù)。除此之外,要想更加深刻地發(fā)現(xiàn)房?jī)r(jià)變動(dòng)背后的規(guī)律,尋找更多的房?jī)r(jià)關(guān)聯(lián)屬性,即發(fā)掘更高的數(shù)據(jù)維度也是一個(gè)重要的改進(jìn)方向,當(dāng)數(shù)據(jù)維度足夠高時(shí),才能夠還原出影響房?jī)r(jià)的更多細(xì)節(jié)。

        目前本文在改進(jìn)多元線(xiàn)性回歸模型上做出的主要努力是結(jié)合了灰度預(yù)測(cè)模型,但是模型的整體復(fù)雜度尚有欠缺,無(wú)法擬合出數(shù)據(jù)更加復(fù)雜的變化,因此在現(xiàn)有的改進(jìn)基礎(chǔ)上,嘗試將模型做得更加復(fù)雜也是使得模型具有更加良好表現(xiàn)的一種方法。除了以上的改進(jìn)方向,對(duì)于迭代出的模型還應(yīng)該有一個(gè)更加智能的函數(shù)來(lái)對(duì)當(dāng)前模型進(jìn)行打分以評(píng)判模型的好壞,有了這樣的評(píng)價(jià)函數(shù)之后,模型的表現(xiàn)也會(huì)變得更好。

        猜你喜歡
        方法模型
        一半模型
        重要模型『一線(xiàn)三等角』
        重尾非線(xiàn)性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        學(xué)習(xí)方法
        可能是方法不對(duì)
        3D打印中的模型分割與打包
        用對(duì)方法才能瘦
        Coco薇(2016年2期)2016-03-22 02:42:52
        FLUKA幾何模型到CAD幾何模型轉(zhuǎn)換方法初步研究
        四大方法 教你不再“坐以待病”!
        Coco薇(2015年1期)2015-08-13 02:47:34
        賺錢(qián)方法
        国产一级三级三级在线视| 337p日本欧洲亚洲大胆| 黄瓜视频在线观看| 另类一区二区三区| 男男互吃大丁视频网站| 亚洲中文字幕久久精品一区| 国产69精品久久久久久久| 国产精品一区二区暴白浆| 精品免费看国产一区二区白浆| 国产亚洲精品在线视频| 啦啦啦中文在线观看日本| 欧美丰满熟妇bbbbbb百度| 久久精品熟女亚洲av艳妇| 水蜜桃在线精品视频网| 人人妻人人狠人人爽| 91热这里只有精品| 初尝人妻少妇中文字幕在线| 国产精品网站91九色| 成 人免费va视频| 夜夜爽无码一区二区三区| 免费看黄在线永久观看| 新婚人妻不戴套国产精品| 成人看片黄a免费看那个网址 | 日韩人妻ol丝袜av一二区| 亚洲va欧美va国产综合| 亚洲国产免费公开在线视频| 一区二区三区午夜视频在线| 色妞色视频一区二区三区四区| 中文文精品字幕一区二区| 国产一区二区三区经典| 中文字日产幕码三区的做法大全| 国产人妻久久精品二区三区特黄| 婷婷色国产精品视频一区| 国产三级av在线精品| 久久精品国产自在天天线| 午夜AV地址发布| 亚洲午夜精品国产一区二区三区| 中文字幕av久久亚洲精品| 精品亚洲成a人7777在线观看| 人妻少妇精品无码专区app| 国产极品大奶在线视频|