王文萍 張琪浙江理工大學(xué)經(jīng)濟(jì)管理學(xué)院
幾種橫截面數(shù)據(jù)多元回歸分析的方法與分類(lèi)
王文萍 張琪
浙江理工大學(xué)經(jīng)濟(jì)管理學(xué)院
橫截面數(shù)據(jù)是在同一時(shí)間,不同統(tǒng)計(jì)單位相同統(tǒng)計(jì)指標(biāo)組成的數(shù)據(jù)列。與時(shí)序數(shù)據(jù)相比較,其區(qū)別在于數(shù)據(jù)的排列標(biāo)準(zhǔn)不同,時(shí)序數(shù)據(jù)是按時(shí)間順序排列的,橫截面數(shù)據(jù)是按照統(tǒng)計(jì)單位排列的。因此,橫截面數(shù)據(jù)不要求統(tǒng)計(jì)對(duì)象及其范圍相同,但要求統(tǒng)計(jì)的時(shí)間相同。也就是說(shuō)必須是同一時(shí)間截面上的數(shù)據(jù)。與時(shí)間數(shù)據(jù)完全一樣,橫截面數(shù)據(jù)的統(tǒng)計(jì)口徑和計(jì)算方法(包括價(jià)值量的計(jì)算方法)也應(yīng)當(dāng)是可比的。在分析橫截面數(shù)據(jù)時(shí),應(yīng)主要注意兩個(gè)問(wèn)題:一是異方差問(wèn)題,由于數(shù)據(jù)是在某一時(shí)期對(duì)個(gè)體或地域的樣本的采集,不同個(gè)體或地域本身就存在差異;二是數(shù)據(jù)的一致性,主要包括變量的樣本容量是否一致、樣本的取樣時(shí)期是否一致、數(shù)據(jù)的統(tǒng)計(jì)標(biāo)準(zhǔn)是否一致。
橫截面數(shù)據(jù) 多元回歸
分位數(shù)回歸是一種根據(jù)給定影響事物的因素來(lái)估計(jì)事物條件分位數(shù)的基本方法,它不僅具有同變性、漸進(jìn)性、穩(wěn)健性等優(yōu)良的性質(zhì),還可以度量給定因素在不同分位點(diǎn)對(duì)事物的影響程度,對(duì)事物的解釋更加全面。
分位數(shù)回歸具有同變性、漸進(jìn)性、穩(wěn)健性利用分位數(shù)回歸的數(shù)學(xué)模型對(duì)文中的掌趣科技股票數(shù)據(jù)進(jìn)行處理,由顯著性檢驗(yàn)和Wald檢驗(yàn)結(jié)果,可知在各個(gè)分位點(diǎn)建立的模型效果都不佳,對(duì)因變量的解釋沒(méi)有指導(dǎo)意義,沒(méi)有體現(xiàn)出分位數(shù)回歸的優(yōu)勢(shì),最后證明是數(shù)據(jù)之間的多重共線(xiàn)性影響了模型的結(jié)果。
Tobit模型也稱(chēng)為樣本選擇模型、受限因變量模型,是因變量滿(mǎn)足某種約束條件下取值的模型。
這種模型的特點(diǎn)在于模型包含兩個(gè)部分,一是表示約束條件的選擇方程模型;一種是滿(mǎn)足約束條件下的某連續(xù)變量方程模型。受限制的連續(xù)變量方程模型研究者往往更加感興趣,但是由于因變量受到某種約束條件的制約,忽略某些不可度量(即:不是觀測(cè)值,而是通過(guò)模型計(jì)算得到的變量)的因素將導(dǎo)致受限因變量模型產(chǎn)生樣本選擇性偏差。
兩部模型(two-part model)與Tobit模型有很大的相似之處,也是研究受限因變量問(wèn)題的模型;但是這兩種模型在模型結(jié)構(gòu)形式、估計(jì)方法、假設(shè)條件等方面也存在一定的區(qū)別。Tobit模型的估計(jì)方法與模型結(jié)構(gòu)形式有密切關(guān)系,不同類(lèi)型的模型估計(jì)方法存在較大的差異,本文按照三種屬性特征對(duì)Tobit模型進(jìn)行了分類(lèi)。
但是,Tobit模型的缺點(diǎn)在于,Tobit模型估計(jì)要求兩部分模型中解釋變量不完全相同,另外系統(tǒng)模型假設(shè)隨機(jī)變量是服從聯(lián)合正態(tài)分布的,違背這兩個(gè)基本假設(shè),可能導(dǎo)致模型不可估計(jì)。
鑒于統(tǒng)計(jì)模型的多樣性和各種模型的適應(yīng)性,針對(duì)因變量和解釋變量的取值性質(zhì),可將統(tǒng)計(jì)模型分為多種類(lèi)型。通常將自變量為定性變量的線(xiàn)性模型成為一般線(xiàn)性模型,將因變量為非正統(tǒng)分布的模型成為廣義線(xiàn)性模型。如Logistic回歸模型、對(duì)數(shù)線(xiàn)性模型、Cox比例風(fēng)險(xiǎn)模型
Logistic回歸采用極大似然估計(jì)方法估計(jì)模型參數(shù),依據(jù)回歸函數(shù)值對(duì)觀測(cè)數(shù)據(jù)進(jìn)行分類(lèi)。Logistic回歸不僅給出具體的分類(lèi)算法,還能描述影響分類(lèi)結(jié)果的影響因素。這種方法簡(jiǎn)單實(shí)用,很多統(tǒng)計(jì)軟件可以完成有關(guān)的計(jì)算,它們應(yīng)用很廣,特別是醫(yī)學(xué)生物學(xué)領(lǐng)域和經(jīng)濟(jì)管理等研究領(lǐng)域。
聚類(lèi)分析顧名思義是要“物以類(lèi)聚”,是對(duì)樣本或者指標(biāo)進(jìn)行分類(lèi)的一種多元統(tǒng)計(jì)分析方法,它處理的對(duì)象是大量的樣本,要能合理的按照各自的特性來(lái)進(jìn)行合理的分類(lèi),在沒(méi)有先驗(yàn)知識(shí)指導(dǎo)的情況下聚類(lèi)是將數(shù)據(jù)分到不同類(lèi)的一個(gè)過(guò)程,要求同一類(lèi)中的樣本(對(duì)象)有很強(qiáng)的相似性,而不同類(lèi)之間的樣本(對(duì)象)有很大的差異性。聚類(lèi)分析將大量數(shù)據(jù)劃分為性質(zhì)相同的子類(lèi),便于了解數(shù)據(jù)的分布情況,目前應(yīng)用于模式識(shí)別,圖像處理,數(shù)據(jù)壓縮等諸多領(lǐng)域,如在市場(chǎng)分析中,通過(guò)聚類(lèi)分析能幫助決策者識(shí)別不同特征的客戶(hù)群以及各客戶(hù)群的行為特征;在生物工程研究中,聚類(lèi)分析能夠用于推導(dǎo)動(dòng)植物的分類(lèi),按照功能對(duì)基因進(jìn)行劃分并獲取種群中的固有結(jié)構(gòu)特征;在web信息檢索領(lǐng)域,聚類(lèi)分析能夠?qū)eb文檔進(jìn)行分類(lèi),以便于提高檢索的效率。在分析實(shí)際問(wèn)題是使用的聚類(lèi)方法有很多,如模糊聚類(lèi)算法,系統(tǒng)聚類(lèi)法,有序樣品聚類(lèi)法,動(dòng)態(tài)聚類(lèi)法等,在本章主要介紹系統(tǒng)聚類(lèi)法和動(dòng)態(tài)聚類(lèi)法中的K-means法,以及這兩種方法的不同之處。
截面數(shù)據(jù)按照規(guī)模變量進(jìn)行排序,并利用這一排序引入時(shí)序數(shù)據(jù)動(dòng)態(tài)建模的設(shè)定方法,即采用差分方程模型形式,對(duì)于模擬截面數(shù)據(jù)中規(guī)模變量間隱含的非線(xiàn)性效應(yīng)具有很大的潛力。使用橫截面數(shù)據(jù)的實(shí)證建模中,建模者非常需要考慮先驗(yàn)?zāi)P驮O(shè)計(jì)在表述變量間規(guī)?;蚩臻g相關(guān)性、亦即函數(shù)形式問(wèn)題方面的不足。數(shù)據(jù)排序方法使我們能夠利用各種現(xiàn)有的時(shí)間序列計(jì)量經(jīng)濟(jì)學(xué)技術(shù)。當(dāng)然,對(duì)截面數(shù)據(jù)的排序?qū)嶒?yàn)并不違反統(tǒng)計(jì)學(xué)中隨機(jī)抽樣的基本假定。數(shù)據(jù)排序的處理是基于已經(jīng)通過(guò)隨機(jī)抽樣方法而收集的數(shù)據(jù)。所進(jìn)行的數(shù)據(jù)排序是為了嘗試更有效地按經(jīng)濟(jì)規(guī)律組織隨機(jī)數(shù)據(jù)樣本,從而從中獲得更多的有用信息。
[1]許玲. 區(qū)域高等教育與經(jīng)濟(jì)發(fā)展水平協(xié)調(diào)性研究--基于2004年和2011年橫截面數(shù)據(jù)的分析 [J]. 高等教育發(fā)展, 2014.01:24~29
[2]秦 朵、劉一萌. 橫截面數(shù)據(jù)變量的規(guī)模特征:特征價(jià)格建模分析[J]. 統(tǒng)計(jì)研究,2015.02, 97~103
[3]唐紅濤、朱晴晴. 我國(guó)高等教育投入效率實(shí)證研究--基于橫截面數(shù)據(jù)的因子分析[J].湖南商學(xué)院學(xué)報(bào), 2016.02, 101~108
[4]張立軍,王瑛,劉菊紅.基于貝葉斯判別分析的上市公司財(cái)務(wù)危機(jī)預(yù)警模型研究[J].商業(yè)研究, 2009(4):112- 114.
[5]田素華. 商務(wù)成本的地區(qū)間差異與獨(dú)資FDI進(jìn)入中國(guó)--基于省級(jí)橫截面數(shù)據(jù)的實(shí)證分析 [J]. 中央財(cái)經(jīng)大學(xué)學(xué)報(bào),2011.12,91~96