[摘 要] 根據(jù)多元線性回歸的原理和實(shí)現(xiàn)方法,采用Delphi和ADO數(shù)據(jù)引擎開發(fā)出了一個(gè)集數(shù)據(jù)采集、樣本剔除、統(tǒng)計(jì)檢驗(yàn)與預(yù)測(cè)功能于一體的多元線性回歸系統(tǒng)。該系統(tǒng)操作簡(jiǎn)單、功能強(qiáng)大,具有很強(qiáng)的魯棒性和適應(yīng)性,可以方便地進(jìn)行多元線性回歸和一部分非線性回歸,具有廣泛的應(yīng)用價(jià)值。文章對(duì)系統(tǒng)的設(shè)計(jì)與構(gòu)建作了詳細(xì)的闡述,并用一個(gè)實(shí)例對(duì)該系統(tǒng)的使用及回歸結(jié)果的解讀進(jìn)行了詳細(xì)說明。
[關(guān)鍵詞] 多元線性回歸 非線性回歸 數(shù)據(jù)處理 系統(tǒng)設(shè)計(jì)
一、引言
多元線性回歸分析是一種重要和具有廣泛應(yīng)用價(jià)值的數(shù)據(jù)處理方法,主要用來測(cè)度具有相關(guān)關(guān)系的變量之間數(shù)量變化的一般關(guān)系,以便運(yùn)用估計(jì)或者預(yù)測(cè)的統(tǒng)計(jì)方法。目前,多元線性回歸在很多領(lǐng)域,比如經(jīng)濟(jì)、管理等領(lǐng)域得到了廣泛的應(yīng)用。但目前的一些實(shí)現(xiàn)方法,在功能、可視性、易用性、系統(tǒng)性、穩(wěn)健性、程序的適應(yīng)性以及運(yùn)行速度等方面都還有待探索。鑒于此,筆者根據(jù)多元線性回歸的原理和實(shí)現(xiàn)方法,利用Delphi6.0和ADO數(shù)據(jù)引擎開發(fā)了一個(gè)多元線性回歸數(shù)據(jù)處理系統(tǒng),用來對(duì)大型數(shù)據(jù)進(jìn)行回歸處理,相比其他的軟件,該程序具有提高了數(shù)據(jù)處理的高效性、針對(duì)性和可操作性等特點(diǎn),并且操作簡(jiǎn)單明了,上手容易。
二、系統(tǒng)設(shè)計(jì)
本系統(tǒng)包括以下四個(gè)模塊:數(shù)據(jù)獲取、數(shù)據(jù)及變量處理、回歸分析、結(jié)果輸出。主要的工作內(nèi)容是通過數(shù)據(jù)庫或者Excel獲得基本數(shù)據(jù),然后對(duì)基本數(shù)據(jù)進(jìn)行處理,存放在數(shù)據(jù)庫中,接著利用最小二乘法進(jìn)行線性回歸,最后將結(jié)果進(jìn)行保存。
根據(jù)以上分析,本系統(tǒng)的總體結(jié)構(gòu)如圖1所示。
根據(jù)回歸計(jì)算的要求及本程序的特點(diǎn)可以得到具有二范式的數(shù)據(jù)庫概念模型,來滿足系統(tǒng)開發(fā)所需要的性能,達(dá)到設(shè)計(jì)要求。由于每次回歸運(yùn)算解釋變量的數(shù)目不一定相同,本系統(tǒng)采用動(dòng)態(tài)建立數(shù)據(jù)表,及動(dòng)態(tài)增減變量的方法。
三、程序?qū)崿F(xiàn)
1.系統(tǒng)界面。系統(tǒng)界面如圖2所示,為全中文圖形用戶界面。GUI集成度高,將最重要的回歸分析部分的數(shù)據(jù)處理、回歸結(jié)果,以及回歸圖形等用選項(xiàng)卡列在程序的主界面上。
2.模塊功能和程序?qū)崿F(xiàn)。(1)數(shù)據(jù)輸入。在進(jìn)行多元線性回歸之前,首先要建立一個(gè)多元回歸項(xiàng)目??梢酝ㄟ^點(diǎn)擊文件菜單的新建回歸項(xiàng)目菜單或者直接雙擊主界面上的表格直接輸入數(shù)據(jù)來完成該操作?;貧w項(xiàng)目建立完成后,可以在主界面的Spreadsheet里面輸入數(shù)據(jù)。另外,還可以通過點(diǎn)擊“文件”菜單上的“獲取外部數(shù)據(jù)”菜單項(xiàng),從Excel文件獲取數(shù)據(jù)。(2)數(shù)據(jù)處理。在完成數(shù)據(jù)的輸入之后,可以在主界面上的Spreadsheet里面對(duì)不符合要求的樣本進(jìn)行剔除。通過點(diǎn)擊主界面上右下角的“剔除”、“添加”按鈕可以進(jìn)行剔除和添加變量的操作。對(duì)變量進(jìn)行計(jì)算是本系統(tǒng)的特色之一,這樣可以將部分非線性回歸轉(zhuǎn)化成線性回歸。在表達(dá)式欄輸入相應(yīng)的公式,就能對(duì)變量進(jìn)行處理。目前,本系統(tǒng)支持包括加減乘除、求余、指數(shù)運(yùn)算、三角函數(shù)、對(duì)數(shù)運(yùn)算、反三角函數(shù)及定積分等常用計(jì)算。(3)回歸分析。本系統(tǒng)采用最小二乘法對(duì)模型參數(shù)進(jìn)行估計(jì)。在“操作”菜單點(diǎn)擊“開始回歸”或者在工具欄點(diǎn)擊“開始回歸”按鈕就能完成相應(yīng)的操作。(4)結(jié)果輸出。本程序產(chǎn)生的結(jié)果分成兩個(gè)部分,一部分是一般的回歸結(jié)果,將在下文詳細(xì)說明;另一部分為圖形結(jié)果,輸出的是各個(gè)自變量和因變量的關(guān)系圖以及差方圖,這些圖形可以幫助我們直觀的理解線性回歸的結(jié)果。(5)其他功能。本程序還能對(duì)現(xiàn)存的回歸項(xiàng)目進(jìn)行管理,并對(duì)其數(shù)據(jù)庫做相應(yīng)的操作,比如修改、刪除等。另外,本程序還可以將回歸結(jié)果保存成Excel表格的形式,以便于日后查看回歸結(jié)果。
四、應(yīng)用實(shí)例
下面用一個(gè)實(shí)例來說明本系統(tǒng)的使用過程、數(shù)據(jù)處理結(jié)果以及結(jié)果的解讀。首先,建立一個(gè)名為“TEST”回歸項(xiàng)目,來研究某省工業(yè)產(chǎn)值()、農(nóng)業(yè)產(chǎn)值()、固定資產(chǎn)投資()對(duì)運(yùn)輸業(yè)產(chǎn)值()的影響。點(diǎn)擊主界面上的“開始回歸”按鈕,輸出如下回歸結(jié)果。
本軟件的回歸結(jié)果由回歸統(tǒng)計(jì)、方差分析、回歸參數(shù)、殘差表和DW檢驗(yàn)等五部分組成?;貧w統(tǒng)計(jì)部分給出了相關(guān)系數(shù)、測(cè)定系數(shù)、校正測(cè)定系數(shù)、標(biāo)準(zhǔn)誤差和樣本數(shù)目等。在表中與之對(duì)應(yīng)的分別是Multiple R、R Square、標(biāo)準(zhǔn)誤差和觀測(cè)值。
在第二部分方差分析中,df、SS、MS和F格列分別代表自由度、誤差平方和、均方差和F值。
第三部分回歸參數(shù)表中包括回歸模型的截距、斜率及其有關(guān)的檢驗(yàn)參數(shù)。第一列對(duì)應(yīng)的是回歸模型的系數(shù),由此可以建立回歸模型:;第二列為回歸系數(shù)的標(biāo)準(zhǔn)誤差,誤差值越小,表明參數(shù)的精確度越高;第三列t Stat對(duì)應(yīng)的是統(tǒng)計(jì)量t值用于對(duì)模型參數(shù)的檢驗(yàn)。
第四部分為殘差輸出結(jié)果。殘差輸出中包括觀測(cè)值序號(hào)(第一列,用i表示),因變量的預(yù)測(cè)值(第二列,用i表示)以及殘差(第三列)。由于該回歸的樣本較多,限于篇幅上表僅列出三個(gè)樣本點(diǎn)。
回歸結(jié)果的最后一部分為DW檢驗(yàn),用于檢驗(yàn)隨機(jī)誤差項(xiàng)具有一階自回歸形式的序列相關(guān)問題。
五、結(jié)論
本文采用Delphi和ADO數(shù)據(jù)引擎開發(fā)了一個(gè)從數(shù)據(jù)的收集整理和處理,到回歸計(jì)算以及回歸結(jié)果的輸出和可視化結(jié)果的多元線性回歸系統(tǒng)。該系統(tǒng)不僅能完成線性回歸,還能通過對(duì)變量進(jìn)行運(yùn)算,完成一部分非線性回歸。
參考文獻(xiàn):
[1]賈俊平:統(tǒng)計(jì)學(xué)[M].北京:清華大學(xué)出版社,2004
[2]李全彬 黃 昶:基于Delphi的高效數(shù)據(jù)庫應(yīng)用系統(tǒng)開發(fā)方法[J].微計(jì)算機(jī)信息,2006,4~3:235~237