王化琨,李春艷,陳莉莉,周亞晶
(黑龍江大學(xué)數(shù)學(xué)科學(xué)學(xué)院,黑龍江 哈爾濱150080)
回歸分析是研究多個(gè)變量間的非確定性關(guān)系的一種統(tǒng)計(jì)分析方法,它在自然科學(xué)、經(jīng)濟(jì)學(xué)和社會(huì)管理學(xué)等領(lǐng)域的定量分析中有著廣泛的應(yīng)用?!皯?yīng)用回歸分析”是高校統(tǒng)計(jì)學(xué)本科專(zhuān)業(yè)的必修課程,它的先修課程有高等代數(shù)、數(shù)學(xué)分析、概率論與數(shù)理統(tǒng)計(jì)等專(zhuān)業(yè)基礎(chǔ)課?!皯?yīng)用回歸分析”的教學(xué)目的,是使學(xué)生能夠理解和掌握基本的線(xiàn)性回歸模型,并了解其他常用的回歸模型,例如嶺回歸、Logistic回歸等。通過(guò)該課程的學(xué)習(xí),學(xué)生不僅對(duì)回歸分析的理論有所了解,而且能夠利用回歸的方法進(jìn)行數(shù)據(jù)分析、統(tǒng)計(jì)建模,解決實(shí)際問(wèn)題。
本文作者是高校數(shù)學(xué)學(xué)院統(tǒng)計(jì)學(xué)專(zhuān)業(yè)的專(zhuān)任教師,多年來(lái)?yè)?dān)任“應(yīng)用回歸分析”的主講教師。我們針對(duì)該門(mén)課程的特點(diǎn),結(jié)合這些年在教學(xué)工作中發(fā)現(xiàn)的問(wèn)題和積累的經(jīng)驗(yàn),對(duì)“應(yīng)用回歸分析”課程的教學(xué)內(nèi)容和教學(xué)方法做一些有益的探討。
根據(jù)我院統(tǒng)計(jì)學(xué)本科專(zhuān)業(yè)偏精算方向的實(shí)際情況,我們?cè)谥v授“應(yīng)用回歸分析”時(shí),既要對(duì)回歸分析的重要理論作嚴(yán)格的數(shù)學(xué)證明、公式推導(dǎo),使回歸分析的學(xué)習(xí)不失數(shù)學(xué)的嚴(yán)謹(jǐn)性。但是,考慮到本科生的實(shí)際情況,對(duì)一些過(guò)于復(fù)雜的理論,我們只介紹它們的意義,并不作數(shù)學(xué)推導(dǎo)。這樣一來(lái),我們不但降低了回歸分析理論學(xué)習(xí)的難度,而且保證了回歸理論的完整性。同時(shí),考慮到本科層次的回歸分析的教學(xué)目的,重點(diǎn)是教授學(xué)生如何利用回歸的方法來(lái)研究變量間的數(shù)量關(guān)系。因此,我們?cè)谶x用教材上著重于回歸分析的應(yīng)用。綜合考慮這些情況,我們選用了何曉群、劉文卿著的《應(yīng)用回歸分析》這本書(shū)。在實(shí)際的講授中,對(duì)于作為回歸分析基礎(chǔ)的一元線(xiàn)性回歸和多元線(xiàn)性回歸內(nèi)容,我們?nèi)嫦到y(tǒng)地介紹了它的理論,包括定理證明、公式推導(dǎo)。這樣既訓(xùn)練了學(xué)生的數(shù)學(xué)思維能力,又加深了對(duì)線(xiàn)性回歸的理解。
另外,對(duì)于像自變量的選擇與逐步回歸、多重共線(xiàn)性等內(nèi)容,我們將教學(xué)重點(diǎn)放在學(xué)生對(duì)這些問(wèn)題的理解上。我們?cè)诮虒W(xué)中發(fā)現(xiàn),將這些內(nèi)容與實(shí)際問(wèn)題相結(jié)合,更能加深學(xué)生的理解,而且有助于激發(fā)學(xué)生的學(xué)習(xí)熱情。例如,在介紹變量的選擇這部分內(nèi)容時(shí),我們舉了空氣污染研究中的變量選擇。該研究討論了某地區(qū)死亡率與氣候、社會(huì)經(jīng)濟(jì)和污染變量的關(guān)系。它列舉了15個(gè)可能影響死亡率的變量,分別是年平均降水量、一月份平均氣溫、七月份平均氣溫、65歲以上老年人口百分比、每戶(hù)人口數(shù)、接受學(xué)校教育年限的中位數(shù)、具有合理住宅的百分比、每平方英里的人數(shù)、非白種人的百分比、白領(lǐng)階層的百分比、低收入家庭的百分比、碳?xì)浠衔锵鄬?duì)潛在污染、氮氧化合物相對(duì)潛在污染、二氧化硫化合物相對(duì)潛在污染、相對(duì)濕度、各種原因?qū)е碌慕?jīng)過(guò)年齡修正的總死亡率等。我們不從流行病學(xué)的角度去評(píng)論,只是利用數(shù)據(jù)進(jìn)行變量選擇的示范。又如,在介紹共線(xiàn)性數(shù)據(jù)的變量選擇時(shí),我們探討了槍械在底特律兇殺案件中的作用。根據(jù)Gunst和Mason收集的1961 ~1973年的數(shù)據(jù),響應(yīng)變量為該城市的兇殺率,預(yù)測(cè)變量是與兇殺案相關(guān)聯(lián)或?qū)礆⒙噬仙杏绊懙淖兞?,例如,?00 ~1000人中配備的全職警察人數(shù)、失業(yè)人口百分比、制造業(yè)人口百分比等。通過(guò)實(shí)例的講解,學(xué)生對(duì)于所學(xué)的內(nèi)容的理解更加深刻,同時(shí)也接觸到一些利用回歸的方法處理實(shí)際問(wèn)題的技巧。
回歸方法通常處理的變量的觀(guān)測(cè)數(shù)據(jù)量很大,手工計(jì)算回歸模型參數(shù)和檢驗(yàn)統(tǒng)計(jì)量很困難。因此,通常需要統(tǒng)計(jì)軟件進(jìn)行計(jì)算。在回歸分析中,常見(jiàn)的軟件有SAS、SPSS等。這些軟件都是收費(fèi)性質(zhì)的軟件,雖然軟件公司提供面向高等院校的免費(fèi)版本,但功能較為有限。考慮這樣的實(shí)際情況,我們?cè)诨貧w分析的實(shí)驗(yàn)課教學(xué)中采用了免費(fèi)開(kāi)源的統(tǒng)計(jì)軟件,R軟件。R是用于統(tǒng)計(jì)分析、繪圖的語(yǔ)言和操作環(huán)境。R是屬于GNU系統(tǒng)的一個(gè)自由、免費(fèi)、源代碼開(kāi)放的軟件,它是一個(gè)用于統(tǒng)計(jì)計(jì)算和統(tǒng)計(jì)制圖的優(yōu)秀工具。R是一套完整的數(shù)據(jù)處理、計(jì)算和制圖軟件系統(tǒng)。其功能包括:數(shù)據(jù)存儲(chǔ)和處理系統(tǒng);數(shù)組運(yùn)算工具(其向量、矩陣運(yùn)算方面功能尤其強(qiáng)大);完整連貫的統(tǒng)計(jì)分析工具;優(yōu)秀的統(tǒng)計(jì)制圖功能;簡(jiǎn)便而強(qiáng)大的編程語(yǔ)言:可操縱數(shù)據(jù)的輸入和輸出,可實(shí)現(xiàn)分支、循環(huán),用戶(hù)可自定義功能。我們?cè)趯?shí)際的實(shí)驗(yàn)教學(xué)中,在講解R軟件的基本操作過(guò)程中,將如何利用R語(yǔ)言建立并求解回歸模型融入其中。通過(guò)這種方式訓(xùn)練學(xué)生利用統(tǒng)計(jì)軟件解決實(shí)際問(wèn)題的能力。同時(shí),我們?cè)谶x擇回歸模型實(shí)例時(shí),盡量考慮社會(huì)經(jīng)濟(jì)和管理領(lǐng)域的實(shí)際問(wèn)題,選擇和教學(xué)內(nèi)容相關(guān),同時(shí)又具有啟發(fā)性的案例。這樣,既訓(xùn)練了學(xué)生解決實(shí)際問(wèn)題的能力,又鍛煉了學(xué)生對(duì)社會(huì)經(jīng)濟(jì)現(xiàn)象的理解分析能力。
每年一屆的大學(xué)生數(shù)學(xué)建模競(jìng)賽,目前已成為全國(guó)高校規(guī)模最大的基礎(chǔ)性學(xué)科競(jìng)賽,它通常選擇在實(shí)際的社會(huì)生產(chǎn)生活或者經(jīng)濟(jì)現(xiàn)象中遇到的實(shí)際問(wèn)題為試題,目的是考察大學(xué)生運(yùn)用所學(xué)的數(shù)學(xué)知識(shí)解決實(shí)際問(wèn)題的能力。實(shí)際上,很多的競(jìng)賽試題都可以通過(guò)建立合適的回歸模型加以解決。我們的回歸分析開(kāi)設(shè)在每學(xué)年的上學(xué)期,恰好和數(shù)學(xué)建模競(jìng)賽的時(shí)間相吻合,我們?cè)诮淌诨貧w分析的同時(shí),鼓勵(lì)學(xué)生報(bào)名參加該項(xiàng)賽事。我們根據(jù)學(xué)生的學(xué)習(xí)情況,將學(xué)生適當(dāng)分組,充分調(diào)動(dòng)學(xué)生的積極性和創(chuàng)造性。同時(shí),學(xué)生在數(shù)學(xué)建模競(jìng)賽中也檢驗(yàn)了所學(xué)的理論知識(shí),激發(fā)了他們的學(xué)習(xí)熱情。例如,針對(duì)建筑工程協(xié)會(huì)提供的一個(gè)由于遺漏了預(yù)測(cè)變量而造成人工的自相關(guān)現(xiàn)象的例子。該協(xié)會(huì)希望了解住房工程開(kāi)工規(guī)模與人口增長(zhǎng)的關(guān)系,其目的是為了預(yù)測(cè)建筑業(yè)的發(fā)展規(guī)模。由于客觀(guān)條件的限制,不可能知道潛在的購(gòu)房者的準(zhǔn)確數(shù)據(jù),只能把當(dāng)?shù)氐木用駭?shù)量作為反映潛在購(gòu)房者規(guī)模的變量。收集的數(shù)據(jù)是該地區(qū)25年的資料,包括住房開(kāi)工數(shù)、人口規(guī)模等。經(jīng)過(guò)分析,一元線(xiàn)性回歸可以反映人口規(guī)模和住房需求的關(guān)系。但是,人口規(guī)模與開(kāi)工數(shù)之間的關(guān)系較為復(fù)雜,往往是住房開(kāi)工數(shù)會(huì)影響人口規(guī)模(通過(guò)人口遷移),反之不然。通過(guò)分析這個(gè)實(shí)際模型,學(xué)生接觸了現(xiàn)實(shí)生產(chǎn)生活中的變量更復(fù)雜,或許有其他的變量更好地解釋開(kāi)工規(guī)模,由于忽略了這樣的變量而造成了誤差間的自相關(guān)。這些可能的潛在變量包括失業(yè)率、婚姻和家庭的社會(huì)趨向、政府的住房政策、建筑和抵押資金的供給。通過(guò)實(shí)際分析,在引入了抵押資金后,誤差的自相關(guān)性消失了,模型較好地反映了變量的關(guān)系。
應(yīng)用回歸分析是一門(mén)實(shí)踐性比較強(qiáng)的統(tǒng)計(jì)學(xué)專(zhuān)業(yè)課,在以理論教學(xué)為主的前提下,還應(yīng)與實(shí)踐教學(xué)和案例教學(xué)結(jié)合。針對(duì)該課程的特點(diǎn),我們改變了以期末考試的“一張卷”定分?jǐn)?shù)的傳統(tǒng)考核方式。我們以期末考試與平時(shí)能力測(cè)試相結(jié)合的考試方試。其中,期末考試主要考查學(xué)生對(duì)回歸分析的基本理論和基本方法的理解掌握程度。平時(shí)能力測(cè)試包括平時(shí)作業(yè)的完成情況、上機(jī)實(shí)踐考核、實(shí)踐報(bào)告。此外,我們還建立了回歸分析教學(xué)網(wǎng)站。我們將很多相關(guān)的參考資料放到網(wǎng)站上,包括教材、參考書(shū)、參考文獻(xiàn)、教學(xué)大綱、教學(xué)計(jì)劃、多媒體課件、實(shí)驗(yàn)案例、習(xí)題和解答、教學(xué)錄像等。這樣,極大地方便了學(xué)生在課前預(yù)習(xí)和課后復(fù)習(xí)。我們利用這個(gè)網(wǎng)站,課后與學(xué)生在網(wǎng)上交流學(xué)習(xí)情況、輔導(dǎo)答疑等。學(xué)生的平時(shí)測(cè)驗(yàn)也放到網(wǎng)站上,讓學(xué)生在網(wǎng)上提交測(cè)驗(yàn),這樣給學(xué)生充分的思考時(shí)間。在期末考試結(jié)束后,教師結(jié)合以上幾個(gè)方面的分?jǐn)?shù),給出學(xué)生的該門(mén)課程的最終成績(jī)。
[1]何曉群,劉文卿.應(yīng)用回歸分析[M].中國(guó)人民大學(xué)出版社,2011.
[2]Samp rit Chatter jee.例解回歸分析[M].機(jī)械工業(yè)出版社,2013.
[3]紀(jì)躍芝,王純潔.《應(yīng)用回歸分析》的課程改革與實(shí)踐[J].教育教學(xué)論壇,2014,(2).
[4]黃蕊,賀樂(lè)平.關(guān)于《回歸分析》課程的教學(xué)思考[J].新課程研究,2014,(4).