毛春梅
(四川工商學院 經濟管理學院,四川 成都 610000)
大數(shù)據(jù)背景下,數(shù)據(jù)搜集、整理不像以往一樣困難,數(shù)據(jù)處理更加簡單、快捷,而且計算機可以在較短時間內處理海量數(shù)據(jù),從數(shù)據(jù)中得到有價值的信息成為公司制勝的法寶。統(tǒng)計學作為一門收集、處理、分析、解釋數(shù)據(jù)并從數(shù)據(jù)中得到結論的科學,是經管類各專業(yè)的基礎必修課程,必然會引入大數(shù)據(jù)理念,而大量統(tǒng)計學相關理論和技術將應用于大數(shù)據(jù)發(fā)展的進程中。
統(tǒng)計分析與SPSS 應用課程將統(tǒng)計學理論內容和SPSS 軟件應用相結合,通過本課程的學習,使學生了解和掌握統(tǒng)計設計、統(tǒng)計調查、統(tǒng)計整理和統(tǒng)計分析的基本理論與方法。主要內容包括統(tǒng)計整理、指標描述分析、抽樣推斷分析、時間序列分析、相關分析、假設檢驗等。學生在掌握了統(tǒng)計分析的理論知識的基礎上,運用SPSS 統(tǒng)計軟件進行數(shù)據(jù)的編輯、描述性統(tǒng)計分析、參數(shù)檢驗、非參數(shù)檢驗、相關分析與回歸分析等。該課程以實際數(shù)據(jù)為紐帶說明SPSS 的操作,以應用案例為背景闡述數(shù)據(jù)分析的思路。
在大數(shù)據(jù)時代,統(tǒng)計學課程應將培養(yǎng)學生的統(tǒng)計思維、提升學生的統(tǒng)計知識應用能力作為課程教學改革的重點。經管類專業(yè)統(tǒng)計學課程的主要目標是培養(yǎng)學生數(shù)據(jù)處理、分析能力。具體來講,通過對本課程的學習,要求學生系統(tǒng)掌握統(tǒng)計學的一般原理和統(tǒng)計方法,為進行經濟管理和從事社會經濟問題研究提供數(shù)量分析方法;其次,能夠運用統(tǒng)計方法與統(tǒng)計分析軟件進行數(shù)據(jù)收集、處理、分析,達到能夠正確運用統(tǒng)計分析方法解決實際問題的目的。
大數(shù)據(jù)拓展了統(tǒng)計學的研究領域,利用大數(shù)據(jù)所帶來的思想方式的變革,挖掘大數(shù)據(jù)資源蘊藏的社會、商業(yè)價值,對改進和完善統(tǒng)計工作,對提升統(tǒng)計工作價值具有重大意義。在大數(shù)據(jù)時代,不僅任何一種以結構數(shù)據(jù)度量的數(shù)量可以作為統(tǒng)計研究對象,而且不能用數(shù)量關系衡量的如文本、圖片、視頻、聲音、動畫、地理位置等半結構或非結構數(shù)據(jù)都可以作為統(tǒng)計研究的對象。在大數(shù)據(jù)時代,統(tǒng)計工作面對的數(shù)據(jù)對象從樣本數(shù)據(jù)變成了總體數(shù)據(jù),統(tǒng)計工作不必采取試驗或抽樣調查的方法,其運行環(huán)節(jié)得到了簡化。
1.關于調研數(shù)據(jù)的區(qū)別
統(tǒng)計分析中的數(shù)據(jù)是通過統(tǒng)計調查收集的數(shù)據(jù),這個數(shù)據(jù)包括一手數(shù)據(jù)也包括二手數(shù)據(jù),將數(shù)據(jù)進行整理以后,可以形成相應的統(tǒng)計表或者統(tǒng)計圖。大數(shù)據(jù)分析背景下,更常見的是半結構化數(shù)據(jù)、非結構化數(shù)據(jù),甚至是異構數(shù)據(jù),可以挖掘出比傳統(tǒng)統(tǒng)計學更有價值的信息。在原始數(shù)據(jù)的收集上,應該注意將傳統(tǒng)的結構化數(shù)據(jù)跟大數(shù)據(jù)相結合。
2.關于數(shù)據(jù)收集方法的區(qū)別
傳統(tǒng)的統(tǒng)計分析數(shù)據(jù)是通過設計調研方案,明確調研的目的、調研對象、調研內容,采用科學的調研方法,比如普查、重點調查、典型調查、抽樣調查等調查方式搜集原始數(shù)據(jù)。將數(shù)據(jù)搜集完后,進行統(tǒng)計整理。大數(shù)據(jù)是利用軟件先進行數(shù)據(jù)文件的建立和管理,然后進行數(shù)據(jù)的預處理,數(shù)據(jù)的預處理包括定義數(shù)據(jù)的結構,數(shù)據(jù)的錄入和編輯,數(shù)據(jù)的保存,數(shù)據(jù)的排序,篩選重復個案,變量的計算,數(shù)據(jù)的選取,數(shù)據(jù)的計數(shù),數(shù)據(jù)的分類匯總,數(shù)據(jù)的分組等。
3.關于數(shù)據(jù)來源的區(qū)別
傳統(tǒng)統(tǒng)計學中的數(shù)據(jù)無論是直接調查獲取的一手數(shù)據(jù)還是借用經整理后的二手數(shù)據(jù),共同的來源都是實地調查,區(qū)別僅僅是調查主體是否為數(shù)據(jù)需求者。由此很容易對數(shù)據(jù)進行事前安排、事中控制以及事后核對。如果大部分數(shù)據(jù)來源于網絡,就無法做到事前安排,也很難做到事中控制,且數(shù)據(jù)很多時候是發(fā)散的,更不可能進行事后核對。大數(shù)據(jù)是數(shù)據(jù)的“抽取—轉換—加載”,這就是所謂的數(shù)據(jù)處理三部曲。該環(huán)節(jié)需要將來源不同、類型不同的數(shù)據(jù)如關系數(shù)據(jù)、平面數(shù)據(jù)文件等抽取出來,然后進行清潔、轉換、集成,最后加載到數(shù)據(jù)倉庫或數(shù)據(jù)集市中,成為聯(lián)機分析處理、數(shù)據(jù)挖掘的基礎。
4.關于量化方式的區(qū)別
傳統(tǒng)統(tǒng)計中的數(shù)據(jù)是結構化的數(shù)據(jù),且量化方法日漸成熟。而大數(shù)據(jù)多為半結構化、非結構化數(shù)據(jù),對其進行量化還存在技術瓶頸。目前,將半結構化及非結構化數(shù)據(jù)進行量化或者轉化為結構化數(shù)據(jù)是一個非常重要的研究領域。
5.關于分析思維的區(qū)別
傳統(tǒng)統(tǒng)計學中的數(shù)據(jù)分析思路為定性到定量再到定性,而大數(shù)據(jù)分析思路是從定量到定性。前者主要運用歸納法,這一方法依然是大數(shù)據(jù)分析的主要方法,后者仍然要通過個體的特征歸納出總體的特征。但對異常值的分析和研究往往更具深意,運用的是演繹法獲取更細小的特征。
統(tǒng)計分析與SPSS應用課程是面向經濟管理類專業(yè)的本科生開設的一門專業(yè)基礎課。通過學習該課程,學生可以了解搜集、整理資料的過程及方法,能熟練運用SPSS,提高統(tǒng)計應用技能,形成一定的分析問題解決問題的能力。就目前的教學狀況看,針對非統(tǒng)計專業(yè)開設統(tǒng)計學及相關課程教學時,應在教學內容、授課方式、教學手段和教材選用等方面進行改革。
課程案例應緊跟時代步伐,貼近時代熱點。采用實時案例分析,更容易增加學生的學習研究興趣。比如近兩年的熱點問題:“為什么高考狀元,最后都很平庸?”“我讀了清北,以后可以進投行嗎?”“為什么學區(qū)房那么值錢,但學歷不值錢?””比如,你說吸煙有害健康,勸身邊人戒煙。煙民們常用的借口是這樣的:你看隔壁王大爺,都九十歲了,抽煙抽了一輩子,照樣健健康康的。張二蛋,煙酒不沾,三十歲就歸了西。所以呀,抽煙有害健康,都是騙人的!”“比如,有人跟蹤過每年的高考狀元后來的職業(yè)發(fā)展路徑,最終發(fā)現(xiàn)這些狀元,絕大多數(shù)并沒有成為人中龍鳳,國之棟梁,于是他們得出結論:高考狀元最終將走向平庸,高考對篩選人才并沒什么用”。以上的例子,統(tǒng)統(tǒng)犯了小樣本偏差的統(tǒng)計錯誤。換句話說,考察的樣本太少,根本不可能得出可靠的結論。統(tǒng)計推斷,樣本量越大,越可靠?;谛颖镜慕Y論,往往都存在問題。樣本概念是統(tǒng)計分析與SPSS 應用課程中的抽樣推斷的內容。傳統(tǒng)的抽樣分析大多是靜態(tài)分析,大數(shù)據(jù)背景下的樣本概念應多參考靜態(tài)數(shù)據(jù)與動態(tài)數(shù)據(jù)結合分析。比如不少反雞湯人士認為,努力沒什么用,家庭出身決定一切,先天條件決定一切,時代大勢決定一切,同學們認為呢?名校畢業(yè)掙錢不多,名校畢業(yè)照樣買不起學區(qū)房,很多人據(jù)此得出結論:名校也沒什么卵用,甚至上大學也沒什么用,照樣買不起房,還不如王小二開個煎餅攤子掙得多。這個案例所犯的錯誤就是統(tǒng)計里的控制變量的問題。什么是控制變量?控制變量的意思是,控制了這個因素,來看其他因素對事物發(fā)生的影響。最直觀的表達就是“假設其他條件不變的情況下”,這種假設,就是很典型的一種控制變量的假設??疾靻我蛔兞繉Y果的影響時,一定要保持控制變量的不變且可比。不然這樣比較得出的結論,毫無意義。比如暴飲暴食跟胃痛是什么關系?名校畢業(yè)跟賺很多錢是什么關系?兩種關系有何不同?事情的發(fā)生,往往都是一個復雜系統(tǒng)里,多因素共同作用的結果,凡事都盡量避免用單因素模型去解釋。這里涉及的實際就是統(tǒng)計分析課程里的多因素分析模型,即相關分析與回歸分析的內容。把統(tǒng)計分析課程中的理論知識點應用到生活實踐中,讓學生能夠運用統(tǒng)計的思維和觀點去分析問題理解問題,這應該是該課程的一個實踐目標。
經典統(tǒng)計分析與SPSS 應用課程內容涵蓋最基本的描述性統(tǒng)計,少量涉及數(shù)據(jù)分析實踐中必需的推斷統(tǒng)計。在統(tǒng)計調查方法這一章內容里,應突出強調統(tǒng)計調查方案的設計。由于統(tǒng)計調研的對象是復雜經濟體,搜集的數(shù)據(jù)也涵蓋多個方面。要收集到相對完整準確的數(shù)據(jù),就必須對統(tǒng)計調查工作設計一個方案。方案的具體內容可以包括調研目的的確定、調研對象的確定、調研內容的確定、調研方法的確定、調研時間及期限的安排、調研人員的安排等等細節(jié)問題。在調研數(shù)據(jù)的方法選擇上,也應該提醒學生注意結合多種調研方法,不能只單純的讓學生理解有哪些調研方法就可以了。所以,教學上,應避免紙上談兵,可以根據(jù)實時熱點給出一些題目,讓學生實踐。在統(tǒng)計整理這部分,學生掌握最多的是給定分組標志,從進行統(tǒng)計分組,繪制直方圖和折線圖、條形圖、餅圖等。但不以應用為導向的學習必然無法根據(jù)項目的研究任務和研究目標自主選取恰當?shù)臉酥?,從而挖掘有價值的信息。應給定學生研究課題,讓學生根據(jù)課題的主題自行確定具體研究內容,并根據(jù)具體內容量化成具體的問題并設計調研問卷搜集數(shù)據(jù)。在統(tǒng)計分析部分,應重點突出SPSS 軟件的描述統(tǒng)計分析的使用,假設檢驗方法的使用,相關分析回歸分析的使用,讓學生根據(jù)軟件操作結果進行統(tǒng)計分析。
要改變傳統(tǒng)的“教師講、學生聽”的授課方式,根據(jù)內容設計相應的案例,同時考慮多讓學生動手操作SPSS,提高學生的軟件操作能力,多采用互動教學。盡可能的采用應用型的教材。
基于此,相關單位可從多種教材中博采眾長,汲取精華,適時編寫適用于應用型本科非統(tǒng)計專業(yè)使用的教材。此外,在提高學生對新知識的求知欲,保證他們學會經典統(tǒng)計方法的同時,要根據(jù)大數(shù)據(jù)發(fā)展的最新形勢,運用恰當?shù)姆椒ㄋ鸭?、整理、分析?shù)據(jù)。
統(tǒng)計分析與SPSS 應用課程考核方式是卷面閉卷考核,主要考察學生的理論知識的掌握情況。對于應用型高校,應側重從實踐角度出發(fā)培養(yǎng)學生的SPSS 軟件操作能力,同時能夠利用軟件進行統(tǒng)計分析。期末考核方式可以可由傳統(tǒng)的試卷考試變?yōu)樽珜懡y(tǒng)計分析報告的方式。撰寫統(tǒng)計分析報告,一方面可以考查學生的理論知識的運用情況,尤其是統(tǒng)計指標的計算及分析問題;另一方面,也考查了學生應用SPSS 軟件進行數(shù)據(jù)操作的能力問題。