李明泉
(三峽數學研究中心三峽大學理學院,湖北 宜昌 443002)
在講數理統(tǒng)計之前,首先要向學生闡明數理統(tǒng)計學的基本特點,數理統(tǒng)計學是應用性極強的一門應用類基礎課程,她是一門關于數據收集、整理和分析的科學,它研究的對象主要是來源于各個部門的數據,其目的是通過大量統(tǒng)計數據揭示事物的本質。其次要告訴學生數理統(tǒng)計是作為概率論的一個重要應用提出來的,在概率論中所討論的問題都是這樣一些問題:已知一個隨機變量的概率分布,要去研究相應的隨機現象,例如,要計算隨機變量落入某個區(qū)間內的概率,要計算隨機變量的期望、方差、協(xié)方差、相關系數和矩等等,也就是說在概率論中,一個隨機變量所服從的概率分布往往是已知的,在這個前提條件下要去研究這個隨機變量所表征的隨機現象。然而在數理統(tǒng)計中情況卻有很大的不同,在數理統(tǒng)計中,一個隨機變量所服從的概率分布往往是未知的或雖然知道它的分布形式,但其中的參數未知,例如,隨機變量X服從正態(tài)分布N(,2),但是和2未知,因此這個分布還是不完全知道,數理統(tǒng)計的主要任務就是要根據抽樣的結果即樣本去推斷分布的形式或估計分布當中的未知參數,由此可見數理統(tǒng)計與概率論所討論的問題有很大的不同。建立在概率論基礎上的數理統(tǒng)計學其分支也很多,但大體上可分為兩類,一類是試驗設計,試驗設計屬于抽樣的問題,它是指如何安排隨機試驗,才能使獲得的數據資料更合理、更有效和更具有代表性,試驗設計一般的教材都不講這個問題,有專門的教材講這個問題,再一類就是統(tǒng)計推斷,它是指如何利用所獲得的數據資料即隨機樣本,對我們所關心的問題(如參數、分布……)作出種種合理的估計和推斷,數理統(tǒng)計主要講統(tǒng)計推斷。
總體是首先要講的第一個基本概念,通俗的可以這樣來說,人們通常把要研究對象的全體稱為總體,而把組成總體的每一個基本單位成為個體,例如,全國人所組成的總體,而其中每一個中國人就是一個個體,再如,一麻袋稻種所構成的總體,其中每一粒稻種就是一個個體??傮w和個體從通俗的角度來看是很容易理解的,但是在實際應用中,人們對總體的研究往往是很具體的而不是抽象的,例如,研究全國人這個總體,你研究全國人這個總體研究它的什么東西?是研究全國人的身高還是體重?這里面得有一個具體的數量指標!其實在實際應用中,人們對總體的研究往往都是研究總體的某一個或某幾個數量指標,例如,我們要研究一家工廠生產的液晶顯示器的使用壽命,這個時候就把這個廠生產的全部液晶顯示器的使用壽命看作是一個總體,而把其中每一個液晶顯示器的使用壽命看作是一個個體,也就是說,這個時候總體就是一大堆數據,而其中每一個數據就是一個個體。其實在實際應用中,總體就是指一大堆數據,而其中每一個數據就是一個個體,由于這一大堆數據具有統(tǒng)計規(guī)律性或者說服從一定的概率分布,比如,其中有80%的液晶顯示器的使用壽命超過了2萬個小時,這就是統(tǒng)計規(guī)律性,對此加以引申得到數理統(tǒng)計中總體的含義。在數理統(tǒng)計中,所謂總體就是指一個隨機變量或一個概率分布,對上述例子來說這個隨機變量就是指液晶顯示器的使用壽命,這里需要向學生強調的是總體的這個含義只是引申出來的,并不是總體的本意,從本質上來講,總體就是指一大堆數據,其中每一個數據就是一個個體,而且還要告訴學生總體與集合是有區(qū)別的,集合里面不允許有相同的元素,而總體里面卻允許有相同的元素,為了是使學生完全、真正理解總體的引申意義,筆還舉了這樣一個例子,例如,檢驗自生產線出來的零件是正品還是次品,以0表示產品是正品,以1表示產品是次品。設出現次品的概率為p,則總體就是由一些1和一些0所組成的,X表示從中任取一個數,則P{X=1}=p,P{X=0}=1-p,這個分布就是(0-1)分布,從由很多0和1所構成的這樣一個總體中,我們得到了一個隨機變量X,還得到了一個概率分布(0-1)分布,所以總體又叫一個隨機變量,總體又叫一個概率分布。
因為樣本來源于總體,所以樣本當中肯定包含有總體的有關信息,數理統(tǒng)計的主要任務就是根據樣本提供的信息去推斷總體的有關性質,因此,樣本是進行統(tǒng)計推斷的主要依據,但是通常并不是直接根據樣本去推斷總體的性質,直接推斷不好推斷,為什么呢?因為樣本就是一組數,它是雜亂無章,例如,我們要研究某高校男生的身高,于是就從男生當中隨機地抽取了n個男生出來,他們的身高記為X1,X2,…,Xn,這就是一個樣本,根據這個樣本能夠看出什么問題出來?關于男生的身高能夠做出什么樣的評價呢?這是看不出太大的問題出來的!要能看出問題出來,需要對這些數據進行加工,進行處理,進行分析,比如,可計算這些數據的平均值,根據這個平均值就能夠看出一些問題出來!事實上,我們能夠根據這個平均值來大體上估計該高校所有男生的平均身高,所以在數理統(tǒng)計當中,并不是直接根據樣本去推斷總體的某些性質,而是需要把樣本所包含的總體有關信息集中起來加工成樣本的某種函數,然后利用這種函數去推斷總體的有關性質的,像這種由樣本所構成的函數就稱之為統(tǒng)計量。設X1,X2,…,Xn,是來自于總體X的一個樣本,g(X1,X2,…,Xn)是關于樣本X1,X2,…,Xn的一個函數,一般要求還是一個連續(xù)函數,并且不含任何未知參數,稱g(X1,X2,…,Xn)為統(tǒng)計量,當樣本,X1,X2,…,Xn,得到一組觀察值x1,x2,…,xn,就稱為統(tǒng)計量g(X1,X2,…,Xn)的觀察值。在數理統(tǒng)計中,統(tǒng)計量是進行統(tǒng)計推斷的主要手段。這里需要向學生強調的是統(tǒng)計量g(X1,X2,…,Xn)是完全已知的一個函數,不能包含任何未知的東西,例如,是統(tǒng)計量,而(其中未知)則不是統(tǒng)計量。下面這幾個統(tǒng)計量是很常用的,需要學生記得?。簶颖揪?,樣本方差,樣本標準差,樣本k階(原點)矩,,當k=1時,,由此可見樣本k階矩將樣本均值這個概念加以推廣了,樣本k階中心矩(k=2,3,…)。
在講好上述三個統(tǒng)計學的基本概念的同時,筆者在課堂上還融入了一些思政元素,數理統(tǒng)計是通過樣本去推斷總體的有關信息和規(guī)律,這其實是用了“管中窺豹,可見一斑”的思想,通過事物的一部分而推測全體,起到事半功倍的作用,這同時也反映了從點到面,從局部到整體的辯證關系,據此,將學生的三觀與社會主義核心價值觀完美地結合起來。數理統(tǒng)計需要做統(tǒng)計調查以便搜集統(tǒng)計數據,我融入毛主席的“沒有調查就沒有發(fā)言權”的名言,教導學生要實事求是,不能隨意地篡改數據,要誠實守信,在以后的工作中要遵守職業(yè)道德,培養(yǎng)學生嚴謹的做事做人的風格。還通過《資本論》解讀了數據對于論證觀點的重要性,在教學中,還介紹了中國學者在統(tǒng)計學方面的成就和影響,比如,數學家許寶騄,他在我國開創(chuàng)了概率論和數理統(tǒng)計的教學與科研工作,是多元統(tǒng)計分析的最早的開拓者之一,也是我國概率論和數理統(tǒng)計領域最主要奠基人之一。通過這些名人的事跡激發(fā)學生的愛國熱情和學習積極性,增強民族自信心,為實現中華民族的偉大復興而努力學習,既可以圓中國夢,也可以實現個人的夢想。
講清、講透總體、樣本和統(tǒng)計量這三個基本概念是學生學好數理統(tǒng)計學的基礎,在教學中,筆者采取上述講法取得了很好的教學效果。