張 靈 徐章韜
(華中師范大學(xué)數(shù)學(xué)與統(tǒng)計學(xué)學(xué)院 430079)
數(shù)學(xué)家華羅庚指出“據(jù)我看來,要真正打好基礎(chǔ),有兩個必經(jīng)的過程,即‘由薄到厚’和‘由厚到薄’的過程,‘由薄到厚’是學(xué)習(xí)、接受的過程,‘由厚到薄’是消化、提煉的過程”.“把書讀厚”是“把書讀薄”的前提,在教學(xué)中,中學(xué)數(shù)學(xué)教師應(yīng)在自身已經(jīng)理解數(shù)學(xué)的基礎(chǔ)上,引導(dǎo)學(xué)生通過理性思考深入挖掘數(shù)學(xué)知識本質(zhì)、知識背后蘊(yùn)含的思想以及知識之間的內(nèi)在聯(lián)系,把書讀厚,而不能只停留在對知識的邏輯意義上的認(rèn)可.教師的教學(xué)能力,首當(dāng)其沖體現(xiàn)在對教學(xué)內(nèi)容的把握上,若教師自身不具備“理解數(shù)學(xué)”的能力,教學(xué)過程必然表面化,無法對知識進(jìn)行深入剖析、展開,那么數(shù)學(xué)家華羅庚提出的兩個必經(jīng)過程都不可能會發(fā)生.章建躍老師提出“理解數(shù)學(xué)是教好數(shù)學(xué)的前提”[1],指出了“理解數(shù)學(xué)”的重要性.
在中學(xué)所要教學(xué)的概率與統(tǒng)計中,“利用樣本估計總體”是統(tǒng)計的核心思想,樣本的代表性取決于所采取的抽樣方法.中學(xué)階段主要學(xué)習(xí)了三種抽樣方法:簡單隨機(jī)抽樣、系統(tǒng)抽樣和分層抽樣,本文是對這三種抽樣方法的一個深入研究.
簡單隨機(jī)抽樣方法是一種最容易理解的、最簡單的抽樣方法,沒有復(fù)雜的抽樣程序,當(dāng)抽樣框——抽樣總體組成的集合確定的情況下,可直接抽取樣本,如人們在日常生活中買水果時,想知道水果是否好吃,會選擇從所有的水果中隨機(jī)挑出一個,嘗一嘗來進(jìn)行判斷,這是一種非常自然的想法.簡單隨機(jī)抽樣體現(xiàn)了“利用樣本估計總體”最樸素的思想——樣本來源于總體,若要獲得所需樣本,最簡單的方法便是從總體中直接進(jìn)行抽樣.
當(dāng)各個單元在總體中的地位相同時,各單元被抽到的機(jī)會相同是樣本具有較好代表性的前提.簡單隨機(jī)抽樣的定義為“一般地,設(shè)一個總體含有N個單元,從中逐個不放回地抽取n個單元作為樣本,如果每次抽取時總體內(nèi)的各個單元被抽到的機(jī)會都相等,就把這種抽樣方法叫做簡單隨機(jī)抽樣”[2].在簡單隨機(jī)抽樣中,可用條件概率的知識來解釋每個單元被抽到的概率是相等的.
簡單隨機(jī)抽樣的本質(zhì)是一種隨機(jī)現(xiàn)象,是系統(tǒng)抽樣和分層抽樣的基礎(chǔ).事實(shí)上,系統(tǒng)抽樣和分層抽樣都可看作是在進(jìn)行簡單隨機(jī)抽樣前多了一些不影響單元等概率性的前期處理工作:系統(tǒng)抽樣是在進(jìn)行簡單隨機(jī)抽樣前,根據(jù)初始單元和抽樣間距將總體分為了若干個地位相同的群;分層抽樣是在進(jìn)行簡單隨機(jī)抽樣之前,按相關(guān)標(biāo)志值將總體劃分為了若干個層.簡單隨機(jī)抽樣的隨機(jī)性是系統(tǒng)抽樣、分層抽樣隨機(jī)性的前提,它給人們提供了一個討論概率抽樣方法自然的出發(fā)點(diǎn).
在詞典里,“系統(tǒng)”指由若干相互聯(lián)系、相互作用的要素所組成的、具有一定結(jié)構(gòu)和功能的有機(jī)整體.在系統(tǒng)抽樣中,起始單元確定了,再根據(jù)已經(jīng)確定的抽樣間距,便能得到其余的樣本單元,整個樣本也就確定了.這里的樣本便可看作由起始單元和抽樣間距確定的一個有機(jī)整體——“系統(tǒng)”,其結(jié)構(gòu)表現(xiàn)為各單元在總體排列上的間距一定.這就像等差數(shù)列一樣,首項(起點(diǎn))定了,公差(間隔)定了,整個數(shù)列也就確定了.由于樣本的結(jié)構(gòu)一定,在系統(tǒng)抽樣中,當(dāng)總體單元排列順序確定時,一些單元不可能同時出現(xiàn)在樣本中,即排除了不符結(jié)構(gòu)的樣本組合.因此,與簡單隨機(jī)抽樣相比,系統(tǒng)抽樣抽取樣本的方式雖然更加簡便,且符合等概率性,但是其樣本的多樣性減弱了.另外,采用系統(tǒng)抽樣方法從總體中抽取樣本,系統(tǒng)抽樣的精度(樣本的多樣性,代表總體的程度)與總體單元的排列順序密切相關(guān).
若總體是由差異比較大的幾部分單元組成的,采用系統(tǒng)抽樣或隨機(jī)抽樣都有可能產(chǎn)生分布不均的樣本,這時,需要人為將總體分層,再按比例對每一層進(jìn)行隨機(jī)抽樣,即采用分層抽樣.中學(xué)數(shù)學(xué)介紹的是按比例分層抽樣,其步驟為:①利用輔助信息,將總體N個單元分為“不重不漏的”m個層;②按照各層單元數(shù)占總體單元數(shù)的比例分配每一層的樣本容量,樣本總量為n;③采用簡單隨機(jī)抽樣方法或系統(tǒng)抽樣方法,從各層獨(dú)立的抽取相應(yīng)樣本容量的單元;④將各層取出的單元合在一起作為樣本[6].當(dāng)各部分差異明顯時,采用分層抽樣方法能得到與總體結(jié)構(gòu)相近的樣本,其樣本的代表性要高于簡單隨機(jī)抽樣和系統(tǒng)抽樣.
在分層抽樣中,總體中差異明顯的每一部分都會在樣本中占有相應(yīng)比例的單元數(shù),保證了樣本在總體中的分布是相對均勻的,層樣本(各層所獲的那部分樣本)相對于所在層的代表性決定了最終樣本的代表性.因此,就分層抽樣而言,如何提高層樣本的代表性是關(guān)鍵,這就要回歸到簡單隨機(jī)抽樣的特點(diǎn).在簡單隨機(jī)抽樣中,各單元之間的差異越小,即總體在標(biāo)志值上的方差越小,各種可能的樣本組合之間的差異也會小,隨機(jī)抽取出的樣本在估計值上相對于總體的偏差會越小,反之,總體在標(biāo)志值上的方差越大,各種可能的樣本組合之間的差異也會越大,隨機(jī)抽出的樣本代表性差的可能性越高.因此,在分層抽樣中,為了提高層樣本的代表性,應(yīng)盡可能的利用輔助信息,擴(kuò)大層間方差,從而降低層內(nèi)方差,提高估計的精度.
合理的數(shù)學(xué)知識背后需要有思想的支撐,同樣地,學(xué)生在學(xué)習(xí)數(shù)學(xué)知識時,也需要相應(yīng)的數(shù)學(xué)思想作為支撐,站在思想的角度看待知識,認(rèn)清知識“來自何方”.三種抽樣方法都屬于隨機(jī)抽樣,掌握隨機(jī)抽樣的思想,為學(xué)生深層次地理解知識奠定基礎(chǔ).
首先,抽樣的目的是為了用樣本估計總體,抽樣方法往往只有“好與差之分”,而不是“對與錯之分”,評價抽樣方法的優(yōu)劣應(yīng)該以樣本的代表性為標(biāo)準(zhǔn);其次,樣本的代表性,要從抽樣規(guī)則來看,而不能以某一次的抽樣結(jié)果是否與總體一致論,在隨機(jī)抽樣中,樣本的產(chǎn)生是隨機(jī)的,合理的抽樣規(guī)則也可能產(chǎn)生歪曲的抽樣結(jié)果,這里所提到的“樣本的代表性”,是根據(jù)抽樣規(guī)則進(jìn)行理性分析后得出的理論結(jié)果;最后,為了使樣本具有代表性,抽樣規(guī)則應(yīng)客觀、公正,保證總體中每個單元被抽中的概率相等,不能人為的安排某些單元有更大的可能性被抽中,這樣的抽樣結(jié)果是不客觀的.
在三種抽樣方法中,何為“簡單”、何為“系統(tǒng)”、何為“分層”,是需要把握的要點(diǎn),要點(diǎn)往往是認(rèn)識知識本質(zhì)的關(guān)鍵所在.“簡單”說明了簡單隨機(jī)抽樣在三種抽樣方法中的基礎(chǔ)地位,“系統(tǒng)”指向系統(tǒng)抽樣所得的樣本是一個具有一定結(jié)構(gòu)的有機(jī)整體,“分層”表明所得樣本的結(jié)構(gòu)與總體一致,在總體中的分布是相對均勻的.這些要點(diǎn)揭示了三種抽樣方法的不同之處,以及各自的特點(diǎn),認(rèn)識了要點(diǎn)之后,還有助于對三種抽樣方法的精度進(jìn)行進(jìn)一步的分析、比較,明確影響樣本代表性的因素.
統(tǒng)計與概率關(guān)系密切,對抽樣方法的等概率性進(jìn)行理性分析需要用到概率知識.嚴(yán)謹(jǐn)、理性是數(shù)學(xué)學(xué)科的特點(diǎn),由于抽樣方法與實(shí)際生活關(guān)系密切,看似簡單、容易理解,教師教學(xué)時容易經(jīng)驗(yàn)至上,忽視對這部分知識進(jìn)行理性分析,這樣的做法不利于培養(yǎng)學(xué)生的理性精神,這樣的教學(xué)是不夠深入的.借助概率知識,通過邏輯分析和運(yùn)算過程,讓三種抽樣方法的“等概率性”變得有理有據(jù),促進(jìn)學(xué)生進(jìn)一步體會抽樣方法的科學(xué)、合理之處.