夏 艷,張麗娟
(廣州華商學院,廣東 廣州 511399)
大學英語等級考試一直以來都是高校學生參與度最高的全國性考試,其考試成績不僅反映了學生的英語學習能力,其證書也是高校畢業(yè)生求職應聘中所必備的。
評估高校各專業(yè)整體英語應試水平,對于高校管理層在專業(yè)層面上提出相關英語教學改革措施極為重要。Bootstrap 與Jackknife 是抽樣調(diào)查中常用的重采樣方法,Jackknife 是由Quenouille[1,2](1949/1956)作為減少系列相關系數(shù)估計量偏倚的一種方法提出的,后來逐漸成為復雜樣本方差估計的一種重要方法。Bootstrap 是由B.Efron[3](1979)在Jackknife 的基礎上提出的一種利用重抽樣方法對總體參數(shù)進行估計的統(tǒng)計方法。呂萍[4](2017)指出在數(shù)據(jù)分析中,若忽視層、群等抽樣設計的復雜性,直接利用調(diào)查數(shù)據(jù)按照傳統(tǒng)數(shù)據(jù)分析方法,容易得出錯誤的結論,尤其是涉及標準誤的估計。Bootstrap 方法的優(yōu)勢在于對小樣本進行評估時,可極大地降低評估樣本不足對評估結果的影響[5]。該方法也在估計中存在些許不足,主要體現(xiàn)在重抽樣都是在已知的樣本觀測數(shù)據(jù)中進行的,這使得自主樣本與原樣本的相似度較高,并且樣本量越小,其相似度就越高,估計結果與真實分布的差異性也會越大[6]。Jackknife 方法在方差分量估計和標準誤估計上都較為準確,且其估計的準確性不隨數(shù)據(jù)類型、研究設計和方差分量的不同而產(chǎn)生波動,具有較強的穩(wěn)健性[7]。Jackknife 方法不足之處主要體現(xiàn)在:估計總體統(tǒng)計量時只利用了很少的信息,各采樣樣本之間的差異很小,每兩個Jackknife 樣本中只有兩個單一的觀測值不同。本文在估計總體樣本均值的過程中,考慮到Jackknife 算法與Bootstrap 算法存在的不足,提出Bootstrap-Jackknife 算法,得到了更接近于總體樣本均值的估計值。
本文采集廣州華商學院各專業(yè)學生在2017 學年的四級成績數(shù)據(jù),共計9860 條有效數(shù)據(jù),并對收集的數(shù)據(jù)進行對數(shù)化處理,數(shù)據(jù)對數(shù)化可以使得樣本數(shù)據(jù)更加光滑,消除異方差,同時減小數(shù)據(jù)波動范圍。
將采集得到的觀測樣本x1,…,xn當做總體樣本的近似,通過觀測樣本得到各樣本統(tǒng)計量值以估計總體統(tǒng)計量,其中總體標準差的無偏估計如式⑴:
Bootstrap 是一種著名的方差估計方法,其思想是通過重復抽樣來估計總體分布。具體來說就是將得到的樣本Fn(x)當做總體F(x)的近似是θ的一個估計,通過從得到的樣本中重復有放回抽樣生成經(jīng)驗累積分布函數(shù)(x),對生成的(x)樣本進行相應計算得到,利用一系列實現(xiàn)的置信區(qū)間評定。具體步驟如下:
⑴從觀測樣本x1,…,xn中有放回地抽樣生成樣本
⑵對第b個Bootstrap 樣本計算估計值(b),這里b的范圍為1-2000,本文為了使全部的數(shù)據(jù)盡可能被采集,使得總體統(tǒng)計量的估計結果更為穩(wěn)健,規(guī)定抽樣次數(shù)B=2000;
Jackknife 可用于總體估計量的不確定估計,旨在減少估計的偏差。其思想為“去一”抽樣,假設獲取樣本樣本量為n,在第i次抽樣中去除第i個樣本數(shù)據(jù)i=(1,2,...,n),用剩下的(n-1)個數(shù)據(jù)作為抽樣樣本計算,分別對生成的n個樣本計算相應的樣本統(tǒng)計量,如此得到,從而實現(xiàn)總體統(tǒng)計量的置信區(qū)間估計。具體步驟如下:
⑴ 從觀測樣本x1,…,xn中做i次Jackknife 抽樣,生成第i個Jackknife樣本(x1,…,xi-1,xi+1,…,xn);
⑵對n個Jackknife樣本計算估計值
⑶當利用Jackknife對θ進行標準差估計時,如式⑶:
在實際應用中,Bootstrap 對估計量的相關估計值具有隨機性,即每一次運用Bootstrap 算法抽樣得到的估計值并不相同,而使用Jackknife 對統(tǒng)計量進行估計時,各采樣的樣本之間的差異太小。本文考慮到Bootstrap 與Jackknife 的不足之處,結合兩種算法,創(chuàng)新性地進行相關方差估計。采用Bootstrap 選取多組樣本,隨后采用Jackknife 對每組樣本分別進行均值與標準差的估計,結合實際訓練數(shù)據(jù)發(fā)現(xiàn)該方法得到的估計值穩(wěn)健度更高。本文實現(xiàn)Bootstrap-Jackknife 的具體步驟如下:
⑴ 對于觀測樣本x1,…,xn,進 行B=2000 次Bootstrap抽樣,每次抽樣n個樣本;
⑵假設i=1:n,每次選取上一步所有Bootstrap樣本中不含有xi的樣本,并重新計算θj(i);
⑶對第j個Bootstrap 樣本生成的所有θj(i)計算相關估計值與標準差,標準差如式⑷:
分別采用Normal、Bootstrap、Jackknife、Bootstrap-Jackknife 方法,對實際樣本數(shù)據(jù)進行均值估計,實際訓練樣本為該校各專業(yè)學生在2017 學年的四級成績對數(shù)。估計結果對比情況如圖1所示。
圖1 四種方法估計在實際數(shù)據(jù)上的效果對比圖
由圖1數(shù)據(jù)可以看出:①對于Normal、Jackknife 與Bootstrap-Jackknife 這三種方法計算出的均值估計量僅有細微差異,而Bootstrap 得到的均值估計值與其他三種方法得到的均值估計值相差較大;②對于標準差估計,Bootstrap-Jackknife 估計得到的標準差要遠遠小于其他三種方法估計的標準差,這說明在對總體均值的估計中,Bootstrap-Jackknife 的估計誤差最小,即利用該方法得到的均值用來估計總體均值,其精度最高。另外Bootstrap與Jackknife的標準差估計值幾乎重合為一條折線且遠小于普通法的標準差估計值,這說明利用Bootstrap 與Jackknife 對估計量進行估計,其可信度要高于普通法得到的估計量值。
為了更明顯的顯示四種方法估計樣本均值的差異,本文將四種方法得到的樣本數(shù)據(jù)均值估計值進行排序,具體排序結果如表1所示(僅列舉部分)。
表1 四種方法估計的均值排序對比
為比較Bootstrap-Jackknife 方法與其他三種方法排序結果之間的差異,本文將各專業(yè)Bootstrap-Jackknife排序結果與其他三種方法得到的排序結果做差值處理,并進行絕對值運算,依據(jù)各差值結果繪制箱線圖,如圖2所示。
圖2 各專業(yè)排序差絕對值箱線圖
結合表1 排序數(shù)據(jù)與圖2 箱線圖可以看出:第一,Normal 與Bootstrap-Jackknife 在專業(yè)排序上的差異甚微,Bootstrap-Jackknife與Jackknife在專業(yè)排序上的差異最為顯著,這說明就均值估計而言,Jackknife估計的穩(wěn)定性并不高;第二,就排序數(shù)據(jù)上來看,該校英語四級應試能力前三的專業(yè)為英語、國際商務和會計學(ACCA 班),而英語四級應試能力較差的專業(yè)為環(huán)境設計、視覺傳達設計、產(chǎn)品設計這三個藝術專業(yè)。
本文基于廣州華商學院2017 學年各專業(yè)學生四級成績數(shù)據(jù),運用Normal、Bootstrap、Jackknife 和Bootstrap-Jackknife 四種方差估計方法分別評估該校各專業(yè)四級總體應試水平;對比估計結果發(fā)現(xiàn):Bootstrap-Jackknife 算法在估計總體均值方面上估計誤差最低,在涉及排序問題上,Jackknife算法的排序穩(wěn)定性最低。研究結果表明,Bootstrap-Jackknife算法可更精確、穩(wěn)定的評估高校各專業(yè)總體英語應試水平,從而為高校在專業(yè)層面上制定科學的英語學習方式和可操作的實施辦法[8]提供參考。