江忠偉,郭新穎
(1.中國(guó)人民銀行南通市中心支行,江蘇 南通 226007;2.中國(guó)聯(lián)合網(wǎng)絡(luò)通信有限公司南通市分公司,江蘇 南通 223000)
多元方差分析檢驗(yàn)過(guò)程中,最關(guān)鍵的一步是構(gòu)造合適的檢驗(yàn)統(tǒng)計(jì)量,然后結(jié)合顯著性水平,就可以構(gòu)建檢驗(yàn)法則。常用檢驗(yàn)統(tǒng)計(jì)量有:(1)威爾克斯檢驗(yàn)統(tǒng)計(jì)量。需先計(jì)算出組內(nèi)離差陣和組間離差陣,然后相加,再對(duì)相關(guān)矩陣進(jìn)行行列式計(jì)算,最后做比值計(jì)算[1-3];(2)霍特林跡檢驗(yàn)統(tǒng)計(jì)量(Hotelling's trace)。先計(jì)算出組間離差陣與組內(nèi)離差陣,然后計(jì)算出相對(duì)廣義特征值,最后將所有廣義特征值求和[4,5];(3)費(fèi)萊巴特萊特準(zhǔn)則檢驗(yàn)統(tǒng)計(jì)量(Pillai-Bartlett criterion)。該檢驗(yàn)統(tǒng)計(jì)量的構(gòu)造過(guò)程為:與霍特林跡檢驗(yàn)統(tǒng)計(jì)量的構(gòu)造過(guò)程類似,需要計(jì)算出組間離差陣與組內(nèi)離差陣,然后計(jì)算廣義特征值,再以廣義特征值為分子,1加上該廣義特征值作為分母,對(duì)所有的特征值都做這樣的變換[6-8];(4)羅伊最大特征值檢驗(yàn)統(tǒng)計(jì)量(Roy's Largest Root)。先計(jì)算出組間離差陣與組內(nèi)離差陣,然后計(jì)算廣義特征值,挑選最大廣義特征值,以最大廣義特征值為分子,以最大廣義特征值加一為分母[9,10]。
如何評(píng)價(jià)這些檢驗(yàn)統(tǒng)計(jì)量的檢驗(yàn)效果?首先需要明確一個(gè)衡量標(biāo)準(zhǔn)。比如:有些研究者將將拒絕原假設(shè)的能力設(shè)為衡量標(biāo)準(zhǔn),拒絕原假設(shè)的能力越強(qiáng),則認(rèn)為檢驗(yàn)效果越好。利用控制變量法對(duì)上述4個(gè)檢驗(yàn)統(tǒng)計(jì)量的檢驗(yàn)效果比較發(fā)現(xiàn):羅伊最大特征值檢驗(yàn)統(tǒng)計(jì)量檢驗(yàn)效果最好[11]。還有些研究者將檢驗(yàn)統(tǒng)計(jì)量的穩(wěn)健性作為衡量標(biāo)準(zhǔn),穩(wěn)健性越高則檢驗(yàn)效率越高。通過(guò)試驗(yàn)比較發(fā)現(xiàn):通常,費(fèi)萊巴特萊特準(zhǔn)則檢驗(yàn)統(tǒng)計(jì)量檢驗(yàn)效果最好。
經(jīng)過(guò)適當(dāng)?shù)臄?shù)學(xué)變形,可以證明這些檢驗(yàn)統(tǒng)計(jì)量都服從分布。那么,是否可以直接對(duì)原始數(shù)據(jù)做變換,然后基于變換后的數(shù)據(jù)直接構(gòu)造檢驗(yàn)統(tǒng)計(jì)量進(jìn)行分析。顯然,如果該方法可行,從便于理解的角度來(lái)看,該檢驗(yàn)方法優(yōu)于上述檢驗(yàn)方法。
選取一個(gè)行向量與原始數(shù)據(jù)進(jìn)行線性組合,這樣就將多維數(shù)據(jù)降為一維數(shù)據(jù),證明變換后的數(shù)據(jù)仍然服從正態(tài)分布,嘗試先對(duì)數(shù)據(jù)進(jìn)行變換,再構(gòu)建檢驗(yàn)統(tǒng)計(jì)量進(jìn)行分析。兩因素多元方差分析模型可以設(shè)為:A和B是影響實(shí)驗(yàn)結(jié)果的兩個(gè)因素,因素A有k個(gè)水平,因素B有r個(gè)水平。即:
αi表示因素A的第i水平的影響,βj表示因素B的第j水平的影響。這時(shí)判斷因素對(duì)實(shí)驗(yàn)指標(biāo)有無(wú)顯著影響,就相當(dāng)于檢驗(yàn):
設(shè)有p維非零行向量將其與yij相乘,則有:
檢驗(yàn)問(wèn)題就轉(zhuǎn)換為檢驗(yàn):
這樣就將兩因素多元方差分析問(wèn)題轉(zhuǎn)化為兩因素一元方差分析。對(duì)A因素而言,如果能夠找到l′1使得因素A各個(gè)水平之間的差異最小化,然后將原始樣本數(shù)據(jù)向該法線方向投影,再由投影后的數(shù)據(jù)計(jì)算出F檢驗(yàn)統(tǒng)計(jì)量的具體取值,若該值落入拒絕域中,則利用任一法線向量進(jìn)行投影,帶入具體數(shù)據(jù),計(jì)算出對(duì)應(yīng)的檢驗(yàn)統(tǒng)計(jì)量的值,都會(huì)落入拒絕域中,故恒拒絕原假設(shè);反之,不拒絕原假設(shè)。類似的,對(duì)因素B而言,如果能夠找到l′2使得因素B各個(gè)水平之間的差異最小化,然后對(duì)數(shù)據(jù)進(jìn)行投影,再由投影后的數(shù)據(jù)計(jì)算出F檢驗(yàn)統(tǒng)計(jì)量的具體取值,若該值落入拒絕域中,則利用任一法線向量進(jìn)行投影,帶入具體數(shù)據(jù),計(jì)算出對(duì)應(yīng)的檢驗(yàn)統(tǒng)計(jì)量的值,都會(huì)落入拒絕域中,故恒拒絕原假設(shè);反之,不拒絕原假設(shè)(見(jiàn)圖1)。
圖1 檢驗(yàn)流程圖
由上文的分析知:原假設(shè)H01成立時(shí),F(xiàn)1=與一般的服從F分布的統(tǒng)計(jì)量不同,F(xiàn)1中含有一個(gè)未知行向量l′。若F1min落入拒絕域中,則有充分理由拒絕原假設(shè)。具體過(guò)程如下:
由矩陣的譜分解知:
故:
顯著性水平為α且服從分布的臨近值為(下分為數(shù))。故檢驗(yàn)法則為:當(dāng)時(shí),拒絕原假設(shè),因素A對(duì)數(shù)據(jù)有顯著影響;若不拒絕原假設(shè),繼續(xù)保持對(duì)原假設(shè)的懷疑。
原假設(shè)H02成立時(shí)類似的,可以求解出B相對(duì)于E的廣義特征值及廣義特征值對(duì)應(yīng)的特征向量可以將改F2寫成:
顯著性水平為α且服從分布的臨近值為(下分為數(shù))。故檢驗(yàn)法則為:當(dāng)時(shí),拒絕原假設(shè),因素B對(duì)數(shù)據(jù)有顯著影響;若則不拒絕原假設(shè)。
可以利用R產(chǎn)生隨機(jī)數(shù)組進(jìn)行模擬研究來(lái)驗(yàn)證上述檢驗(yàn)法則。為了簡(jiǎn)化模擬過(guò)程,以單因素多元方差分析為例。模擬研究分兩步進(jìn)行:
第一步:隨機(jī)生成9組樣本量為20的5維協(xié)差陣相同均值向量不相同的數(shù)組,驗(yàn)證利用上述檢驗(yàn)法則檢驗(yàn)的結(jié)果是否為拒絕原假設(shè)。第一組數(shù)據(jù)見(jiàn)表1。
表1 協(xié)差陣相同均值向量不相同的第一個(gè)數(shù)組的5維向量樣品
利用計(jì)算機(jī)軟件可以算出水平間離差陣相對(duì)于隨機(jī)誤差陣的最小廣義特征值的具體數(shù)值為:
故:
對(duì)應(yīng)的p值為:
p值非常小,有充分理由拒絕原假設(shè)。
第二步:隨機(jī)生成9組樣本量為20協(xié)差陣相同均值向量相同的5維數(shù)據(jù),驗(yàn)證利用上述檢驗(yàn)法則檢驗(yàn)的結(jié)果是否為不拒絕原假設(shè)。第一組數(shù)據(jù)見(jiàn)下頁(yè)表2。
利用計(jì)算機(jī)軟件可以算出水平間離差陣相對(duì)于隨機(jī)誤差陣的最小廣義特征值的具體數(shù)值為:
故:
對(duì)應(yīng)的p值為:
p值很大,不拒絕原假設(shè)。
表2 協(xié)差陣相同均值向量相同的第一個(gè)數(shù)組的5維向量樣品
由模擬結(jié)果可知,利用上述檢驗(yàn)法則進(jìn)行多元方差分析可以得到與事實(shí)相符合的結(jié)果。當(dāng)各個(gè)水平對(duì)應(yīng)的均值向量不同,利用該檢驗(yàn)法則進(jìn)行檢驗(yàn),檢驗(yàn)結(jié)果為拒絕原假設(shè);若各個(gè)水平對(duì)應(yīng)的均值向量不存在差異,該檢驗(yàn)法則的檢驗(yàn)結(jié)果為繼續(xù)保持對(duì)原假設(shè)的懷疑。
在上述檢驗(yàn)過(guò)程中,若向使得水平間差異最小化方向投影后的數(shù)據(jù)計(jì)算檢驗(yàn)統(tǒng)計(jì)量的具體取值落到接受域中時(shí),有可能存在某一法線使得投影后的數(shù)據(jù)計(jì)算出的檢驗(yàn)統(tǒng)計(jì)量的取值落入拒絕域中,這時(shí)需繼續(xù)保持對(duì)原假設(shè)的懷疑,即沒(méi)有得到明確的判斷結(jié)果。如何有效克服這個(gè)問(wèn)題,將是下一步的研究方向。Large[J].Hiroshima Mathematical Journal,2014,44(3).