何 華
(蘇州大學(xué)教育學(xué)院,蘇州 215123)
SNARC效應(yīng)(spatial-numerical association of response codes effect,SNARC effect)本質(zhì)上反映的是數(shù)量具有空間表征,即,在人腦中存在一條心理數(shù)字線,小數(shù)(1,2,3,4)表征在左側(cè)空間,而大數(shù)(6,7,8,9)表征在右側(cè)空間(Dehaene,Bossini,& Giraux,1993)。其獲得的一個最為簡單的實驗流程為:“+”在屏幕中央呈現(xiàn)300ms,消失后隨機出現(xiàn)一個小數(shù)(或大數(shù))300ms,被試既快又準確地以雙手食指按鍵判斷該數(shù)是大于5還是小于5(刺激5不出現(xiàn)在屏幕上)。這個實驗用到的任務(wù)是數(shù)字大小判斷(當(dāng)然還存在其他種類的任務(wù)),實驗一般采用重復(fù)測量實驗設(shè)計,數(shù)據(jù)分析采用重復(fù)測量方差分析和線性回歸分析(Lorch &Myers,1990)。
線性回歸分析最終會得到一個一元一次線性回歸方程,該方程被用來描述SANRC效應(yīng)。SNARC效應(yīng)的線性回歸方程一般是指,反應(yīng)時差異(右側(cè)減左側(cè))在數(shù)字(1,2,3,4,6,7,8,9)上的線性回歸,并可以一般性的一元一次線性回歸模型描述:
DRT=β0+β1N+μ
(1)
其中,N為數(shù)字1、2、3、4、6、7、8、9,是預(yù)測變量;DRT是右側(cè)反應(yīng)時減去左側(cè)反應(yīng)時的差值。該線性模型中的回歸系數(shù)β1可以為正或負值,正負表明SNARC效應(yīng)的方向不同。SNARC效應(yīng)具有普遍性和跨文化性,西方研究者在以西方人為被試和以數(shù)字(1,2,3,4,6,7,8,9)為實驗材料時,均可穩(wěn)定獲得數(shù)字SNARC效應(yīng),在描述SNARC效應(yīng)的一元一次線性回歸方程中,回歸系數(shù)是負值。而在以希伯來語或波斯語為母語的被試身上,也可穩(wěn)定獲得數(shù)字SNARC效應(yīng),但方向則和西方人的相反,因此回歸系數(shù)是正值。SNARC效應(yīng)的效應(yīng)量大小就是該線性方程的回歸系數(shù)大小,或者為該線性方程的斜率的絕對值,與正負號無關(guān)。另外,對該方程要進行回歸方程的顯著性檢驗和回歸系數(shù)的顯著性檢驗,檢驗是欲以證實因變量確實是和自變量呈現(xiàn)線性關(guān)系。因為只有一個預(yù)測變量,所以這兩種檢驗結(jié)果是一致的。
查閱國內(nèi)外文獻發(fā)現(xiàn),需要比較SNARC效應(yīng)量大小的研究為數(shù)眾多,如,跨通道研究需要比較在單通道和跨通道條件下SNARC效應(yīng)量大小的改變,以此來判斷一個通道的數(shù)字加工是否影響到了另一個通道的數(shù)字加工;還有,不同空間維度(水平、垂直和矢量維度)的SNARC效應(yīng)比較,以此來判斷哪個維度下的SNARC效應(yīng)量可能是最大的;另外還有發(fā)展性的研究(如,小學(xué)生、初中生和大學(xué)生),等等。因為具體的研究內(nèi)容不同,這些研究中的SNARC效應(yīng)量的比較具有各自的具體意義。但是其中的共同之處在于,需要通過考察SNARC效應(yīng)量的改變來分析出某個自變量因素是否在其中起了作用。另外還有一個統(tǒng)計上的共同需求,就是如何采取合適有效的統(tǒng)計方法來進行比較分析。前述提到的研究中,需要比較的SANRC效應(yīng)量大小至少是兩組之間,這是最少的和最簡單的,當(dāng)然,也可能有四組甚至更多組之間,這種情形就比較復(fù)雜了??紤]到簡單和具有代表性,選取三組之間的SNARC效應(yīng)量進行比較分析,而且以Aleottia,Girolamob,Massaccesic和Priftis發(fā)表在2020年《Cognition》上的論文“Numbers around Descartes:A preregistered study on the three-dimensional SNARC effect”里的開放式數(shù)據(jù)為分析對象。分析過程中曾向論文作者Aleottia和Priftis(通訊作者)咨詢該研究相關(guān)事宜以準確把握其數(shù)據(jù)含義。
Aleottia等(2020)的研究是有關(guān)數(shù)字的三維空間表征問題,為當(dāng)前首個對三維(水平、垂直和矢量)SNARC效應(yīng)的研究。Aleottia 等(2020)指出了前人研究存在的一些問題后,創(chuàng)造性設(shè)計出一種特殊反應(yīng)裝置(如下圖1所示),真正解決了三維空間上的按鍵反應(yīng)問題。研究得到,三維SNARC效應(yīng)的效應(yīng)量值是基本相等的(且都是負值),存在三維的數(shù)字的心理空間表征。Aleottia等(2020)采用了頻率主義(經(jīng)典統(tǒng)計分析)和計算貝葉斯因子兩種方法對結(jié)果進行了分析并得到最終結(jié)論,這兩種分析方法下的結(jié)果大多完全一致,但從Aleottia等(2020)的結(jié)果分析可以看到,在面對經(jīng)典統(tǒng)計分析下的邊緣顯著情況,他們都會進一步進行貝葉斯分析以期得到更準確的判斷。具體而言,為探索三個空間維度上SNARC 效應(yīng)的情況(即,三個維度上的SNARC效應(yīng)的效應(yīng)量或回歸系數(shù)大小是否有顯著差異),Aleottia等(2020)進行了如下分析:對每個維度都進行了線性回歸分析,并通過經(jīng)典的單樣本t-檢驗和貝葉斯單樣本t檢驗均得到回歸方程是顯著的。進一步,為了比較三個維度上SNARC效應(yīng)量大小,Aleottia等(2020)通過經(jīng)典配對樣本t檢驗和貝葉斯配對樣本t檢驗均得到,三個維度上的SNARC效應(yīng)量大小無顯著差異。經(jīng)典配對樣本t檢驗方法因簡便實用而基本為前人研究所采用。但是,多重比較分析容易增加犯I型錯誤的概率,Aleottia等(2020)所做經(jīng)典配對樣本t檢驗存在不可靠的可能性。比較SNARC效應(yīng)量還可以有其他統(tǒng)計思路,如,在線性回歸模型中引入虛擬變量方法,下面詳細介紹。
圖1 Aleottia等(2020)研究中專門設(shè)計的反應(yīng)盒
如果兩個或多個樣本組中的線性模型設(shè)定是相同的(即為同向),則這幾組之間的回歸系數(shù)大小是可以比較的,而且這種比較在多數(shù)實證分析中都是非常必要的。在數(shù)字加工的SNARC效應(yīng)研究中也存在同樣情況。以Aleottia等(2020)的研究為例,其實驗得到三個維度(水平軸、垂直軸和矢量軸)的SNARC效應(yīng)量大小顯著且方向一致,則可確定數(shù)字認知存在心理的三維空間表征,因此比較三個維度(水平軸、垂直軸和矢量軸)的SNARC效應(yīng)量大小是可行且必要的。由(1)式,三個維度的SNARC效應(yīng)量的比較其實就是比較如下三個模型的回歸系數(shù)大小是否存在差異:
水平軸SNARC效應(yīng)模型:DRTH=β0H+β1HN +μH
(1a)
垂直軸SNARC效應(yīng)模型:DRTV=β0V+β1VN +μV
(1b)
矢量軸SNARC效應(yīng)模型:DRTs=β0S+β1SN +μS
(1c)
考慮到三個模型中的回歸系數(shù)和常數(shù)項不等,采取加法乘法式混合引入虛擬變量得到如下線性模型(Wooldridge,2009/2010)。
DRT=β0+δ1d1+δ2d1*N+δ3d2+δ4d2*N+β1N+μ
(2)
該模型以水平軸為對照,且d1(矢量軸)和d2(垂直軸)均為虛擬變量。當(dāng)兩個虛擬變量都取0時,則表示為水平軸SNARC效應(yīng)模型,且為對照組;當(dāng)垂直軸取1,矢量軸取0,則表示為垂直軸SNARC效應(yīng)模型;當(dāng)垂直軸取0時,矢量軸取1,則表示矢量軸SNARC效應(yīng)模型。 N為數(shù)字1、2、3、4、6、7、8、9。因此,結(jié)合兩個虛擬變量的不同取值,可得到:
水平軸SNARC效應(yīng)模型(d1=d2=0):
DRT=β0+β1N +μ
(2a)
矢量軸SNARC效應(yīng)模型(d1=1,d2=0):
DRT=(β0+δ1)+(δ2+β1)N+μ
(2b)
垂直軸SNARC效應(yīng)模型(d1=0,d2=1):
DRT=(β0+δ3)+(δ4+β1)N+μ
(2c)
據(jù)此,檢驗垂直軸、矢量軸和水平軸之間的回歸系數(shù)大小是否存在顯著差異,就是檢驗H0:δ2或δ4=0。依此類推,如果(2)式中的虛擬變量d1為水平軸、d2為矢量軸,垂直軸為參照記為0,當(dāng)兩個虛擬變量都取0則表示垂直軸,這樣垂直軸就是對照組;當(dāng)水平軸取1,矢量軸取0,則表示水平軸(d1=1,d2=0);當(dāng)水平軸取0,矢量軸取1,則表示矢量軸(d1=0,d2=1)。據(jù)此,檢驗水平軸、矢量軸和垂直軸之間的回歸系數(shù)大小是否存在顯著差異,最終都可歸結(jié)為檢驗H0:δ2或δ4=0。
下面即是利用Aleotti等(2020)的公開數(shù)據(jù)通過SPSS(SPSS Statistics 21,IBM,NY,USA)對模型(2)進行回歸分析和F檢驗,最終得到方差分析表(表1)和兩個回歸系數(shù)表(表2和表3)??梢钥吹?不論以哪個軸為參照軸,方差分析表都是相同的(即都是表1形式),這表明存在SNARC效應(yīng)。而且,當(dāng)以水平軸為參照時,在回歸系數(shù)大小比較上,其他兩軸均與其無顯著差異(表2);當(dāng)以垂直軸為參照時,在回歸系數(shù)大小比較上,其他兩軸均與其無顯著差異(表3)。結(jié)果表明,存在數(shù)字的空間三維表征。因此,可以看到,通過引入虛擬變量對回歸系數(shù)大小的分析和Aleotti等(2020)的分析結(jié)果是一致的。
表1 方差分析表
表2 回歸系數(shù)表(水平軸為參照)
表3 回歸系數(shù)表(垂直軸為參照)
由前面分析可知,引入交乘項檢驗?zāi)硞€或某幾個變量的系數(shù)是否存在組間差異,只需在一般線性模型中加入交乘項即可,但這一方法背后存在隱含的假設(shè)條件。對于數(shù)字認知的SNARC效應(yīng)的一般線性模型(1)式,這個隱含的假設(shè)條件是,三組的誤差項應(yīng)具有相同的分布(因為估計時是將三組樣本混合在一起進行估計的),即,σH2=σV2=σS2。國內(nèi)夏帆(2008)給出了證明,一元線性回歸模型中引入一個虛擬變量時,其中的虛擬變量回歸參數(shù)b 的顯著性檢驗和兩正態(tài)獨立總體均值比較t檢驗是等效的。通過前面實例分析得到,混合引入兩個虛擬變量后的結(jié)果也是等效的。引入虛擬變量的好處之一是可能會減弱假陽性。
第一部分的分析中提到貝葉斯檢驗在心理學(xué)研究中已開始得到應(yīng)用。貝葉斯學(xué)派認為概率是主觀、先驗和可變化的,是從有到變化;而頻數(shù)派認為概率是從無到有到相對穩(wěn)定,是客觀的。若只從客觀性角度看,似乎頻數(shù)派的統(tǒng)計方法的可信度相對更高,但實際情況是否真是如此呢?而且現(xiàn)在心理學(xué)實驗的檢驗結(jié)果報告除了列出t值(或z值)大小,還需要需要提供“Cohen’sd值”,也有進一步提供置信區(qū)間的。因此,和第一部分一樣,下面仍從實例出發(fā)對置信區(qū)間的可信問題進行分析。需要指出的是,雖然依據(jù)實例分析統(tǒng)計問題研究是初步的,但從數(shù)學(xué)角度來看,其不失為一種發(fā)現(xiàn)某些統(tǒng)計問題甚至質(zhì)疑某些統(tǒng)計觀點的重要手段。
區(qū)間估計與假設(shè)檢驗是傳統(tǒng)的推斷統(tǒng)計中兩種重要的統(tǒng)計方法。參數(shù)估計包括參數(shù)的點估計和區(qū)間估計。 設(shè)x1,x2,…xn是來自總體X的樣本,總體X分布函數(shù)為F(x,θ)(θ為未知參數(shù)),現(xiàn)建立兩個統(tǒng)計量T1(x1,x2,…xn)及T2(x1,x2,…xn)并滿足不等式T1(x1,x2,…xn) 例1:假設(shè)某私立學(xué)校規(guī)定學(xué)生升學(xué)標準之一為近6次英語考試平均分不低于101分(總分為120),對A學(xué)生進行了6次考試后得到如下分數(shù):85,90,95,96,101,103。問A學(xué)生在α=0.05下是否達到英語入學(xué)標準? 解法一: 假設(shè)檢驗解法如下: ①構(gòu)建假設(shè)H0:μ0≥101,H1:μ0<101 ③對顯著性水平α=0.05,查t值表確定臨 界值t0.05(5)= -2.015 由于 -1.996>-2.015,接受原假設(shè)H0, A學(xué)生達到入學(xué)標準。 解法二: 置信度為0.95的均值置信區(qū)間為(-∞,95+2.015 ×6.723/√5),計算得到(-∞,101.058),101 落入其中,依據(jù)該置信區(qū)間A學(xué)生達到入學(xué)標準(置信區(qū)間法)。 假設(shè)檢驗解法如下: ①構(gòu)建假設(shè)H0:μ0≤101,H1:μ0>101 ③對顯著性水平α=0.05,查t值表確定臨 界值t0.05(5)= 2.015 由于-1.996< 2.015,接受原假設(shè)H0,A學(xué)生未達到入學(xué)標準。 解法二下的置信區(qū)間和假設(shè)檢驗產(chǎn)生沖突,因為101和置信區(qū)間的位置關(guān)系不可忽視。 為更一般性討論這個問題,若取某個置信區(qū)間(置信度為1-α)并構(gòu)建原假設(shè)H0:p=0,在拒絕和接受H0下,依據(jù)樣本觀測值和置信區(qū)間的位置關(guān)系進行估計時,以下兩種結(jié)果均可能出現(xiàn): ①接受H0,置信區(qū)間為(a1,b1) 假設(shè)0落在(a1,b1)中,當(dāng)a1,b1中的一個或都距離0很近,若取置信區(qū)間(a1= -0.02,b1=0.04),假設(shè)檢驗和區(qū)間估計結(jié)論則可能產(chǎn)生沖突。當(dāng)a1,b1都距離0較遠,若取置信區(qū)間(a1= -15,b1=20),假設(shè)檢驗和區(qū)間估計結(jié)論則趨向一致,但由于區(qū)間估計的上下限距離0較遠,沒有哪個區(qū)間值能有更大把握 在0附近。 ②拒絕H0,置信區(qū)間為(a2,b2) 假設(shè) 0落在(a2,b2)外,但a2,b2中的一個或都距離0很近,若取置信區(qū)間(a2=0.02,b2=0.04),其區(qū)間內(nèi)任意值均在0附近,這時,區(qū)間估計與假設(shè)檢驗結(jié)論可能存在沖突。而若取置信區(qū)間(a2=15,b2=20),區(qū)間上下限都和0相距較遠,區(qū)間估計和假設(shè)檢驗結(jié)論則趨向一致。 因此,①和②都存在產(chǎn)生沖突的可能,解法二屬于前述1中可能產(chǎn)生沖突的一種情形,從而對置信區(qū)間可信存有懷疑。 從例1所給6次考試的樣本觀測值看,A學(xué)生僅有一次考試略高于101,一次剛好合格,其余4次均不合格,這六次考試平均分數(shù)也只有95,遠低于入學(xué)標準線。 分析例1的解法一中的置信區(qū)間(88.942,101.058)也可發(fā)現(xiàn),101雖然落入其中,但在這個區(qū)間中處于非常偏右的位置(距離區(qū)間上限很近),樣本觀測值大多數(shù)都小于101。這種樣本信息提示,H0:μ0≤101,H1:μ0>101很可能會得到支持,即,A學(xué)生未達到入學(xué)標準,這個結(jié)果和解法二的假設(shè)檢驗法相一致。由于貝葉斯統(tǒng)計方法的基本思想就是充分利用樣本信息和先驗分布,下面采用貝葉斯統(tǒng)計方法(解法三)對例1進行再分析。 第一步 假設(shè)存在先驗分布 心理統(tǒng)計與測量中,學(xué)生考試成績一般服從正態(tài)分布。假設(shè)A學(xué)生考試分數(shù)符合正態(tài)分布,Х~N(100,72),該正態(tài)分布作為先驗分布。 第二步 依據(jù)后驗分布 進行計算 將例1中全部6個樣本觀測值作為樣本信息并結(jié)合先驗分布計算得到后驗分布。后驗分布依據(jù)下面三個公式: (1) (2) (3) 其中,μN為后驗分布平均值,σN2為后驗分布方差,μ0為先驗分布平均值,σ02為先驗分布方差,σ2為樣本方差,μML為樣本平均值,xn為第n個樣本觀測值,N為樣本容量。 例1中6個樣本觀測值平均分為95,方差為45.199,據(jù)式(1)和(2)(即結(jié)合先驗分布計算公式)可得后驗分布為ХN~N(95.666,42.602)。由于例1所給樣本觀測值只有6個,后驗分布均值95.666與6個樣本觀測值均值(95)很接近,但小于先驗分布均值100和入學(xué)標準101分,而100已很接近101分,所以假設(shè)的先驗分布似乎未影響后驗分布。95.666小于101(但變異減小),所以A學(xué)生未達到入學(xué)標準。本次分析支持前述解法二的假設(shè)檢驗法。進一步,在當(dāng)前樣本信息下A學(xué)生考試成績的先驗分布需要滿足什么條件才可能使后驗分布均值達到入學(xué)標準呢?根據(jù)式(1)列出如下二元一次不等式方程式(4)計算先驗分布均值和方差范圍。變形后得到45.2μ0-45.2×101≥600×σ02,最終得到,對于先驗分布,當(dāng)120≥μ0≥101且1.43≥σ02≥0時,A學(xué)生后驗分布均值才可能達到入學(xué)標準101分。考慮極端情形(σ02=1.43),從A學(xué)生實際考試成績來說,標準差為1.2的考試成績意味,相差一分就會相差近一個標準差,實際出現(xiàn)這種情況的可能性不大。所以綜合前面分析,就當(dāng)前樣本信息來說A學(xué)生實際未達到入學(xué)標準101分。 (4) 解法三在利用樣本信息上又更進一步,還考慮到先驗分布,因此處于相對更可信地位。但解法三支持解法二的假設(shè)檢驗法表明,解法一和二的置信區(qū)間估計的可信性值得懷疑。 例1解答共采用了三種方法,最后通過貝葉斯統(tǒng)計分析才給出當(dāng)前樣本信息下相對確定性結(jié)果(通過計算貝葉斯因子結(jié)果也一樣)。概括而言這些解法主要回答如何依據(jù)樣本信息進行方向判斷(大于還是小于英語入學(xué)標準101分)。解答過程中雖利用置信區(qū)間進行估計,但其可信受到懷疑,所以對置信區(qū)間涵義及其可信問題還需在概念上進一步反思和澄清: (1)區(qū)間估計是構(gòu)造出包含參數(shù)的樣本范圍進行估計(置信區(qū)間),例如,對α=0.05時的置信區(qū)間(0.1,0.2),認為參數(shù)有 95%的可信度落在0.1~0.2之間是不夠精確的,因為這種表述將參數(shù)看作隨機變量,置信區(qū)間覆蓋某參數(shù)的可能性才是對置信區(qū)間的精確理解;假設(shè)檢驗是對于給定參數(shù)值(原假設(shè)),尋找與該參 數(shù)不一致的樣本(拒絕域)。置信區(qū)間是參數(shù)空間的子集,是一個隨機區(qū)間,具體區(qū)間范圍由樣本觀測值決定;假設(shè)檢驗的拒絕域是樣本空間的子集,相對來說是確定的集合,沒有隨機性。區(qū)間估計與假設(shè)檢驗二者存在聯(lián)系:置信區(qū)間與接受域?qū)?yīng),置信水平1 -α與顯著性水平α對應(yīng)。區(qū)間估計屬經(jīng)典統(tǒng)計理論中的估計方法,是根據(jù)樣本信息對總體分布或總體特征進行推斷,只用到了總體信息和樣本信息。而貝葉斯理論在使用前述兩種信息以外,還使用了先驗信息。先驗信息是 人們在試驗之前對某問題的了解和已掌握的相關(guān)統(tǒng)計信息。 與經(jīng)典統(tǒng)計理論觀點不同的是,貝葉斯理論認為 總體中的未知參數(shù)θ是隨機變量,將先驗信息(先驗概率分布)加入統(tǒng)計推斷中可提高統(tǒng)計推斷的質(zhì)量。 (2)如果不考慮例1中樣本觀測值和置信區(qū)間的實際具體含義,推廣到一般情形時,置信區(qū)間上下限值與參數(shù)之間的遠近關(guān)系是置信區(qū)間不可信的重要原因。例1解法一和二的置信區(qū)間下的結(jié)果都是一致的,但解法二中的樣本觀測值的置信區(qū)間結(jié)果和假設(shè)檢驗結(jié)果是相沖突的,這令假設(shè)檢驗和置信區(qū)間估計的可信性都受到懷疑,但不能最終確定是哪個出了問題。解法一和二的置信區(qū)間雖然是不一致的,但結(jié)論相同,讓人覺得置信區(qū)間是可信的。進一步通過貝葉斯分析后得到兩種置信區(qū)間可信的存在基礎(chǔ)是:考試成績變異小,以及除這6次考試之外其他足夠多次數(shù)的考試成績都能≥101;但是這種情況實際發(fā)生的可能性未知,所以解法一和二的置信區(qū)間似乎又是不可信,因此這意味,通過貝葉斯統(tǒng)計方法找到置信區(qū)間估計可信或不可信的原因所在。但需要通過已有知識經(jīng)驗獲得樣本的先驗分布(本質(zhì)上即是需要符合一定條件的足夠考試次數(shù)或?qū)嶒炛貜?fù)次數(shù))。另外,如果基于樣本觀測值和置信區(qū)間在例1中實際具體含義,則101分在例1中具體含義是英語入學(xué)分數(shù),其落在置信區(qū)間(88.942,101.058)中。雖從連續(xù)變量角度看區(qū)間上限101.058是合理的,但作為實際考試分數(shù),101.058是不存在的。所以從樣本實際情況來看101分作為邊界更加合理,而恰巧這個分值又是區(qū)間上限,所以A學(xué)生很有可能就是未達到入學(xué)標準,例1中的先驗分布變異很小而后驗分布變異還會更小可進一步支持該觀點。 (3)置信區(qū)間按某估計程序被建構(gòu)和實際理解使用某個置信區(qū)間之間存在較大差異。按頻數(shù)說,實驗重復(fù)很多次后,利用很多樣本信息可以計算得到很多個置信區(qū)間,真值存在于某一置信度(如95%)下的置信區(qū)間里。但就某一個置信區(qū)間而言,真實值或在里面或不在里面,這種情形不好用概率去描述,這個置信區(qū)間里的樣本觀測值也不存在分布信息。因為實驗重復(fù)很多次后,概率意義才成立,一定置信度下的置信區(qū)間才能建構(gòu)出來并具有價值(總體參數(shù)在其中)。從這個角度出發(fā),例1前兩種解法可以理解為是通過置信區(qū)間的建構(gòu)實現(xiàn)對真值估計:由解法一和解法二的置信區(qū)間法可知,兩種解法構(gòu)建的置信區(qū)間都包含了真值。這樣,兩者對真值進行估計的過程中,在目前樣本信息下出現(xiàn)了兩個置信區(qū)間的交集區(qū)間(R交)。理論上這兩個置信區(qū)間不能相交,相交則意味R交置信度會低于95%(樣本信息完全相同),而作為95%置信區(qū)間子集R交置信度實際上就是95%,于是矛盾產(chǎn)生了。但是,實驗重復(fù)很多次后就不存在這樣的問題,而這種理論上的構(gòu)建和實際某樣本信息下構(gòu)建某個置信區(qū)間過程之間的差異一直存在,是抽樣研究所固有的特點。 (1)包含虛擬變量的線性回歸模型是一種特殊的回歸模型,引入虛擬變量增加了線性回歸模型的復(fù)雜性,使一個線性回歸方程能融合至少兩個線性回歸方程在其中,對回歸問題的描述(尤其是包含定性問題時)更凝聚清晰和接近現(xiàn)實。一元線性回歸方程中的斜率反映SNARC效應(yīng)量,其差異性檢驗通常使用t檢驗,這種方法簡便易行,但并未充分利用線性回歸方程的自身特性,存在增加假陽性的可能。在SNARC效應(yīng)的一元線性回歸模型中引入虛擬變量后,通過使用回歸模型的總體顯著性檢驗F檢驗可以替代t檢驗,即與比較 兩個獨立的正態(tài)分布的總體的均值的t檢驗結(jié)果是一致的,可以降低結(jié)果的假陽性。但對于SNARC效應(yīng)量的分析來說,引入虛擬變量至線性回歸模型后增加了分析的難度。 (2)由前述分析,置信區(qū)間估計的不可信主要看參數(shù)和置信區(qū)間的上下限之間的位置關(guān)系以及實驗重復(fù)次數(shù),在具體問題中還離不開樣本觀測值的具體含義。但最關(guān)鍵一點,置信區(qū)間可以反映樣本信息并在實驗重復(fù)多次后能反映總體參數(shù)(一定條件下樣本可以替代總體),這是置信區(qū)間合理可信的基礎(chǔ)。所以,總體上置信區(qū)間合理可信,且含有重要量化信息(如,可利用置信區(qū)間研究效應(yīng)重復(fù)性問題),可以一定程度上補充經(jīng)典假設(shè)檢驗??尚诺慕K極價值應(yīng)是指向?qū)φ嬷档母鼫蚀_估計,并隨樣本信息增加,該分配多大概率(或把握)給這些樣本信息以表明依據(jù)它們所估計的真值能準確到什么程度。對于頻數(shù)說的置信區(qū)間,實驗重復(fù)很多次后才能賦予置信區(qū)間某個置信度(如,95%)下包含真值。所以在建構(gòu)或估計真值過程中基于樣本信息的可信都是相對的,但在樣本信息不是很足夠時就能充分利用已有知識經(jīng)驗實現(xiàn)估計的統(tǒng)計學(xué)理論或方法可以勝出,因而貝葉斯統(tǒng)計理論有其相對優(yōu)勢,將貝葉斯統(tǒng)計引入心理學(xué)實驗結(jié)果的檢驗并報告出來是非常有必要的。2.1 例題及解答
2.2 分析與討論
2.3 例1再分析——貝葉斯統(tǒng)計(解法三)
2.4 討論
3 結(jié)束語