亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        應(yīng)用語言學(xué)研究中的圖示與穩(wěn)健統(tǒng)計(jì)方法

        2018-01-19 01:45:16
        外國語文 2017年6期
        關(guān)鍵詞:數(shù)據(jù)分布選點(diǎn)平均數(shù)

        鮑 貴

        (南京工業(yè)大學(xué) 外國語言文學(xué)學(xué)院,江蘇 南京 211816)

        0 引言

        在研究數(shù)據(jù)滿足統(tǒng)計(jì)假設(shè)(statistical assumptions)的情況下,常規(guī)(standard;conventional)統(tǒng)計(jì)分析方法(如方差分析)是恰當(dāng)?shù)倪x擇。但是,如果研究數(shù)據(jù)違反了統(tǒng)計(jì)假設(shè),使用常規(guī)統(tǒng)計(jì)方法就會(huì)影響統(tǒng)計(jì)效力,得出誤導(dǎo)性甚至錯(cuò)誤的結(jié)論。譬如,Wilcox(1998)發(fā)現(xiàn),在正態(tài)分布時(shí),如果兩個(gè)總體平均數(shù)分別為0和1,方差均為1,使用t檢驗(yàn)(n= 25,α= .05)的統(tǒng)計(jì)效力為0.96,但是如果兩個(gè)總體是污染的正態(tài)分布(重尾巴,輕度違反正態(tài)分布),統(tǒng)計(jì)效力只有0.28。因此,探索數(shù)據(jù)模式,尤其診斷統(tǒng)計(jì)假設(shè),是嚴(yán)謹(jǐn)?shù)慕y(tǒng)計(jì)分析不可或缺的。但是,應(yīng)用語言學(xué)研究者忽視統(tǒng)計(jì)假設(shè)的現(xiàn)象相當(dāng)普遍(Plonsky,2014;Larson-Hall et al.,2015;鮑貴,2012)。究其原因,一方面可能是因?yàn)檠芯空邔?duì)統(tǒng)計(jì)假設(shè)認(rèn)識(shí)不足,沒有掌握有效的統(tǒng)計(jì)假設(shè)診斷或檢驗(yàn)方法;另一方面可能是因?yàn)檠芯空卟恢廊绾螒?yīng)對(duì)統(tǒng)計(jì)假設(shè)違背的情形。實(shí)際上,統(tǒng)計(jì)學(xué)研究在數(shù)據(jù)分析方面的兩大進(jìn)展已為研究者提供了有價(jià)值的統(tǒng)計(jì)分析技術(shù)。一是圖示方法(graphical methods),二是穩(wěn)健(robust)統(tǒng)計(jì)方法。圖示方法是視覺化的探索式數(shù)據(jù)分析技術(shù)(包括統(tǒng)計(jì)假設(shè)的診斷),常常能夠揭示推理統(tǒng)計(jì)不易發(fā)現(xiàn)的數(shù)據(jù)特點(diǎn)和模式。穩(wěn)健統(tǒng)計(jì)方法是現(xiàn)代統(tǒng)計(jì)技術(shù)。在統(tǒng)計(jì)假設(shè)滿足的情況下,穩(wěn)健統(tǒng)計(jì)方法與常規(guī)統(tǒng)計(jì)方法不相上下,但是在統(tǒng)計(jì)假設(shè)違反的情況下,穩(wěn)健統(tǒng)計(jì)方法有著明顯的優(yōu)勢(shì),不受或較少地受到違反統(tǒng)計(jì)假設(shè)對(duì)統(tǒng)計(jì)分析結(jié)果造成的不利影響。

        在應(yīng)用語言學(xué)界,除了為數(shù)不多的教材介紹圖示方法(Johnson,2008;Gries,2013)和穩(wěn)健統(tǒng)計(jì)方法(Larson-Hall,2016)之外,學(xué)術(shù)期刊論文很少介紹或使用這些方法(Larson-Hall et al.,2010;Larson-Hall,2012;Plonsky et al.,2015;鮑貴,2016;2017)。鑒于應(yīng)用語言學(xué)研究在進(jìn)行組間比較時(shí)很少使用統(tǒng)計(jì)學(xué)家大力推薦的箱圖(boxplot)(Larson-Hall et al.,2010),本研究擬介紹箱圖的構(gòu)造原理。更為重要的是,任何圖形,包括箱圖在內(nèi),都有不足之處,因而多圖診斷更值得推介。另外,前期應(yīng)用語言學(xué)文獻(xiàn)未能將圖形診斷與穩(wěn)健統(tǒng)計(jì)方法的選擇有機(jī)地結(jié)合在一起。本文克服這些局限,介紹箱圖、核密度圖和LOWESS(locally-weighted scatterplot smoother,局部加權(quán)散點(diǎn)圖平滑方法)以及穩(wěn)健方差和協(xié)方差分析(即選點(diǎn)分析,pick-a-point analysis)的原理,以真實(shí)數(shù)據(jù)為例探討這些方法的應(yīng)用。本文使用的統(tǒng)計(jì)軟件為R 3.4.0,穩(wěn)健統(tǒng)計(jì)分析使用的函數(shù)來自Wilcox(2017)*穩(wěn)健統(tǒng)計(jì)分析數(shù)據(jù)包為Rallfun-v34。。

        1 箱圖與核密度圖

        1.1箱圖

        箱圖是由Tukey(1977)創(chuàng)建的圖示方法。它利用箱體和觸須(whisker)概括數(shù)據(jù)的重要信息,因而又稱箱-須圖(box-and-whisker plot)。傳統(tǒng)上,箱體概括的數(shù)據(jù)信息簡稱五數(shù)總括(five-number summary),即最小值(minimum,Min)、下樞(lower hinge,HL)、第2個(gè)四分位數(shù)(second quartile,Q2,常稱作中位數(shù)M)、上樞(upper hinge,HU)和最大值(maximum,Max)。最小值和最大值提供數(shù)據(jù)分布尾巴的信息。中位數(shù)反映分布的中心。上、下樞距離反映分布的展度(spread);利用上、下樞構(gòu)建的上、下圍(upper fence,F(xiàn)U;lower fence,F(xiàn)L)用于診斷異常值(outlier)。中位數(shù)以及上、下樞的位置反映數(shù)據(jù)分布的偏度。換言之,五數(shù)概括涵蓋變量的四個(gè)主要特征:中心、展度、非對(duì)稱性(asymmetry)和異常值(Hintze et al.,1998:181)。箱圖的基本構(gòu)造如圖1所示。

        圖1箱圖構(gòu)造

        圖1是水平放置的箱圖。長方形箱體的兩條邊由上、下樞確定,分割箱體的粗線段代表中位數(shù)。上樞為大于中位數(shù)的一半數(shù)據(jù)的中位數(shù),即上四分(the upper fourth);下樞為小于中位數(shù)的一半數(shù)據(jù)的中位數(shù),即下四分(the lower fourth)。R默認(rèn)的上、下樞采用這一定義。也有箱圖采用上、下四分位數(shù)(the upper quartile,Q3;lower quartile,Q1)表示上、下樞(Wilcox, 2012;Kabacoff,2015)。上、下四分與上、下四分位數(shù)接近,但是由于算法不同,它們之間有時(shí)會(huì)有小的差異。關(guān)于分位數(shù)的算法,可參考Hyndman et al.(1996)和Ugarte et al.(2015)。圖1中位數(shù)線代表的值是31.5。上、下樞各為37.5和22.5。樞展度(Hspread)為15。樞展度又稱四分展度(fourth-spread),近似于四分位距(interquartile range,IQR),囊括了50%的中間數(shù)值。圖1中的上圍和下圍反映異常值的臨界值(outlier cutoff)。計(jì)算上,F(xiàn)U=HU+1.5×Hspread,F(xiàn)L=HL-1.5×Hspread。在標(biāo)準(zhǔn)正態(tài)分布時(shí),上、下圍包括了約99.3%的數(shù)據(jù),只有0.7%的數(shù)據(jù)位于上、下圍之外,被判定為異常值。利用上、下圍定義異常值有些武斷,但是經(jīng)驗(yàn)表明,這個(gè)定義能夠很好地識(shí)別可能需要給予特別注意的數(shù)值(Emerson & Strenio,1983:62)。在圖1中,F(xiàn)U= 60,F(xiàn)L= 0。有一個(gè)用圓圈表示的異常值位于上、下圍之外。由上、下樞向外垂直延伸的虛線稱作觸須。上鄰近值(upper adjacent value)表示在上圍內(nèi)的最大數(shù)值;下鄰近值(lower adjacent value)表示在下圍內(nèi)的最小數(shù)值。圖1表明,數(shù)據(jù)分布不夠?qū)ΨQ,下須線比上須線略長,但是異常值使右尾巴變長。

        盡管傳統(tǒng)箱圖是非常有價(jià)值的圖形診斷方法,但是它不能診斷數(shù)據(jù)分布的峰態(tài)(如多峰態(tài),multi-modality)和提供其他統(tǒng)計(jì)信息(如平均數(shù))??朔鹘y(tǒng)箱圖的局限有兩種方法。一種是對(duì)傳統(tǒng)箱圖進(jìn)行改造,比如添加平均數(shù)或繪制小提琴圖(violin plot)(McGill et al.,1978)。另外一種方法是多圖并用,彼此取長補(bǔ)短。

        1.2核密度圖

        核密度圖不僅能夠直觀地顯示分布尾巴,而且還能夠顯示分布的峰頂(peak)、肩部(shoulder)和凸塊(bump,數(shù)據(jù)的聚合),是對(duì)傳統(tǒng)箱圖的很好補(bǔ)充。

        核密度估計(jì)是估計(jì)連續(xù)性隨機(jī)變量概率密度函數(shù)的非參數(shù)方法,目的是依據(jù)樣本估計(jì)一個(gè)真實(shí)的未知概率密度函數(shù)。核密度估計(jì)的函數(shù)是:

        公式中,K(·)是核密度函數(shù),h是平滑參數(shù),又稱帶寬(bandwidth),n是樣本量(Ugarte et al., 2015:115)。

        常用的核密度函數(shù)有高斯(正態(tài))函數(shù)、矩形(均勻)函數(shù)和三角函數(shù)等。這些核密度函數(shù)的特點(diǎn)是單峰(unimodal)、圍繞0點(diǎn)對(duì)稱和曲線下的單位面積為1(Keen,2010:161)。R默認(rèn)的核密度估計(jì)函數(shù)是高斯核密度函數(shù)。

        核密度估計(jì)中,選擇適合的帶寬非常重要。帶寬過窄時(shí),核密度估計(jì)偏差小,但是方差大;帶寬過寬時(shí),核密度估計(jì)方差小,但是偏差大(Keen,2010:167)。視覺上,帶寬過窄導(dǎo)致密度估計(jì)曲線過于起伏,使分布模式難以察覺;帶寬過寬導(dǎo)致曲線過于平滑,給分布形狀的判斷帶來錯(cuò)覺。R默認(rèn)的帶寬計(jì)算上采用Silverman經(jīng)驗(yàn)法則(Silverman,1986:47-48):h= 0.9An-1/5,其中,A= min(SD,IQR/1.34),即A取標(biāo)準(zhǔn)差(SD)和四分位距除以1.34的商之間的較小值。

        圖2是反映上節(jié)數(shù)據(jù)分布形狀的高斯核密度圖。在水平軸上的軸須圖(rug plot)中,軸須代表樣本數(shù)據(jù)值(n= 20)。采用的帶寬為R默認(rèn)算法計(jì)算出的值(h= 5.35)。

        圖2 核密度估計(jì)

        1.3 箱圖與核密度圖應(yīng)用

        在應(yīng)用語言學(xué)研究中,箱圖與核密度圖可用于直觀地比較不同組數(shù)據(jù)分布的基本特點(diǎn)。本節(jié)利用Ellis et al.(2004)研究中的部分?jǐn)?shù)據(jù)介紹箱圖和核密度圖的實(shí)際應(yīng)用*本節(jié)以及第3、4節(jié)數(shù)據(jù)均來自http:∥cw.routledge.com/textbooks/9780805861853/spss-data-sets.asp.。

        Ellis et al.(2004)設(shè)計(jì)無準(zhǔn)備(no planning,NP)、任務(wù)前準(zhǔn)備(pretask planning,PTP)和在線準(zhǔn)備(on-line planning,OLP)三個(gè)條件調(diào)查對(duì)42名中國英語學(xué)習(xí)者記敘文寫作質(zhì)量多個(gè)測(cè)量指標(biāo)的影響。本例選擇的測(cè)量指標(biāo)是非流利度(dysfluencies)。該設(shè)計(jì)為被試間均衡設(shè)計(jì)(n1=n2=n3= 14)。

        Ellis et al.(2004)沒有在研究中報(bào)告各個(gè)條件數(shù)據(jù)分布的具體特點(diǎn),采用常規(guī)的單因素方差分析和Scheffé配對(duì)比較方法檢驗(yàn)準(zhǔn)備條件對(duì)學(xué)習(xí)者非流利度的影響。本節(jié)主要診斷數(shù)據(jù)分布的特點(diǎn),判斷這些統(tǒng)計(jì)檢驗(yàn)方法是否合適。

        1.3.1箱圖診斷

        利用本例數(shù)據(jù),圖3比較三個(gè)準(zhǔn)備條件組非流利度數(shù)據(jù)分布箱圖。

        圖3 三個(gè)準(zhǔn)備條件下非流利度箱圖比較

        為了使箱圖能夠更好地揭示數(shù)據(jù)的特點(diǎn),圖3在傳統(tǒng)的箱圖中增加了平均數(shù)(用加號(hào)“+”表示)和切口(notches)。切口顯示中位數(shù)95%的置信區(qū)間。兩幅箱圖的切口不重合是兩個(gè)中位數(shù)有差異的最有力證據(jù)。

        總體上看,三個(gè)組數(shù)據(jù)分布的離散程度有較大差異。無條件組(NP)數(shù)據(jù)分布的離散程度最大,其次是在線準(zhǔn)備組(OLP)數(shù)據(jù)分布,任務(wù)前準(zhǔn)備組(PTP)數(shù)據(jù)分布最集中。Levene方差齊性檢驗(yàn)發(fā)現(xiàn),組間方差不齊(F(2,39) = 4.45,p= .018< .05)。

        圖3顯示的第2個(gè)重要特征是異常值的存在。無準(zhǔn)備條件組和在線準(zhǔn)備組數(shù)據(jù)有一個(gè)異常值。無條件組平均數(shù)輕度正向偏離中位數(shù),主體數(shù)據(jù)分布較為勻稱,但是較大的異常值使整體數(shù)據(jù)分布略正偏。在線準(zhǔn)備組平均數(shù)與中位數(shù)幾乎相同,數(shù)據(jù)分布不夠?qū)ΨQ,異常值使整體數(shù)據(jù)分布略正偏。任務(wù)前準(zhǔn)備組數(shù)據(jù)沒有異常值,平均數(shù)輕度正向偏離中位數(shù),分布很不對(duì)稱,呈正偏趨勢(shì)。

        圖3顯示的第3個(gè)重要特征是切口的重合度。無條件組的切口與其他兩個(gè)條件組的切口有少量重合;任務(wù)前準(zhǔn)備組和在線準(zhǔn)備組切口的重合度高。

        1.3.2 核密度圖診斷

        我們?cè)倮煤嗣芏葓D診斷同一批數(shù)據(jù)。圖4比較三個(gè)準(zhǔn)備條件組非流利度數(shù)據(jù)核密度圖。

        圖4 三個(gè)準(zhǔn)備條件下非流利度核密度圖比較

        圖4中的實(shí)線為樣本數(shù)據(jù)的分布曲線,虛線是為了對(duì)比而添加的正態(tài)分布曲線。為了便于數(shù)據(jù)性質(zhì)診斷,圖4還添加了軸須圖,軸須代表非流利度測(cè)量值。同各自的正態(tài)分布曲線相比,三個(gè)準(zhǔn)備條件組數(shù)據(jù)均呈單峰、正偏態(tài)分布。無準(zhǔn)備條件組(NP)和在線準(zhǔn)備組(OLP)數(shù)據(jù)分布肩部稍窄,分布曲線右尾各有一個(gè)凸塊(即有一個(gè)異常值)。任務(wù)前準(zhǔn)備組數(shù)據(jù)分布較陡峭,右側(cè)有一個(gè)較高的凸塊。這個(gè)凸塊是由三個(gè)較大值引起的。雖然箱圖沒有將這三個(gè)值診斷為異常值,但是它們使肩部變寬。相對(duì)于其他兩個(gè)準(zhǔn)備條件組數(shù)據(jù),任務(wù)前準(zhǔn)備組數(shù)據(jù)違反正態(tài)分布的程度較為嚴(yán)重。另外,由于圖4的橫坐標(biāo)采用同樣的刻度值,因而很容易看出,無條件組數(shù)據(jù)分布最分散,其次是在線準(zhǔn)備組數(shù)據(jù)分布,任務(wù)前準(zhǔn)備組數(shù)據(jù)分布最集中。

        綜上所述,不論采用箱圖還是核密度圖,它們均表明本例數(shù)據(jù)違反常規(guī)方差分析的兩個(gè)重要統(tǒng)計(jì)假設(shè)——正態(tài)分布和方差齊性,違反的程度似乎不嚴(yán)重。不過,統(tǒng)計(jì)假設(shè)違反程度嚴(yán)重性的判斷尚沒有公認(rèn)的標(biāo)準(zhǔn)。

        2 被試間設(shè)計(jì)穩(wěn)健方差分析及應(yīng)用

        2.1被試間設(shè)計(jì)穩(wěn)健方差分析

        被試間設(shè)計(jì)穩(wěn)健統(tǒng)計(jì)最常用的方法之一是穩(wěn)健方差分析。本節(jié)介紹的穩(wěn)健方差分析利用20%截尾平均數(shù)*將一組數(shù)據(jù)由小到大排序,然后從兩端截除樣本20%的數(shù)值,由此得到剩余數(shù)值的平均數(shù)即為20%截尾平均數(shù)。和Welch 方法(Welch’s method)的推廣式。20%截尾平均數(shù)解決數(shù)據(jù)分布問題(如偏態(tài)分布和異常值),Welch方法處理組間方差不齊問題。因此,這種穩(wěn)健方差分析方法又稱截尾平均數(shù)比較WelchF檢驗(yàn)。

        2.2被試間設(shè)計(jì)穩(wěn)健方差分析應(yīng)用

        Ellis et al.(2004)采用的常規(guī)單因素方差分析方法以及配對(duì)檢驗(yàn)方法(Scheffé檢驗(yàn))對(duì)三個(gè)準(zhǔn)備條件開展推理統(tǒng)計(jì)。單因素方差分析發(fā)現(xiàn)三個(gè)準(zhǔn)備條件在非流利度測(cè)量上有統(tǒng)計(jì)顯著性差異(F(2,39) = 3.75,p= .032 < .05)。*Ellis & Yuan(2004)報(bào)告的F值為3.74。但是,Scheffé檢驗(yàn)發(fā)現(xiàn)配對(duì)比較均沒有顯著性差異(無準(zhǔn)備和任務(wù)前準(zhǔn)備:p= .066 > .05,d= 0.93;無準(zhǔn)備和在線準(zhǔn)備:p= .080 > .05,d= 0.78;任務(wù)前準(zhǔn)備和在線準(zhǔn)備:p= .996 > .05,d= 0.06)*當(dāng)綜合方差分析發(fā)現(xiàn)某個(gè)因素有顯著效應(yīng)時(shí),通常認(rèn)為至少有一個(gè)配對(duì)比較有顯著性差異。本例研究樣本量較小,作者采用非常保守的Scheffé檢驗(yàn)導(dǎo)致綜合檢驗(yàn)與配對(duì)檢驗(yàn)結(jié)果矛盾。作者似應(yīng)兼顧第一類錯(cuò)誤率和統(tǒng)計(jì)效力。在正態(tài)分布和方差齊性條件下,d = 0.20、d = 0.50、d = 0.80依次表示小、中、大效應(yīng)(Cohen,1988)。由于本例數(shù)據(jù)違反方差分析統(tǒng)計(jì)假設(shè),效應(yīng)量估計(jì)Cohen’s d不準(zhǔn)確。。雖然本例中使用常規(guī)統(tǒng)計(jì)方法未必一定為誤,但是根據(jù)前面的圖示描述,我們至少可以認(rèn)為這些傳統(tǒng)的方法不是很恰當(dāng)?shù)姆椒?。穩(wěn)健組間比較方法是恰當(dāng)?shù)倪x擇。

        3 LOWESS平滑方法及應(yīng)用

        3.1 LOWESS平滑方法

        3.2 LOWESS平滑方法應(yīng)用

        在相關(guān)分析、協(xié)方差分析和回歸分析中,LOWESS平滑方法用于診斷變量之間的線性或非線性關(guān)系。本節(jié)以French et al.(2008)收集的數(shù)據(jù)為例,利用LOWESS平滑方法診斷協(xié)方差分析中的線性與回歸斜率齊性假設(shè)問題。

        French et al.(2008)利用前后測(cè)實(shí)驗(yàn)設(shè)計(jì)調(diào)查音位記憶力、詞匯知識(shí)和語法知識(shí)前測(cè)等多個(gè)變量對(duì)英語學(xué)習(xí)者語法知識(shí)發(fā)展的預(yù)測(cè)力。該研究收集的數(shù)據(jù)包括學(xué)生性別和接受性詞匯知識(shí)前后測(cè),不過研究者在回歸分析中沒有考慮性別因素。本節(jié)利用French et al.(2008)的數(shù)據(jù)回答另外一個(gè)問題,即在排除接受性詞匯知識(shí)前測(cè)的影響后(簡稱詞匯知識(shí)前測(cè)),性別是否對(duì)接受性詞匯知識(shí)后測(cè)(簡稱詞匯知識(shí)后測(cè))有顯著影響。

        本例設(shè)計(jì)為單因素協(xié)方差分析設(shè)計(jì)。在推理統(tǒng)計(jì)之前,需要探索數(shù)據(jù)分布的模式,特別要診斷詞匯知識(shí)前后測(cè)之間是否為線性關(guān)系,回歸斜率是否齊性。

        利用箱圖與核密度圖開展正態(tài)分布和方差齊性診斷發(fā)現(xiàn),本例數(shù)據(jù)接近正態(tài)分布,只是女性詞匯知識(shí)前測(cè)數(shù)據(jù)有三個(gè)相同異常值,男性詞匯知識(shí)前測(cè)數(shù)據(jù)分布略呈雙峰狀,男性詞匯知識(shí)后測(cè)數(shù)據(jù)有一個(gè)異常值。男、女生詞匯知識(shí)后測(cè)數(shù)據(jù)方差不齊(F(1,102 )= 4.64,p= .034 < .05)。詞匯知識(shí)前后測(cè)關(guān)系如圖5所示。

        圖5左分圖顯示詞匯知識(shí)前后測(cè)整體數(shù)據(jù)之間的關(guān)系,右分圖顯示男、女生詞匯知識(shí)前后測(cè)數(shù)據(jù)之間的關(guān)系,圖中的曲線為LOWESS平滑線,數(shù)據(jù)點(diǎn)用不同的符號(hào)顯示。左分圖表明,詞匯知識(shí)前后測(cè)沒有異常點(diǎn),沒有明顯的方差不齊現(xiàn)象。LOWESS平滑線接近直線,且坡度較陡,說明它們之間有很強(qiáng)的線性關(guān)系。但是,右分圖顯示詞匯知識(shí)前后測(cè)之間的關(guān)系隨性別的變化而變化。在女生數(shù)據(jù)中,詞匯知識(shí)前后測(cè)LOWESS平滑線近似為直線,且坡度較陡,反映較強(qiáng)的線性關(guān)系。但是,在男生數(shù)據(jù)中,當(dāng)詞匯知識(shí)前測(cè)值較小(約小于33)時(shí),詞匯知識(shí)前后測(cè)LOWESS平滑線較為水平;當(dāng)詞匯知識(shí)前測(cè)值較大(約大于33)時(shí),詞匯知識(shí)前后測(cè)LOWESS平滑線變得陡峭。這表明,詞匯知識(shí)前后測(cè)在男生數(shù)據(jù)中存在非線性關(guān)系。另外,右分圖兩條平滑線交叉,說明詞匯知識(shí)前后測(cè)回歸線在性別的兩個(gè)水平上非齊性。進(jìn)一步的回歸斜率齊性檢驗(yàn)發(fā)現(xiàn),本例數(shù)據(jù)違反回歸斜率齊性假設(shè)(F(1,100 = 7.33,p= .008 < .01))。

        圖5詞匯知識(shí)前后測(cè)之間的關(guān)系

        概而言之,本例數(shù)據(jù)分布有異常值和雙峰現(xiàn)象存在,LOWESS平滑方法診斷發(fā)現(xiàn)詞匯知識(shí)前后測(cè)違反回歸斜率齊性假設(shè),且在男生數(shù)據(jù)中詞匯知識(shí)前后測(cè)之間存在非線性關(guān)系,因而常規(guī)的協(xié)方差分析方法不再適合用于推理統(tǒng)計(jì)。

        4 非線性條件下穩(wěn)健協(xié)方差分析及應(yīng)用

        4.1非線性條件下穩(wěn)健協(xié)方差分析

        在兩個(gè)獨(dú)立組的協(xié)方差分析中,如果協(xié)變量和因變量之間的關(guān)系為非線性關(guān)系,回歸斜率非齊性(即回歸線不平行),則常規(guī)協(xié)方差分析方法不再合適,宜選擇穩(wěn)健協(xié)方差分析方法——選點(diǎn)分析。

        兩組有條件的位置測(cè)量(如20%截尾平均數(shù))記作mj(x),其中j= 1,2。選點(diǎn)分析的零假設(shè)是:H0:m1(x)=m2(x),其中x∈{x1,…,xK},K為協(xié)變量X選點(diǎn)數(shù)。計(jì)算條件估計(jì)量mj(x)必須要確定在某個(gè)協(xié)變量值x鄰近的所有X值xij。一種確定方法是移動(dòng)區(qū)間平滑方法(running interval smoother)(Wilcox,2017:628)。鄰近值的判斷標(biāo)準(zhǔn)為:|xi-x|f×MADN,其中f是平滑參數(shù)(常用值為1或0.8),MADN表示正態(tài)化的中位數(shù)絕對(duì)離差(參見鮑貴,2017)。根據(jù)鄰近值的判斷標(biāo)準(zhǔn)得到鄰近xi的所有xj值的集合,記作N(xi)。令i為滿足條件式j(luò)∈N(xi)的所有yj值的參數(shù)估計(jì)。計(jì)算所有x=xi(i=1,…,n) 時(shí)的i值,將(x1,1),…,(xn,n)連成線便得到回歸線的圖示表征。這一過程稱作移動(dòng)區(qū)間平滑方法。

        通常在五個(gè)點(diǎn)上選擇可比較的回歸線。依據(jù)Wilcox(2017:703-704),設(shè)5個(gè)選擇點(diǎn)為z1、z2、z3、z4和z5。協(xié)變量xij值按升序排列,即x1j≤ … ≤xnjj。因變量y值的次序與xij值的順序?qū)?yīng)。令Mj(x)是第j組鄰近x的數(shù)據(jù)點(diǎn)數(shù)。在第一組中尋找滿足條件式M1(xi1)≥12的協(xié)變量X最小值xi1。如果M2(xi1)≥12,則z1=xi1。如果M2(xi1)<12,尋找下一個(gè)X最小值xi1,照此重復(fù)直到滿足條件式M1(xi1)≥12和M2(xi1)≥12。令i1是一個(gè)i值,是滿足條件式M1(xi11)≥12和M2(xi11)≥12的最小整數(shù),則z1=xi11。按照同樣的方法得到最大選點(diǎn)z5=xi51。令i2=(i1+i3)/2,i3=(i1+i5)/2,i4=(i3+i5)/2。取i2、i3和i4的整數(shù)部分,則z2=xi21,z3=xi31,z4=xi41。

        在穩(wěn)健型選點(diǎn)分析中,令mj(x)為i滿足條件式Nj(x) = {i:|xij-x|fj×MADNj}的第j組所有yij值的20%截尾平均數(shù)。Mj(x)是用于估計(jì)mj(x)的所有yij值的點(diǎn)數(shù)。根據(jù)Wilcox(2017: 703),當(dāng)某個(gè)選點(diǎn)x上有效樣本量足夠大時(shí)(比如大于12),則在點(diǎn)x上兩條回歸線具有可比性,Yuen方法能夠給出條件平均數(shù)差異m1(x)-m2(x)精確的置信區(qū)間。在多個(gè)x點(diǎn)上比較條件平均數(shù)差異時(shí),可以利用Hochberg方法等控制族第一類錯(cuò)誤率。

        4.2非線性條件下穩(wěn)健協(xié)方差分析應(yīng)用

        由于非線性條件下選點(diǎn)分析允許非正態(tài)分布、回歸線非線性和非齊性,因而對(duì)第3節(jié)關(guān)于詞匯知識(shí)前后測(cè)數(shù)據(jù)的推理統(tǒng)計(jì)適合采用穩(wěn)健選點(diǎn)分析方法。表1報(bào)告選點(diǎn)分析的結(jié)果,調(diào)整p值控制族錯(cuò)誤率的方法為Hochberg方法。

        表1 性別對(duì)詞匯知識(shí)后測(cè)影響的選點(diǎn)分析

        表1顯示,在詞匯知識(shí)前測(cè)的五個(gè)選點(diǎn)上,男、女生在詞匯知識(shí)后測(cè)上均沒有統(tǒng)計(jì)顯著性差異(ps > .05)。換言之,在控制詞匯知識(shí)前測(cè)時(shí),性別對(duì)詞匯知識(shí)后測(cè)沒有統(tǒng)計(jì)顯著性影響。如果針對(duì)本例采用常規(guī)協(xié)方差分析,則得到性別對(duì)后測(cè)有顯著性效應(yīng)的結(jié)論(F(1,101)= 6.92,p= .010 < .05),效應(yīng)量達(dá)到中等水平(Cohen’sd= 0.54)。

        從表1效應(yīng)量來看,在前兩個(gè)選點(diǎn)上,性別效應(yīng)量低,而在最后三個(gè)選點(diǎn)上,效應(yīng)量或接近中等水平,或達(dá)到中等甚至更大的水平。這似乎表明,在詞匯知識(shí)前測(cè)的不同水平上,性別對(duì)詞匯知識(shí)后測(cè)的影響是不一致的。如果研究者認(rèn)為達(dá)到中等以上水平的效應(yīng)量有實(shí)際意義,則在詞匯知識(shí)前測(cè)較高水平(選點(diǎn)為36和42)上,女生比男生在詞匯知識(shí)后測(cè)上表現(xiàn)更好。本例詞匯知識(shí)前測(cè)較高水平上的有效樣本量偏小,在大樣本情況下,女生在詞匯知識(shí)后測(cè)方面是否顯著好于男生尚需進(jìn)一步的研究論證。

        5 結(jié)語

        本文簡要介紹了箱圖、核密度圖和LOWESS平滑線、單因素穩(wěn)健方差分析與協(xié)方差分析(選點(diǎn)分析)的基本原理和程序。案例分析表明,這些圖形大大增加了我們對(duì)數(shù)據(jù)分布模式的感知,為推理統(tǒng)計(jì)分析方法的選擇提供了重要的依據(jù)。當(dāng)數(shù)據(jù)違反正態(tài)分布和方差齊性時(shí),常規(guī)方差分析與穩(wěn)健方差分析得出不同的結(jié)果。當(dāng)雙變量數(shù)據(jù)違反線性假設(shè)和回歸斜率齊性假設(shè)時(shí),傳統(tǒng)的協(xié)方差分析得出誤導(dǎo)性的結(jié)果。這些結(jié)果凸顯了診斷數(shù)據(jù)分布和采用穩(wěn)健統(tǒng)計(jì)分析方法的重要性。

        Cleveland, W. S. 1979. Robust Locally Weighted Regression and Smoothing Scatterplots [J].AmericanStatisticalAssociation, 74(368): 829-836.

        Cleveland, W. S. 1985.TheElementsofGraphingData[M]. Monterey, CA: Wadsworth Advanced Book Program.

        Cohen, J.1988.StatisticalPowerAnalysisfortheBehavioralSciences(2nd ed.) [M]. Hillsdale, NJ: Lawrence Erlbaum Associates.

        Ellis, R. & F. Yuan. 2004. The Effects of Planning on Fluency, Complexity, and Accuracy in Second Language Narrative Writing [J].StudiesinSecondLanguageAcquisition(26): 59-84.

        Emerson, J. D. & J. Strenio. 1983. Boxplots and Batch Comparison [G]∥ D. C. Hoaglin, F. Mosteller & J. W. Tukey.UnderstandingRobustandExploratoryDataAnalysis. New York, NY: Wiley,58-96.

        French, L. M. & I. O’Brien. 2008. Phonological Memory and Children’s Second Language Grammar Learning [J].AppliedPsycholinguistics, 29(1): 1-25.

        Gries, S. Th. 2013.StatisticsforLinguisticswithR:APracticalIntroduction(2nd ed.) [M]. Berlin/Boston: De Gruyter Mouton.

        Hintze, J. L. & R. D. Nelson. 1998. Violin Plots: A Box Plot-Density Trace Synergism [J].TheAmericanStatistician, 52(2): 181-184.

        Hyndman, R. J. & Y. Fan. 1996. Sample Quantiles in Statistical Packages [J].TheAmericanStatistician, 50(4): 361-365.

        Johnson, K. 2008.QuantitativeMethodsinLinguistics[M] Malden, MA: Blackwell Publishing.

        Kabacoff, R. I. 2015.RinAction:DataAnalysisandGraphicswithR(2nd ed.) [M]. Shelter Island, NY: Manning Publications Co.

        Keen, K. J. 2010.GraphicsforStatisticsandDataAnalysiswithR[M]. Boca Raton, FL: Chapman & Hall/CRC.

        Larson-Hall, J. 2012. Our Statistical Intuitions May Be Misleading Us: Why We Need Robust Statistics [J].LanguageTeaching, 45(4): 460-474.

        Larson-Hall, J. 2016.AGuidetoDoingStatisticsinSecondLanguageResearchUsingSPSSandR(2nd ed.) [M]. New York, NY: Routledge.

        Larson-Hall, J. & R. Herrington. 2010. Improving Data Analysis in Second Language Acquisition by Utilizing Modern Developments in Applied Statistics [J].AppliedLinguistics, 31(3): 368-390.

        Larson-Hall, J. & L. Plonsky. 2015. Reporting and Interpreting Quantitative Research Findings: What Gets Reported and Recommendations for the Field[J].LanguageLearning, 65 (1): 127-159.

        McGill, R., J. W. Tukey & W. A. Larsen. 1978. Variations of Box Plots [J].TheAmericanStatistician, 32(1): 12-16.

        Plonsky, L. 2014. Study Quality in Quantitative L2 Research (1990—2010): A Methodological Synthesis and Call for Reform [J].TheModernLanguageJournal, 98(1): 450-470.

        Plonsky, L., J. Egbert & G. T. LaFlair. 2015. Bootstrapping in Applied Linguistics: Assessing Its Potential Using Shared Data [J].AppliedLinguistics, 36(5): 591-610.

        Silverman, B. W. 1986.DensityEstimationforStatisticsandDataAnalysis[M]. London: Chapman & Hall.

        Tukey , J. W. 1977.ExploratoryDataAnalysis[M]. Reading, MA: Addison-Wesley.

        Ugarte, M.D., A. F. Militino & A. T. Arnholt. 2015.ProbabilityandStatisticswithR(2nd ed.) [M]. Boca Raton, FL: CRC Press.

        Wilcox, R.R. 1998. How Many Discoveries Have Been Lost by Ignoring Modern Statistical Methods? [J].AmericanPsychologist, 53(3): 300-314.

        Wilcox, R. R. 2012.IntroductiontoRobustEstimationandHypothesisTesting(3rd ed.) [M]. San Diego, CA: Elsevier.

        Wilcox, R. R. 2017.IntroductiontoRobustEstimationandHypothesisTesting(4th ed.) [M]. San Diego, CA: Elsevier.

        鮑貴. 2012. 我國外語教學(xué)研究中的統(tǒng)計(jì)分析方法使用調(diào)查 [J]. 外語界(1):44-51,60.

        鮑貴. 2014. 研究設(shè)計(jì)中樣本量的確定 [J]. 外國語文(5):115-121.

        鮑貴. 2016. 輸出任務(wù)類型和詞語意象性對(duì)英語學(xué)習(xí)者詞匯習(xí)得的影響 [J]. 外語與外語教學(xué)(6):56-65,74.

        鮑貴. 2017. 語言學(xué)定量研究中的穩(wěn)健統(tǒng)計(jì)方法 [J]. 外語研究(2):22-29.

        猜你喜歡
        數(shù)據(jù)分布選點(diǎn)平均數(shù)
        加權(quán)平均數(shù)的應(yīng)用
        低轉(zhuǎn)速工況VVT選點(diǎn)對(duì)排氣溫度影響研究與分析
        改進(jìn)的云存儲(chǔ)系統(tǒng)數(shù)據(jù)分布策略
        “選點(diǎn)突破”技法的理論基礎(chǔ)及應(yīng)用
        甘肅教育(2020年21期)2020-04-13 08:09:02
        關(guān)注加權(quán)平均數(shù)中的“權(quán)”
        平均數(shù)應(yīng)用舉隅
        說說加權(quán)平均數(shù)
        一種基于給定標(biāo)準(zhǔn)對(duì)數(shù)據(jù)進(jìn)行正態(tài)修正的算法
        試論大數(shù)據(jù)之“大”
        基于ArcGIS格網(wǎng)選點(diǎn)的優(yōu)化技術(shù)研究
        国内自拍视频在线观看h| 亚洲人成网站18禁止| 波多野结衣久久精品99e| 免费无码毛片一区二区app | 体验区试看120秒啪啪免费| 午夜毛片不卡免费观看视频| 国精品无码一区二区三区在线| 国产一区二区不卡老阿姨| 国产成人亚洲不卡在线观看 | 在线看片无码永久免费aⅴ| 久久久久久无码AV成人影院| 精品少妇人妻av一区二区蜜桃 | 亚洲最大的av在线观看| 国产一级一级内射视频| 国产无套粉嫩白浆在线| 97久久天天综合色天天综合色hd| 一级毛片不卡在线播放免费| 99久久国内精品成人免费| 日本女优在线观看一区二区三区| 国内精品人人妻少妇视频| 久久精品女同亚洲女同| 特黄做受又粗又长又大又硬| 在线视频精品免费| 久久婷婷国产五月综合色| 日韩三级一区二区三区| 欧美成人免费全部| 乱人伦中文字幕在线不卡网站 | 青青草久热手机在线视频观看| 国产丝袜美腿一区二区三区| 欧美 日韩 人妻 高清 中文| 亚洲色自偷自拍另类小说| 波多吉野一区二区三区av| 中文字幕在线乱码av| 亚洲中文字幕在线第二页| 久久久久中文字幕无码少妇| 国产成人无码av| 国产精品三级av一区二区| 日韩国产成人无码av毛片蜜柚| 一本色道久久88—综合亚洲精品| 黑人大群体交免费视频| 欧美v亚洲v日韩v最新在线|