亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        探究區(qū)間估計與假設檢驗的關系

        2021-08-23 06:08:50
        四川職業(yè)技術學院學報 2021年4期
        關鍵詞:假設檢驗置信區(qū)間區(qū)間

        朱 海

        (重慶工商大學 數(shù)學與統(tǒng)計學院,重慶 400067)

        1 背景與意義

        近年來,有很多國內外學者都研究了區(qū)間估計與假設檢驗的關系.學者吳純[1]通過證明提到:“一般情況下,利用假設檢驗可以建立區(qū)間估計,反之亦然”、“假設檢驗和區(qū)間估計的結果在解釋上可以有差別”等結論,告誡大家統(tǒng)計學上的結論一定要注意其實質,不能只停留在問題表面;學者王建華[2]通過論證,糾正了“區(qū)間估計和假設檢驗是統(tǒng)一的,是一個問題的兩個方面”這個似是而非的說法,說明了區(qū)間估計和假設檢驗既有聯(lián)系,又有區(qū)別;也有學者通過“順推法”和“反推法”[3]進行區(qū)間估計和假設檢驗關系的研究,最終確定了兩者的區(qū)別和聯(lián)系.現(xiàn)在,區(qū)間估計和假設檢驗的應用極為廣泛,去年國外一篇論文發(fā)表出來,論文題目為:In‐fluence of multiple hypothesis testing on reproducibility in neuroimaging research: A simulation study and Python-based software[4],講的是神經(jīng)影像研究中多重假設檢驗對再現(xiàn)性的影響,整篇文章圍繞假設檢驗進行了一系列模擬分析,這從側面說明了假設檢驗應用范圍之大.

        本文對區(qū)間估計和假設檢驗的關系探究源自教材《概率論與數(shù)理統(tǒng)計教程第二版》(茆詩松,高等教育出版社,2011 年)中數(shù)理統(tǒng)計部分,該書在介紹參數(shù)估計和假設檢驗時,很多知識點覆蓋面很廣,但都只是單一的指出基本概念,至于其中多種統(tǒng)計推斷方法是否有聯(lián)系并未做過多介紹,比如在談及區(qū)間估計和假設檢驗的關系之時,所用篇幅較少,只是談及了區(qū)間估計時的樞軸量和假設檢驗時的檢驗統(tǒng)計量相同并非偶然,當然,樞軸量和檢驗統(tǒng)計量的相同的確很大程度的說明了區(qū)間估計和假設檢驗的關系匪淺.但是,區(qū)間估計和假設檢驗關系僅僅如此嗎?區(qū)間估計中的置信水平和假設檢驗中的顯著性水平有聯(lián)系嗎?區(qū)間估計和假設檢驗方法選擇有啥參照嗎?本文在此基礎上,大篇幅地探究了兩者的關系,包括區(qū)間估計和假設檢驗的基本概念、應用方面、優(yōu)劣方面、聯(lián)系及不同以及相關問題的深度剖析,都進行了總結和討論,并通過一些例子對一些問題進行舉例論證,并查閱了一些相關書籍和文獻,整理結論并討論,使得大家對這兩種統(tǒng)計推斷方法更加熟悉和深層次了解,一定程度上,能夠幫助讀者在處理相關問題時避免一些錯誤.

        2 區(qū)間估計和假設檢驗的基本論述

        2.1 區(qū)間估計概念

        區(qū)間估計,顧名思義,是包含一個區(qū)間的估計,這個區(qū)間是用來度量一個點估計的精度.參數(shù)的點估計經(jīng)計算得到了一個具體的數(shù)值,這樣一個具體的數(shù)值方便計算和使用.但計算出來的點估計精度如何,點估計本身并不能說明,需要依靠對應的分布去反映,現(xiàn)實中,我們通常用一個區(qū)間去覆蓋已知的點估計,也可以說求得點估計的取值范圍,它應該是一個區(qū)間,下面給出具體定義[5]:

        設θ是總體的一個參數(shù),x1,x2,…,xn是樣本,求得統(tǒng)計量θL(x1,x2,…,xn),θU(x1,x2,…,xn),使得θL<θU,得到樣本觀測值之后,便把θ估計在區(qū)間[θL,θU]內 . 由于樣本具有隨機性,區(qū)間 [θL,θU]覆蓋參數(shù)θ的可能性并不確定,這里通常需要我們人為給定一個概率,誠然,我們肯定想?yún)^(qū)間覆蓋θ的概率P越大越好,但是這必然會導致區(qū)間長度增大,這里把區(qū)間[θL,θU]覆蓋住θ的概率給定為 1 ?α,則有Pθ( )θL≤θ≤θU≥ 1 ?α,則 稱隨機區(qū)間[θL,θU]為θ的置信水平為 1 ?α的置信區(qū)間,θL和θU分別稱為θ的(雙側)置信下限和置信上限.

        2.2 置信區(qū)間計算方法

        通常,要計算置信區(qū)間,一個最常用的方法就是樞軸量法[5].對于這種方法,尋找置信區(qū)間最關鍵的步驟就是要找準未知參數(shù)所對應的合適的樞軸量,這里記G為樞軸量,構造一個樣本和未知參數(shù)θ的函數(shù)G(x1,…,xn,θ)使得G的分布不依賴于未知參數(shù)θ.另外樞軸量的尋找一般從θ的點估計入手.

        區(qū)間估計適用范圍:在參數(shù)的點估計不易計算,或者探究點估計精度如何時,區(qū)間估計往往能起到至關重要的作用,它能夠指定概率(即置信水平)求得相應比較精確的區(qū)間進行估計,這些都是點估計無法做到的.例如眾多分布中最常用的雙參數(shù)正態(tài)分布,記正態(tài)總體為N(μ,σ2),在一個參數(shù)已知,另一個參數(shù)未知時,都可以求得未知參數(shù)對應的置信區(qū)間,得到對應的區(qū)間估計.

        2.3 假設檢驗概念

        所謂假設檢驗,顧名思義,就是一個檢驗假設是否成立的過程,又稱統(tǒng)計假設檢驗.它是用來判斷樣本與樣本之間、樣本與總體之間的差異到底是由抽樣誤差引起,還是由樣本之間本質差異造成的一種統(tǒng)計推斷方法.假設檢驗有很多方法,顯著性檢驗作為一種最常用的假設檢驗方法,其基本原理是先根據(jù)一些非樣本信息對總體某個參數(shù)做出某種假設,然后通過對抽樣信息的統(tǒng)計推理,對這個假設是否應該被拒絕做出判斷.一些常用的假設檢驗方法有Z檢驗、T檢驗、卡方檢驗、F檢驗等.一個很經(jīng)典的假設檢驗問題,例如女士品茶試驗[5],女士每次猜對的概率為0.5,10 次都猜中概率為 2?10,很小的概率,幾乎不可能發(fā)生的事件,竟然發(fā)生了,這樣一個小概率原理,偉大的費希爾對這一試驗諸多細節(jié)進行研究,最終形成了假設檢驗理論.

        2.4 假設檢驗的基本步驟

        ⅰ.建立假設:根據(jù)要求對參數(shù)設置原假設H0和備擇假設H1.如一對假設為

        原假設有簡單原假設和復雜原假設,相應的備擇假設也有簡單備擇假設和復雜備擇假設之分,其界限是考慮到假設里面θ0和θ1所包含的點的個數(shù).因而整個假設又有雙側假設和單側假設之分.

        ⅱ.選擇檢驗統(tǒng)計量,給出拒絕域形式:記W為檢驗的拒絕域,而Wˉ為檢驗的接受域.

        ⅲ.選擇顯著性水平:一個是α,稱犯第一類錯誤(也稱棄真錯誤)的概率;另一個是β,稱犯第二類錯誤(也稱納偽錯誤)的概率.

        ⅳ.確定拒絕域:根據(jù)假設單側或雙側檢驗,給出相應的拒絕域.

        ⅴ.進行判斷:通過樣本觀測值,觀察相應參數(shù)值是否落在給出的拒絕域內.

        2.5 假設檢驗 p 值與 α 的關系

        (1)檢驗的p值:一個假設檢驗問題中,利用樣本觀測值能夠作出拒絕原假設H0的最小顯著性水平.每一個假設檢驗問題都對應一個確定的p值.

        (2)檢驗的p值與人們心目中的顯著性水平α進行比較可以對假設檢驗做出判斷:

        ⅰ.若α≥p,則拒絕原假設.

        ⅱ.若α

        3 理論論證

        3.1 區(qū)間估計和假設檢驗的統(tǒng)計學意義

        區(qū)間估計主要是根據(jù)一個樣本的觀測數(shù)據(jù)得到參數(shù)的估計范圍,在這個范圍內,參數(shù)落在區(qū)間中的概率已知(一般人為給出),不僅能夠很直觀的檢驗對未知參數(shù)所做的點估計的準確性,也可以在大樣本的情況下對參數(shù)進行估計,所得到的估計值應落于所得到的區(qū)間內;而假設檢驗首先則主要是對總體參數(shù)做出一個假設,然后利用樣本信息和相關檢驗統(tǒng)計量的分布特征去檢驗這個假設,最終做出是否接受原假設的結論.如此看來,區(qū)間估計和假設檢驗在主要功能方面還是有交叉之處,都可以對參數(shù)的準確性進行判定.但要說明的是,假設檢驗是統(tǒng)計推斷中的一項重要內容,它是根據(jù)原有資料作出一個對總體指標的限定,某一隨機變量是否服從某種概率分布的假設,然后利用樣本數(shù)據(jù),采用合理的統(tǒng)計方法,計算出相關假設的檢驗統(tǒng)計量,然后依據(jù)小概率事件原理,以較小的風險度去判斷估計值與總體值是否存在顯著差異,是否應當接受原假設的一種檢驗方法.但是,在面對樣本指標和總體指標時,一味地用樣本指標去估計總體指標,其結果并非完全可靠,換句話說,對于諸多假設檢驗問題,不同問題具有不同程度上的可靠性,需要我們進一步對檢驗結果去加以檢驗和論證.通過對問題的檢驗,對樣本指標與總體指標之間是否存在差異作出正確的判斷,是否應該接受原假設.當然,這里也必須明確,進行假設檢驗的目的不是驗證樣本指標本身是否出錯,而是為了分析樣本指標與總體指標之間是否存在顯著差異.從這個實際意義出發(fā),假設檢驗又稱為顯著性檢驗,這在統(tǒng)計學意義上與區(qū)間估計有所不同.區(qū)間估計重在估計,是參數(shù)估計的一項重要內容,它為總體參數(shù)服務,但凡數(shù)理統(tǒng)計書中,首先總是會引入統(tǒng)計量的概念,讓學者們第一時間弄懂統(tǒng)計量的相關知識,其目的在于對一些深層次問題進行統(tǒng)計推斷,而在實際生活中,我們往往會向眾多分布中的未知參數(shù)靠近,這樣一來,區(qū)間估計出現(xiàn)也不足為奇了.

        3.2 區(qū)間估計和假設檢驗應用

        區(qū)間估計不僅是統(tǒng)計推斷中的重要內容,也可以應用于抽樣推斷.根據(jù)區(qū)間估計和假設檢驗的定義以及步驟來看,對于這兩種統(tǒng)計推斷方法,在應用領域方向,不僅僅是書本上的理論推理,現(xiàn)實中也可以運用于科學研究、醫(yī)療衛(wèi)生、金融投資等各個方面.但是若真要比較兩種方法的用途誰廣泛,還真得分類討論.對于區(qū)間估計來說,它是一個非常依賴樣本信息的一種推斷方法,樣本信息包含越全面、越準確,得到的置信區(qū)間也就越精確,這樣一來,便對研究者提出了要求,如果樣本信息量足夠說明真實情況,此時使用區(qū)間估計便沒什么問題.對于假設檢驗而言,首先在人們拿到一個假設檢驗時,必須根據(jù)需要設置一對假設,原假設H0和備擇假設H1,然后根據(jù)得到的數(shù)據(jù)信息,對假設進行判斷.然而,假設檢驗人為的確定的假設必須要避免偏差,否則會對結果產(chǎn)生巨大影響,甚至可能導致判斷偏差.假設檢驗一般而言是研究者偏向于拒絕域進行統(tǒng)計推斷方法,由于原假設與樣本信息無多大關系,故而假設檢驗對樣本信息的敏感度沒有區(qū)間估計那般強烈.綜上,區(qū)間估計和假設檢驗的應用各有側重,當研究者所研究的問題需要確切的樣本信息時,這時候選擇區(qū)間估計較好;當研究者所研究的問題需要較多非樣本信息(如前人經(jīng)驗、無法看做樣本信息的信息)時,建議選用假設檢驗.

        3.3 區(qū)間估計和假設檢驗的區(qū)別

        (1)區(qū)間估計屬于參數(shù)估計的一種,參數(shù)估計是以樣本數(shù)據(jù)為基礎,進而去準確的估計總體參數(shù)的確定值;然而假設檢驗則是以樣本數(shù)據(jù)的相關信息去檢驗總體參數(shù)原始假設是否成立.

        (2)區(qū)間估計事先需要給定一定概率(也稱置信水平),區(qū)間估計要求概率越大越好,得到的估計區(qū)間會更加精確;而假設檢驗是在小概率原理上立足的,最終所求的概率p值越小越顯著.

        (3)區(qū)間估計最終得到的是雙側置信區(qū)間;而假設檢驗會根據(jù)題意確定雙側檢驗或者單側檢驗.

        3.4 區(qū)間估計和假設檢驗的聯(lián)系

        通過下文區(qū)間估計和假設檢驗應用舉例可以看出,區(qū)間估計所使用的樞軸量與假設檢驗所使用的檢驗統(tǒng)計量是一樣的.這是為什么呢?現(xiàn)從假設檢驗的右側、左側、雙側分三種情況進行討論(假設σ已知,樣本為x1,x2,...,xn來自正態(tài)總體N(μ,σ2):

        3.4.1 右側檢驗

        3.4.2 左側檢驗

        3.4.3 雙側檢驗

        綜上所述,正態(tài)總體參數(shù)的置信區(qū)間與假設檢驗問題的檢驗存在非常密切的聯(lián)系,樞軸量與檢驗統(tǒng)計量的相同不是偶然,而是這兩種統(tǒng)計推斷方法中存在一一對應關系,兩種問題可以相互轉化,假設檢驗問題能夠成為區(qū)間估計問題,區(qū)間估計也能夠成為假設檢驗問題.

        3.5 區(qū)間估計和假設檢驗的誤區(qū)

        3.5.1 置信區(qū)間誤區(qū)

        以下文例1 為例,有些熟悉區(qū)間估計定義的人可能會說:“題中得到的95% 置信區(qū)間為[12.282,12.518],它是以0.95 的概率覆蓋總體均值(即題目中的平均長度)”,其實,仔細琢磨,這種說法欠妥.為什么呢?因為在這里,如果換成是在大量樣本中得到的置信區(qū)間,只能說大約95%會覆蓋總體均值,題目中只是由一個樣本得到的置信區(qū)間,到底包含或者不包含總體均值,沒有概率可言.我們都知道,總體均值其實是一個固定的數(shù)值,而求得的置信區(qū)間也是一對固定的數(shù)值,這里不存在隨機變量,故而不可能存在覆蓋的概率,最初的隨機區(qū)間一旦實現(xiàn),就變成了兩個固定數(shù)字,便失去了隨機性,進而也無法談及概率.

        3.5.2 假設檢驗誤區(qū)

        (1)大家都知道,做假設檢驗的目的是從假設中找到需要的答案,所以說拒絕原假設的顯著性水平α的選擇很重要[6].拋開書本理論,選擇α時必須與實際問題相結合,具體問題具體分析,課程當中的例子過于理想化,很多影響問題的敏感因素都未曾給出,但是在實際生活中往往缺乏可信度.比如警察在通過DNA 或者指紋去判斷作案兇手、血緣關系時,對于這種非常敏感的問題,α取值稍微過大,都會使得到的結果可信度大打折扣,此時α應該是一個非常小的數(shù).相反,如果實際要求α不宜過小,α就應該取相對大,否則,一些大的影響因素可能就會錯過.總之,α的大小選擇并不能簡單的全默認看成是0.01、0.05、0.1,應該靈活處理.

        (2)通常我們在面對假設檢驗結果的時候,認為落入了拒絕域,則表示拒絕原假設,這個判斷沒有錯誤;但是反之,當我們不能拒絕原假設的時候,很多人就會很自然的認為應該接受原假設,這便是不夠嚴謹了.舉一個例子如下:判斷一個罪犯是小偷,設置原假設為H0:不是小偷,備擇假設H1:是小偷.當在小偷身上或家里發(fā)現(xiàn)別人的東西,在幾乎不太可能( )p→0有一模一樣的東西的前提下,這時候就拒絕原假設:不是小偷,認為他是小偷.當在小偷身上或家里沒有發(fā)現(xiàn)別人的東西,就說明沒有證據(jù)說明拒絕原假設:不是小偷,但是這不能說明小偷從未偷過東西,只是證據(jù)不足而已.因此,證據(jù)不足接受原假設和實際上就接受原假設是有差別的.

        4 例題論證:區(qū)間估計和假設檢驗關系舉例

        例:某公司規(guī)定一批零件直徑為10cm時為合格,現(xiàn)在隨機抽取50 個零件作為樣本進行檢測,根據(jù)樣本數(shù)據(jù)顯示,得到樣本均值xˉ= 10.2,已知標準差為0.4,假設取α= 0.05,檢驗這批零件是否合格.

        (1)區(qū)間估計法

        (2)假設檢驗法

        根據(jù)題意設置假設 :H0:μ0= 10vsH1:μ0≠ 10 ,

        綜上可知,在同樣的顯著性水平下,區(qū)間估計和假設檢驗的結果一樣,說明這兩種方法可以相通.

        5 顯著性水平的進一步討論

        5.1 顯著性水平概念

        5.1.1 區(qū)間估計中

        顯著性水平是估計總體未知參數(shù)落在某一區(qū)間內的一個概率,也表示為可能犯錯誤的概率,一般用α表示,但是,通常以置信水平(1 ?α)為蓋住區(qū)間的概率而被我們事先給定.

        5.1.2 假設檢驗中

        根據(jù)人們做判斷時誤判的錯誤類型,將犯第一類錯誤概率(即棄真錯誤)叫做顯著性水平,用α表示 .

        5.2 兩者關系

        相同問題條件下,區(qū)間估計中1 ?α置信區(qū)間問題與顯著性水平為α的假設檢驗問題一一對應,且判斷結果相同.

        5.3 兩類錯誤的關系及深度探究

        假設檢驗過程中,在選擇顯著性水平時,引入了兩類錯誤:第一類錯誤(棄真錯誤),用α表示,第二類錯誤(納偽錯誤),用β表示.任何一個假設檢驗問題,我們不可能找到一個檢驗同時使這兩類錯誤都盡可能小,只能選擇其中一種錯誤,讓它盡可能小.書中引入功效函數(shù)[7]進行說明兩類錯誤的關系,結果是α與β中一個減小必然導致另一個增大,但是α+β并不一定等于1,且這個結論具有一般性.那么為什么要選擇α作為顯著性水平,而不是β呢?原因有以下幾點:

        (1)從心理學角度來看,第一類錯誤為棄真錯誤,認為本來原假設是真的,卻被拒絕,這會讓人懊悔不已;第二類錯誤為納偽錯誤,認為原假設不是真的,卻被接受,這種錯誤即使發(fā)生了,頂多就說判斷錯誤,或者說找“學藝不精”的理由,相對來說,犯第一類錯誤更不能讓人接受;從現(xiàn)實危害角度來看,犯第一類錯誤可能會產(chǎn)生巨大影響,它的不良后果會更加大于犯第二類錯誤,比如所有人都犯了第一類錯誤,后面人可能一直無法找到真的;相反,犯第二類錯誤之后,如果重新設計實驗便可能快速發(fā)現(xiàn)問題所在.

        (2)一般而言,第二類錯誤概率對具體參數(shù)要求頗高,相比較于α來說,β在不少場合不容易求出,產(chǎn)生β的原因多與實驗設計、樣本數(shù)據(jù)、處理效應等因素有關,α更容易被計算出.

        此處對顯著性水平的進一步分析并非偶然,而是通過對顯著性水平的了解,我們能夠對區(qū)間估計和假設檢驗的關系更加明確,雖說兩處定義不一樣,但是只有在α一定的情況下,研究區(qū)間估計和假設檢驗才有價值;再者顯著性水平的選擇存在很多誤區(qū),能夠很好的了解它,就能更好的學習假設檢驗.

        6 結論和建議

        從上述分析有如下結論:區(qū)間估計和假設檢驗可以應用于金融、醫(yī)藥、農(nóng)業(yè)等各個領域;區(qū)間估計問題和假設檢驗問題可以相互轉化;選擇區(qū)間估計和假設檢驗方法時應該觀察問題本身是否與樣本信息相關聯(lián);顯著性水平在兩種統(tǒng)計推斷方法起重要樞紐作用等.通過討論,可以看出這兩種統(tǒng)計推斷方法在理論和實際中的應用都非常復雜,日常生活中,有些人對兩種方法認識不夠,存在個別誤區(qū);在解決一個實際問題時,并未首先關注問題的實質,以致于容易犯錯.在處理任何一個問題時,均需要對兩種方法足夠熟悉,才能更好地避免犯錯.統(tǒng)計學作為一門學科,但并非是一門獨立的學科,它依賴于很多數(shù)學、計算機等專業(yè)知識;要想做好統(tǒng)計研究,必須具備豐富的專業(yè)知識以及較強的邏輯分析能力,不能一貫地參考經(jīng)驗,也不能一味地關注樣本本身,要學會具體問題具體分析.通過本文的討論,我們能夠對區(qū)間估計和假設檢驗這兩種推斷方法更加熟悉和了解,能夠將這兩種方法應用于一些實際問題之中.

        猜你喜歡
        假設檢驗置信區(qū)間區(qū)間
        解兩類含參數(shù)的復合不等式有解與恒成立問題
        你學會“區(qū)間測速”了嗎
        定數(shù)截尾場合三參數(shù)pareto分布參數(shù)的最優(yōu)置信區(qū)間
        p-范分布中參數(shù)的置信區(qū)間
        多個偏正態(tài)總體共同位置參數(shù)的Bootstrap置信區(qū)間
        列車定位中置信區(qū)間的確定方法
        統(tǒng)計推斷的研究
        時代金融(2017年6期)2017-03-25 12:02:43
        雙冪變換下正態(tài)線性回歸模型參數(shù)的假設檢驗
        Primary Question and Hypothesis Testing in Randomized Controlled Clinical Trials
        統(tǒng)計學教學中關于假設檢驗問題探討
        精品女人一区二区三区| 国产亚洲av片在线观看18女人| 午夜一级成人| 按摩师玩弄少妇到高潮hd| 国模91九色精品二三四| 极品少妇小泬50pthepon| 国内大量揄拍人妻在线视频| 欧美亚洲另类国产18p| 精品亚洲av乱码一区二区三区| 伊人精品久久久久中文字幕| 国产精品永久免费视频| 午夜在线观看有码无码| 久久久精品国产亚洲av网麻豆| 潮喷失禁大喷水aⅴ无码| 国产精品香蕉在线观看| 亚洲va中文字幕欧美不卡| 日本女优激情四射中文字幕| 妇女bbbb插插插视频| 欧美人成人亚洲专区中文字幕| 新久久久高清黄色国产| 国产一区二区三区天堂| 国产肥熟女视频一区二区三区| 国产免费av片在线观看播放| 日本一区不卡在线观看| 四虎成人精品在永久免费| 亚洲av无码第一区二区三区| 国产精品va在线观看一| 久久精品国产69国产精品亚洲| 亚洲婷婷五月综合狠狠爱| 国产nv精品你懂得| 日韩一二三四区免费观看| 欧美精品无码一区二区三区| 射死你天天日| 国产v精品成人免费视频400条| 日本不卡一区二区三区久久精品 | 久久久精品网站免费观看| а√天堂8资源中文在线| 欧美精品偷自拍另类在线观看| 精品视频在线观看一区二区有| 国产精品久久久在线看| 国产精品对白刺激久久久|