亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于推斷模型的Behrens-Fisher問題的精確檢驗

        2018-10-09 05:53:40梁成揚何美儀譚銀冰
        統(tǒng)計與決策 2018年17期
        關(guān)鍵詞:療效方法模型

        梁成揚,金 華,何美儀,譚銀冰

        (華南師范大學(xué) 數(shù)學(xué)科學(xué)學(xué)院,廣州 510631)

        0 引言

        非劣檢驗指主要研究目的是顯示對試驗藥的反應(yīng),在臨床意義上不差于(非劣于)對照藥的試驗。設(shè)A藥為待確證療效的試驗藥,B藥為對照藥,下同。非劣檢驗的假設(shè)檢驗如下:

        原假設(shè)H0:A藥療效-B藥療效≤-δ

        備擇假設(shè)H1:A藥療效-B藥療效>-δ

        如果p>0.05,按單側(cè)α=0.05的檢驗水準(zhǔn)不能拒絕H0假設(shè),即無法判斷A藥不差于B藥;如p≤0.05,則接受H1假設(shè),可認(rèn)為A藥不差于B藥。假設(shè)服用A藥的樣本為,服用B藥的樣本為上述非劣檢驗問題等價于:

        在統(tǒng)計學(xué)上,該問題也稱為Behrens-Fisher問題。

        針對上述問題,Welch[1,2]給出一種基于隨機(jī)自由度的近似方法(常稱為Welch近似t檢驗),他認(rèn)為檢驗統(tǒng)計量在原假設(shè)H成立時近似服從自由度

        0為l的t分布,其中自由度(非整數(shù)時四舍五入)。l=Scheffe[3](1970),Best 和Rayner(1987)[4],以及 Moserb和Stevensg(1989)[5]都認(rèn)為:如果既要考慮檢驗的無偏性,又要兼顧實際應(yīng)用的方便,Welch近似t檢驗或許是最好的方法,因為它只需t分布表,而Welch-Aspin檢驗的臨界值計算相當(dāng)麻煩?,F(xiàn)在的大學(xué)教科書大都采用Welch近似t檢驗這種方法[6,7]。但是該方法下的檢驗結(jié)果不能很好地控制住第一類錯誤。

        最近學(xué)術(shù)界提出了一種新的推斷體系,稱為推斷模型(Inferential Model,簡記為IM)體系,而IM體系來源于對置信及其拓展——信仰函數(shù)的Dempster-Shafer理論的探討。IM的原創(chuàng)基本思想來自Martin等[8]、Zhang和Liu[9]以及Zhang[10]文中提出的對Dempster-Shafer理論修正。推斷模型方法發(fā)表在國際統(tǒng)計學(xué)最頂尖的雜志Journal of the American Statistical Association和Journal of the Royal Statistical Society上,所以基于IM模型,下面給出精確檢驗方法。而且通過模擬驗證,基于IM模型的方法可以控制住第一類錯誤,比Welch近似t檢驗好。

        1 基于推斷模型的方法

        對于此問題,可以轉(zhuǎn)化為對斷言A={μ1-μ2:μ1-μ2≤-δ}={μ:μ≤-δ}的推斷,其中μ1-μ2=μ

        根據(jù)文獻(xiàn)[11,12],得到條件聯(lián)結(jié)模型:

        其中輔助變量為ω=FD(T)且ω~U(0 ,1),FD(·)為給定樣本X1,X2,...,Xn1,Y1,Y2,...,Yn2后T的條件分布函數(shù)。

        (P步) 對斷言A來說,輔助變量ω的隨機(jī)預(yù)測集是:

        (C步) 組合ΘZ(ω)和S得到μ的隨機(jī)預(yù)測集:

        于是斷言A的可能性函數(shù)為:

        此方法是有效的(證明略),但由于FD(·)給定樣本后的條件分布函數(shù),此分布的概率密度函數(shù)是未知的,從而無法直接計算plZ(A)的值,故需要利用計算機(jī)模擬計算其估計值:

        給定X1,X2,...,Xn1,Y1,Y2,...,Yn2后,分別產(chǎn)生n個t1與t2隨機(jī)數(shù),其中t1~t(n1-1),t2~t(n2-1),記m為T≤-+δ的個數(shù),利用頻率估計概率的方法,得:

        則plZ(A)的估計值為:

        但是,為了確保估計的精度,即:

        對于給定的最大允許誤差,需要重復(fù)的次數(shù)大約為:

        然而此估計值并不是plZ(A)的真實值,當(dāng)p?≤α?xí)r,并不意味著有plZ(A)≤α。plZ(A)有95%的概率落在的置信區(qū)間上。為保證精度與可信性,考慮到本文的非劣檢驗為右側(cè)檢驗,故使用做統(tǒng)計推斷。這里,本文選擇n=10000。

        2 模擬實驗及結(jié)果

        2.1 實驗結(jié)果

        為比較小樣本情形下Welch近似t檢驗和基于推斷模型的新方法的第一類錯誤,本文利用R語言編程進(jìn)行隨機(jī)模擬。

        為考察兩種方法的第一類錯誤,取顯著性水平α=0.05,重復(fù)試驗200000次,則其置信水平為95%的置信區(qū)間為(4 .904%,5.096% )。

        2.2 結(jié)果分析

        根據(jù)模擬結(jié)果來看,在樣本量不等的小樣本情況下,Welch近似t檢驗的第一類錯誤率大部分(58.3%)都超過了預(yù)先指定的顯著性水平α=0.05的置信上限;只有在樣本量相同的情況下,頻率方法才可以控制第一類錯誤。而在本文模擬的所有情況下,推斷模型的第一類錯誤率都較為接近5%,表明推斷模型方法能保證控制第一類錯誤。對于功效,推斷模型方法與Welch近似t檢驗相差不大,比較接近。

        綜上,在樣本量不等的情況下,推斷模型方法要比Welch近似t檢驗優(yōu),而在樣本量相等的情況下,兩種方法相差不大。

        3 總結(jié)

        本文提出了基于推斷模型的非劣檢驗的新方法,通過比較頻率方法的Welch’s近似t檢驗,發(fā)現(xiàn)推斷模型有重要的應(yīng)用價值,它可以完全控制第一類錯誤,不需要大量重復(fù)試驗就可以得到理想的結(jié)果,這對醫(yī)學(xué)藥效檢驗具有重大意義。然而,推斷模型的結(jié)果較為保守,難以作出精確的判斷,還是需要對具體問題進(jìn)行具體分析。本文總結(jié)的這個推斷模型方法可以為實證研究人員提供一些參考,可以嘗試應(yīng)用在醫(yī)學(xué)藥效檢驗的領(lǐng)域中。

        表1 Welch近似t檢驗(T)和推斷模型(IM)的第一類錯誤模擬比較

        猜你喜歡
        療效方法模型
        一半模型
        重要模型『一線三等角』
        止眩湯改良方治療痰瘀阻竅型眩暈的臨床療效觀察
        重尾非線性自回歸模型自加權(quán)M-估計的漸近分布
        冷噴聯(lián)合濕敷甘芩液治療日曬瘡的短期療效觀察
        中西醫(yī)結(jié)合治療慢性盆腔炎的療效觀察
        可能是方法不對
        3D打印中的模型分割與打包
        用對方法才能瘦
        Coco薇(2016年2期)2016-03-22 02:42:52
        四大方法 教你不再“坐以待病”!
        Coco薇(2015年1期)2015-08-13 02:47:34
        亚洲国产精品综合久久网络| 无码三级国产三级在线电影| 亚洲最大的av在线观看| 亚洲精品国产精品乱码视色| 精品国产拍国产天天人| 精品国产高清a毛片无毒不卡 | 亚洲va精品va国产va| 亚洲av老熟女一区二区三区| 久久久亚洲精品一区二区三区| 国产精品免费久久久久影院| 成人精品免费av不卡在线观看| 国产69精品麻豆久久| av中文字幕潮喷人妻系列| 久久国产精品无码一区二区三区| 日本国产在线一区二区| 少妇又色又爽又高潮在线看| 亚洲熟妇少妇任你躁在线观看无码| 国产福利午夜波多野结衣| 魔鬼身材极品女神在线| 青青草国产在线视频自拍| 伊人久久大香线蕉av一区| 久久精品国产亚洲不av麻豆| 翘臀诱惑中文字幕人妻| 日本边添边摸边做边爱喷水 | 一区二区三区四区在线观看日本| 无码人妻人妻经典| 国产精品亚洲欧美天海翼| 亚洲产在线精品亚洲第一页| 精品无码国产一区二区三区麻豆| 欧美亚洲日本国产综合在线| 在线亚洲AV成人无码一区小说| 成人国产一区二区三区av| 国产免费爽爽视频在线观看| 欧美自拍区| 国产激情免费观看视频| 日韩综合无码一区二区| 久久综合精品国产丝袜长腿| 亚洲国产免费公开在线视频| 国产亚洲成人精品久久| 亚洲色丰满少妇高潮18p| 久久亚洲成a人片|