亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

參考值范圍樣本量估計中參數(shù)的適度性研究

2019-11-12 12:24:10重慶醫(yī)科大學公共衛(wèi)生與管理學院醫(yī)學與社會發(fā)展研究中心健康領域社會風險預測治理協(xié)同創(chuàng)新中心400016

中國衛(wèi)生統(tǒng)計 2019年5期

重慶醫(yī)科大學公共衛(wèi)生與管理學院/醫(yī)學與社會發(fā)展研究中心/健康領域社會風險預測治理協(xié)同創(chuàng)新中心(400016)

夏萬元鐘曉妮陶浩陳茜賴敏清田考聰△

【提要】目的探討Troendle和Jennen-Steinmetz提出的參考值范圍樣本量計算方法的適用條件及參數(shù)合適取值范圍。方法通過計算機模擬，研究樣本量計算方法的可用性和相關參數(shù)變化時樣本量的變化情況。結果 Jennen-Steinmetz提出的樣本量計算方法中模擬計算的統(tǒng)計量η能較好滿足研究設計的精度要求，容許誤差δ小于0.003時，估計樣本量出現(xiàn)迅速上升。Troendle的標準中新構建統(tǒng)計量r小于0.02時，樣本量需求出現(xiàn)迅速上升。根據(jù)模擬樣本量估計結果，我們認為參數(shù)δ和r的適宜取值范圍分別為0.002～0.015和0.01～0.12。結論當前樣本量計算方法能一定程度上解決參考值范圍計算時樣本量估計問題。但是該方法還需要進一步完善改進。

國內(nèi)外的統(tǒng)計學家及醫(yī)學專家都提出了一系列的參考值范圍估計方法以及校正方法[1-3]。但是對于制定參考值范圍需要的樣本量卻鮮有提及。在國內(nèi)，有研究者在研究多元參考值范圍的估計時提出了樣本量不應小于100的標準[4]。1987年Linnet等[5]針對正態(tài)分布和對數(shù)正態(tài)分布提出了相應的樣本量標準，但是并未給出具體的樣本量估計公式。另外，在2003年Troendle等[6]的研究中針對正態(tài)分布資料的雙側參考值范圍提出了一種可調(diào)標準。2005年Jennen-Steinmetz[7]在Linnet的基礎上對一種新的樣本量估計方法進行探索，該方法對于單側和雙側的參考值范圍樣本量估計均適用。

本文主要對Troendle和Jennen-Steinmetz提出的參考值樣本量估計方法的適用條件以及參數(shù)取值范圍進行探索和討論。并在此基礎上對參考值范圍樣本量計算方法的研究提出一些思考。

樣本量計算公式

Jennen-Steinmetz在2005年提出了一種參考值范圍樣本量估計方法，根據(jù)樣本量估計方法中參考值范圍界值之外的人群比例(ψs)滿足指定的容許誤差δ的要求進而推導出相應的樣本量估計公式。

基于參數(shù)方法的樣本量估計公式

(1)

(2)

基于非參數(shù)方法的樣本量估計公式

n=((1+q)(1-q)/4)(z(1+η)/2/δ)2

(3)

n=q(1-q)(z(1+η)/2/δ)2

(4)

Troendle在2003年的研究中根據(jù)分位數(shù)的90%置信區(qū)間寬度和參考值范圍之間的比例，確定了一個針對于正態(tài)分布雙側參考值范圍的一般標準。

Troendle的研究中對于正態(tài)分布雙側參考值范圍的一般標準公式為

(5)

公式中各個參數(shù)的解釋：

n指所需樣本量；zg、z(1+η)/2、z(1+q)/2和z(1-q)/2為正態(tài)分布下，其對應的臨界值；q指參考值范圍的百分數(shù)；φ(z(1+q)/2)和φ(zq)為標準正態(tài)分布下對應的密度函數(shù)值；η為ΨΩ與ψs差值小于等于容許誤差δ的概率(即P{|ΨΩ-ψs|≤δ}=η，ΨΩ：指總體中參考值范圍理論上界或下界之外的人群所占的比例(單側時為1-q，雙側時為(1-q)/2)，ψs：指總體中在實際樣本參考值范圍的上界或下界之外的人群所占的比例)；δ為ΨΩ與ψs之差的最大可接受值；r指端點分位數(shù)的90%置信區(qū)間寬度和參考值范圍寬度之間的比例。

研究方法

在Jennen-Steinmet的估計方法中η是一個核心參數(shù)，它在實際抽樣中的大小可以幫助我們判斷該樣本是否符合研究設計的精度要求。故本文中的計算機模擬是對Jennen-Steinmetz的估計方法中η在真實研究時能達到的估計值進行計算機模擬估計。

計算參考值范圍所需樣本量大小取決于參考值范圍的寬度q、η和容許誤差δ。這三個值均可在研究設計之初，根據(jù)醫(yī)學指標的專業(yè)特性和統(tǒng)計學原則指定，進而估計研究所需的理論最小樣本量。本文在模擬過程中按照該理論樣本量抽出的樣本情況與總體間的差異能否滿足設定誤差δ的概率為η。計算機試驗通過多次模擬抽樣從而估計出實際抽樣能達到的η值。

根據(jù)參數(shù)η和δ在其理論取值范圍內(nèi)，進行等距取值，計算相應情況下樣本量。根據(jù)樣本量的變化情況來探索兩個新參數(shù)在不同情況下的合適取值范圍。此外，本文還采用SAS宏和R函數(shù)形式對相應的公式進行編譯，便于研究者計算使用。

計算機模擬思路

1.正態(tài)分布的模擬：

由于一般正態(tài)分布均可轉化為標準正態(tài)分布，故參數(shù)分布采用標準正態(tài)分布作為抽樣總體進行模擬。

以下為計算機模擬步驟：

(1)根據(jù)各個參數(shù)的設定值，按照參數(shù)方法的樣本量估計公式，估計需要的最小樣本量

(2)按照估計的最小樣本量，在標準正態(tài)分布下隨機抽樣

(3)根據(jù)抽樣結果算出相應的參考值范圍界值

(4)估計界值之外的人群所占的比例(ψs)

(5)差值|ΨΩ-ψs|為該樣本的抽樣誤差

(6)若差值的絕對值小于δ，則記為1

(7)統(tǒng)計1000次試驗結果為1的次數(shù)，這個次數(shù)除以1000即為η

(8)重復3～7個步驟100次，計算η的平均值，即為最終的η

2.非正態(tài)分布的模擬：

非參數(shù)采用樣本量公式推導時使用的是次序統(tǒng)計量的分位數(shù)估計。由于次序統(tǒng)計量的分位數(shù)分布服從參數(shù)為(n+1)(1-q)和n+1-(n+1)(1-q)的Beta分布[8]，所以模擬時直接按樣本量和分位數(shù)在對應的Beta分布下抽樣，抽出的數(shù)值即為真實世界中一次抽樣中樣本參考值范圍界值之外的人群所占總體人群的比例(ψs)。

以下為計算機模擬步驟：

(1)根據(jù)各個參數(shù)的設定值，按照非參數(shù)方法的樣本量估計公式，估計需要的最小樣本量

(2)按照取定的q和最小樣本量n的值用對應的Beta分布B((n+1)(1-q)/2,n+1-(n+1)(1-q))進行模擬(區(qū)間對稱時，在分布B((n+1)(1-q)/2,n+1-(n+1)(1-q)/2中抽取一個隨機值(即為：ψs))

(3)差值|ΨΩ-ψs|為該樣本的抽樣誤差

(4)若差值的絕對值小于δ，則記為1

(5)統(tǒng)計1000次試驗結果為1的次數(shù)，這個次數(shù)除以1000即為η

(6)重復2～5個步驟100次，計算η的平均值，即為最終的η

結果

表1是根據(jù)Jennen-Steinmetz在2005年提出的樣本量估計方法(公式：(1)、(2)、(3)、(4))，根據(jù)不同的參數(shù)q、η和δ在不同假設值情況下所需的樣本量并通過模擬試驗估計出的實際η。結果顯示，在各個參數(shù)的不同水平取值下，模擬抽樣中的η與估計公式中的預設值都比較接近甚至能超過預設值的要求。最小樣本量除了受到容許誤差δ的影響外，還受到q、參考值范圍的單雙側和估計方法的影響。當q的取值從0.90變化到0.95，其他參數(shù)和情況相同時樣本量的增加量基本在一倍左右。在其他參數(shù)相同時，參數(shù)方法與非參數(shù)方法相比或單側參考值范圍與雙側參考值范圍相比，其樣本量的變化情況也類似。

圖1為根據(jù)Jennen-Steinmetz在2005年提出樣本量估計方法(公式：(1)、(2)、(3)、(4))，在預設η為0.9，q為0.95時。不同的容許誤差要求(即：δ的不同取值情況)下樣本量需求的變化情況。針對相同的容許誤差非參數(shù)方法相對于參數(shù)方法而言會較大地增加樣本量的需求。參數(shù)單側和非參數(shù)雙側的樣本量變化趨勢基本一致。在δ小于0.003時，最小樣本量隨δ的變小迅速增大。

表2是根據(jù)Troendle(公式(5))在2003年提出的標準中r在不同取值情況下估計目的指標0.90，0.95和0.99參考值范圍所需要的最小樣本量。本文估計了r取值從0.01到0.5的理論樣本量估計情況，考慮到實際工作中可能涉及的樣本量范圍的合理性，羅列了其中的一部分。從結果中可以看出，r>0.16時樣本量均小于一般推薦值(一般推薦樣本量不應小于100[4])。r<0.03時，隨著r的進步縮小，樣本需求迅速增大。

表1 參數(shù)q、β和δ在不同取值情況下的樣本量需求及其模擬η

圖1 不同的容許誤差(δ)要求下樣本量需求的變化情況(固定η=0.9，q=0.95)

表2 r不同取值情況下所需要的最小樣本量

圖2為參考值范圍樣本量估計時需要考慮的一般流程，主要分為兩個方面，一方面是需要指定的參考值范圍是單側還是雙側。另一方面是研究的指標分布類型是否為參數(shù)分布。確定這兩方面的情況后，即可確定相應的樣本量估計公式。再根據(jù)公式確定相應的參數(shù)取值(r或q、δ和η)進行估計。我們在附件程序中提供了公式(1)～公式(5)估計的SAS和R程序，供讀者參考。

圖2 參考值范圍樣本量一般估計流程

討論

模擬驗證結果顯示通過重復抽樣計算的η基本能達到所計劃的預設值。在變換參數(shù)δ和r的計算中，我們計算了δ在0.001～0.03取值時其相應的樣本量在8～32000變化，r在0.01～0.30取值時其相應的樣本量在20～23523變化。結合實際科研工作中合理的樣本量范圍，建議δ的適宜取值范圍約在0.002～0.015。r的適宜取值范圍約在0.01～0.12。

根據(jù)圖1結果，我們對不同情況下Jennen-Steinmetz的公式中參數(shù)的取值范圍進一步討論，參數(shù)單側和非參數(shù)雙側的樣本量變化在容許誤差大于0.001時樣本量迅速下降，而小于0.003時需要的樣本量迅速增大。建議一般情況下容許誤差的選取可在0.3%～1%。參數(shù)雙側的樣本量在容許誤差大于0.75%時樣本量迅速下降，在小于0.2%時需要的樣本量迅速增大。建議一般情況下容許誤差的選取可在0.2%～0.75%考慮。非參數(shù)單側的樣本量在容許誤差大于0.75%時樣本量迅速下降，在小于0.2%時需要的樣本量迅速增大。建議一般情況下容許誤差的選取可在0.2%～0.75%。建議研究者可根據(jù)研究的實際要求，在此區(qū)間選擇合適的誤差容許范圍。η是估計樣本量時構建的一個新統(tǒng)計量，暫時沒有標準的取值范圍，一般情況η取0.9，但在實際研究過程中如果研究需要或者條件有限，可適當調(diào)整η的取值，但不應該低于0.8。另外，參考相關統(tǒng)計學教材[9-10]，q的取值一般為0.9或0.95。陳彬[4]等在相關研究中指出q的取值應不低于0.8。

對Jennen-Steinmetz方法的模擬結果中可知。在參考值范圍的研究過程中，應結合實際情況選取合適的參數(shù)，對于能轉換為正態(tài)分布的指標，應轉換后再進行樣本量估計和參考值范圍估計。此外應結合研究的實際可行性確定合適q和δ值以及其他影響因素，以期望指標能盡可能真實地反應“正常”人群當前的情況。

Jennen-Steinmetz法也有一些不足的地方，醫(yī)學研究的樣本量估計思想一般是在統(tǒng)計假設的基礎上為滿足統(tǒng)計的準確性和可靠性來進行估計，但Jennen-Steinmetz研究并未考慮相關的統(tǒng)計假設，而是通過參考值范圍界值之外人群比例(ψs)的計算來估計樣本量。導致公式中的相關指標η難以用經(jīng)典的統(tǒng)計標準解釋。增加了公式的理解難度。此外，在雙側參考值范圍計算時根據(jù)參考值范圍的對稱性，文中的公式僅考慮了一側的參考值范圍界值之外的人群比例。但由于抽樣誤差的存在這個范圍寬度是不對稱的。所以該公式可能低估雙側參考值范圍的樣本需求量。

Troendle提供的參考值范圍樣本量需求的一般標準(即公式5)是使用參考值范圍端點值的90%置信區(qū)間長度與參考值范圍的長度的比值構建了一個新的統(tǒng)計量r。然后根據(jù)研究的精度要求對r的取值規(guī)定估計出所需的樣本量n，需要注意的是r并非一個隨機變量，不會因為抽樣不同而改變。該方法要求參考值范圍要為雙側對稱。此方法并不適用于單側參考值范圍樣本量需求的估計。此公式在構建統(tǒng)計量r時，只考慮到了樣本本身的情況，并沒有很好的度量樣本數(shù)據(jù)與總體之間的抽樣誤差。此外，該方法估計的樣本量是能使樣本參考值范圍端點值的90%置信區(qū)間長度與參考值范圍的長度的比值小于預設的r值的確定樣本量，但并非最小樣本量。即按照該樣本量進行隨機抽樣的樣本，所估計的比值必然小于r。另外，端點值90%置信區(qū)間長度，只是取了常用的90%置信區(qū)間，如果取其他置信區(qū)間長度時計算公式將會隨之變化。因此，本文并未對Troendle的公式進行計算機模擬。

與Troendle的估計方法相比，Jennen-Steinmetz的估計方法引入了抽樣誤差的概念。并且更好地解釋了樣本和總體之間的關系，但其參數(shù)多，估計相對繁瑣，而Troendle的估計方法相對來說更加簡單。如果研究者已知指標的總體分布，不需要細致地衡量抽樣誤差或研究結果只需要在小范圍內(nèi)使用，則可以采用Troendle的樣本量估計方法。如果所研究的指標分布未知、需要制定單側參考值范圍、容易產(chǎn)生抽樣誤差或研究結果需要在較大范圍內(nèi)使用，則應該采用Jennen-Steinmetz的估計方法。

值得注意的是文中介紹的公式均只考慮了單一因素的參考值范圍的樣本量估計，對于采用回歸進行的參考值范圍估計或需要調(diào)整其他協(xié)變量的影響時，以上方法并不適用。此外，文中的方法均未使用任何樣本信息，這可能會低估變異很大的指標在計算參考值范圍時實際所需要的樣本量。綜上，當前的參考值范圍樣本量計算方法能為科學研究提供一定的參考，但還需要進一步的研究進行改進優(yōu)化，制定更完善的樣本量估計方法。

亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

參考值范圍樣本量估計中參數(shù)的適度性研究

樣本量計算公式

研究方法

計算機模擬思路

結 果

討 論

結果

討論