李秀清
摘 要:文章選取2014年我國(guó)分地區(qū)出版物發(fā)行網(wǎng)點(diǎn)數(shù)量的數(shù)據(jù),按照25%的經(jīng)驗(yàn)比例抽取了8個(gè)省市自治區(qū)作為樣本,分別運(yùn)用簡(jiǎn)單隨機(jī)抽樣、分層抽樣、PPS抽樣來(lái)估計(jì)2014年我國(guó)出版物發(fā)行網(wǎng)點(diǎn)總量。計(jì)算結(jié)果表明,PPS抽樣誤差率最小,估計(jì)精度最高,效果最好,簡(jiǎn)單隨機(jī)抽樣次之,分層抽樣的誤差率最高,估計(jì)效果最差。
關(guān)鍵詞:出版物發(fā)行;簡(jiǎn)單隨機(jī)抽樣;PPS 抽樣;分層抽樣;效果比較
本文根據(jù)我國(guó)2014年分地區(qū)出版物發(fā)行網(wǎng)點(diǎn)數(shù)量,應(yīng)用三種不同的抽樣估計(jì)方法,估計(jì)我國(guó)2014年出版物發(fā)行網(wǎng)點(diǎn)的總數(shù)量,以期對(duì)我國(guó)出版物發(fā)行狀況有一個(gè)更客觀、合理的反映。
一、簡(jiǎn)單隨機(jī)抽樣
簡(jiǎn)單隨機(jī)抽樣又稱純隨機(jī)抽樣,即從總體N(31)中抽取n(8)個(gè)樣本單位時(shí),總體中的每個(gè)單位具有相同的概率被抽中,也就是保證等概率。
(一)抽取原理。根據(jù)我國(guó)2014年各省市自治區(qū)出版物發(fā)行機(jī)構(gòu)的數(shù)據(jù),從31個(gè)總體中按照隨機(jī)原則抽取25%作為樣本,即下表所示的8個(gè)省市自治區(qū)。
(二)估計(jì)過(guò)程。文章的目的是用已抽取8個(gè)樣本地區(qū)的數(shù)據(jù)估計(jì)全國(guó)31個(gè)地區(qū)總的出版物發(fā)行網(wǎng)點(diǎn)數(shù),則n=8,N=31。
即總體平均數(shù)的估計(jì)值:
點(diǎn)估計(jì)量:
估計(jì)方差:
總體總量的估計(jì):
二、分層抽樣
分層抽樣是先將總體的單位按某種特征分為若干次級(jí)次級(jí)總體(層),然后再?gòu)拿恳粚觾?nèi)進(jìn)行單純隨機(jī)抽樣,組成一個(gè)樣本??梢蕴岣呖傮w指標(biāo)估計(jì)的精確度。分組減小了各抽樣層變異性的影響,抽樣保證了所抽取的樣本具有足夠的代表性。
(一)抽樣方法及原理
將我國(guó)31個(gè)省按地域分為中部、西部、東部,分別為:
中部:山西,吉林,黑龍江,安徽,江西,河南,湖南,湖北。
東部:北京,天津,河北,遼寧,上海,江蘇,浙江,福建,廣東,山東,海南。
西部:四川,重慶,貴州,云南,西藏,陜西,甘肅,寧夏,青海,新疆,廣西,內(nèi)蒙古。
按照等比例抽樣方法,從中部隨機(jī)抽取2個(gè)樣本,從西部和東部各隨機(jī)抽取3個(gè)樣本,樣本數(shù)據(jù)如表2所示:
(二)估計(jì)量
總體平均數(shù)的估計(jì)值:
三、PPS抽樣方法
(一)抽樣原理。PPS抽樣方法是指放回的按規(guī)模大小成比例的概率抽樣。它是一種使用輔助信息,從而使每個(gè)單位均有按其規(guī)模大小成比例的被抽中概率的一種抽樣方式。PPS是按概率比例抽樣,是指在多階段抽樣中,尤其在二階段抽樣中,初級(jí)抽樣單位被抽中的概率取決于其初級(jí)抽樣單位的規(guī)模大小,初級(jí)抽樣單位規(guī)模越大,被抽中的機(jī)率就越大;初級(jí)抽樣單位規(guī)模越小,被抽中的機(jī)率就越小。PPS抽樣就是將總體按一種準(zhǔn)確的標(biāo)準(zhǔn)劃分出容量不等的具有相同標(biāo)志的單位在總體中不同比率分配的樣本量進(jìn)行的抽樣。
將我國(guó)2013年各省發(fā)行網(wǎng)點(diǎn)合計(jì)數(shù)進(jìn)行升序排序后(從上至下依次為、 …)再累加并進(jìn)行編碼(1~、~ … ~),結(jié)果如表3所示:
(二)估計(jì)量
1、樣本單位的抽取。本文采用規(guī)模累計(jì)等距抽樣的方法,從N(31)個(gè)總體中抽取其25%的樣本即n(8)個(gè)樣本??傮w為我國(guó)分地區(qū)出版物發(fā)行網(wǎng)點(diǎn)的總數(shù),由上表可知總體的全距為1722307,由可得組距為21538(172307/8),在1~21538中隨機(jī)抽取一個(gè)數(shù)字12306,在編碼中找其所屬范圍及對(duì)應(yīng)的地區(qū);在前一個(gè)隨機(jī)數(shù)的基礎(chǔ)上加組距21538再找其所屬范圍及對(duì)應(yīng)省份;依次類推,抽取的樣本分別為山西、福建、遼寧、山東、上海、北京、浙江、江蘇。如表4所示:
2、估計(jì)量
根據(jù)公式 及 得:
字母含義: :2014年我國(guó)分地區(qū)出版物發(fā)行網(wǎng)點(diǎn)估計(jì)總量; :2013年我國(guó)各省出版物發(fā)行網(wǎng)點(diǎn)在全國(guó)發(fā)行網(wǎng)點(diǎn)中所占的比重;:估計(jì)的2014年我國(guó)各省出版物發(fā)行網(wǎng)點(diǎn)的方差
四、估計(jì)效果的比較
由表5可知,對(duì)我國(guó)出版物發(fā)行網(wǎng)點(diǎn)總量進(jìn)行估計(jì),得出PPS抽樣的估計(jì)精度最高,為97.3%;簡(jiǎn)單隨機(jī)抽樣的次之,為77.27%;分層抽樣的估計(jì)精度最低,僅為51.86%。
參考文獻(xiàn):
[1]王虎屏.新形勢(shì)下的城鄉(xiāng)出版物發(fā)行網(wǎng)點(diǎn)建設(shè)[A].新形勢(shì)下的城鄉(xiāng)出版物發(fā)行網(wǎng)點(diǎn)建設(shè)[C].2013:4.
[2]姚貞.出版物發(fā)行網(wǎng)點(diǎn)建設(shè)必須納入公共服務(wù)設(shè)施規(guī)劃[N].中國(guó)新聞出版報(bào),2011-07-21(004).
[3]張玉.PPS抽樣方法在我國(guó)出口貿(mào)易預(yù)測(cè)中的應(yīng)用[J].經(jīng)濟(jì)研究導(dǎo)刊,2011(2):156-157.
[4]中華人民共和國(guó)國(guó)家統(tǒng)計(jì)局.中國(guó)統(tǒng)計(jì)年鑒—2015[M].北京:中國(guó)統(tǒng)計(jì)出版社,2015.