[摘 要] stata是一款強(qiáng)大的統(tǒng)計(jì)軟件,本文利用stata10進(jìn)行審計(jì)抽樣。首先利用stata10確定屬性抽樣和變量抽樣的樣本規(guī)模,其次利用stata10創(chuàng)建隨機(jī)數(shù)表和進(jìn)行等距抽樣。
[關(guān)鍵詞] 統(tǒng)計(jì)軟件stata
現(xiàn)代統(tǒng)計(jì)軟件如Eviews、spss、sas、stata等具有強(qiáng)大的功能,不僅能夠進(jìn)行回歸等數(shù)據(jù)分析,也可以在審計(jì)抽樣中大顯身手。在審計(jì)抽樣過程中,樣本規(guī)模的確定和如何抽樣是兩個(gè)重要的問題,本文應(yīng)用stata10來(lái)解決上述兩個(gè)方面的問題。
一、運(yùn)用stata確定抽取樣本的規(guī)模
根據(jù)審計(jì)測(cè)試的目的,可以把審計(jì)抽樣分為屬性抽樣和變量抽樣。由于屬性抽樣和變量抽樣的計(jì)算方法不同,具體運(yùn)用stata確定樣本規(guī)模時(shí)也不同。
1.運(yùn)用stata確定屬性抽樣的樣本規(guī)模
對(duì)于屬性抽樣樣本規(guī)模的確定,可以利用統(tǒng)計(jì)模型建立屬性抽樣樣本規(guī)模公式,即,其中n為樣本規(guī)模,t為可靠程度正態(tài)標(biāo)準(zhǔn)差(統(tǒng)計(jì)中用Z1-α表示),p為預(yù)計(jì)總體偏差率,E為精確度。假設(shè)t=1.96、p=0.36、E=0.04,在stata10中,我們可以輸入以下命令來(lái)確定樣本規(guī)模(>號(hào)后面為命令,在stata10中不用輸入“>”符號(hào),下同):
>input t(輸入變量t)
>1.96(輸入t的值)
>end (輸入t值結(jié)束)
>input p (輸入變量p)
>0.36 (輸入p的值)
>input E (輸入變量E)
>0.04 (輸入E的值)
>gen n=t^2*p*(1-p)/(E^2) (產(chǎn)生變量n)
>list(查看結(jié)果)
輸出結(jié)果如圖1所示:
Input為輸入變量的命令,當(dāng)?shù)谝粋€(gè)變量輸入結(jié)束時(shí)用end命令,產(chǎn)生新的變量用gen命令,而產(chǎn)生的新變量和原有變量的關(guān)系即為新變量的計(jì)算表達(dá)式,list命令則是查看結(jié)果的命令,利用此命令即可在stata10的結(jié)果區(qū)看到最終結(jié)果。圖1即為輸出的最終結(jié)果,其中變量t、p、E是根據(jù)假設(shè)輸入的,而n則是stata10根據(jù)輸入的變量計(jì)算得出。
2.運(yùn)用stata確定變量抽樣的樣本規(guī)模
對(duì)于變量抽樣樣本規(guī)模,我們將變量抽樣樣本規(guī)模公式定義為:,其中,n為初始樣本規(guī)模,SD為預(yù)先估計(jì)的標(biāo)準(zhǔn)差,ZA為可接受得誤受風(fēng)險(xiǎn)的置信系數(shù),ZR為可接受的誤拒風(fēng)險(xiǎn)的置信系數(shù),N為總體容量,TM為總體可容忍錯(cuò)報(bào),E為估計(jì)的總體錯(cuò)報(bào)點(diǎn)估計(jì)值。假設(shè)SD=20、ZA=1.28、ZR=1.15、N=4000、TM=21000、E=1500,可以采用以下命令得到樣本規(guī)模n:
>input SD
>20
>end
>input ZA
>1.28
>input ZR
>1.15
>input N
>4000
>input TM
>21000
>input E
>1500
>gen n=(SD*(ZA+ZR)*N/(TM-E))^2
>list
輸出結(jié)果如圖2所示:
在圖2中,SD、ZA、ZR、N、TM和E均為輸入的變量,而n是我們需要計(jì)算的抽樣規(guī)模。在這個(gè)例子中,我們計(jì)算的抽樣規(guī)模為99.38556,約為100個(gè)樣本。
二、運(yùn)用stata進(jìn)行抽樣
進(jìn)行審計(jì)抽樣時(shí),在確定樣本規(guī)模的基礎(chǔ)上,經(jīng)常采用隨機(jī)選樣或者等距選樣的方法抽取樣本。利用stata可方便地創(chuàng)建隨機(jī)數(shù)表,也可以等距選擇樣本。
1.創(chuàng)建隨機(jī)數(shù)表
隨機(jī)選樣是指對(duì)審計(jì)對(duì)象總體和次級(jí)總體的所有項(xiàng)目,按隨機(jī)規(guī)則選取樣本。通常的做法是根據(jù)隨機(jī)數(shù)表按照一定規(guī)則進(jìn)行選樣,因此,隨機(jī)數(shù)表尤為重要。在實(shí)際工作中,可以利用現(xiàn)有的隨機(jī)數(shù)表,也可以運(yùn)用stata進(jìn)行創(chuàng)建。假設(shè)準(zhǔn)備創(chuàng)建5×5的隨機(jī)數(shù)表,可以使用以下命令:
>set obs 5
>gen x1=uniform()
>gen x2=uniform()
>gen x3=uniform()
>gen x4=uniform()
>gen x5=uniform()
>list
輸出結(jié)果如圖3所示:
set obs命令是指產(chǎn)生的變量的列數(shù),本例中set obs 5則表明產(chǎn)生的隨機(jī)數(shù)為5列,uniform()命令表示產(chǎn)生的變量是隨機(jī)變量。從圖3中可以看出,stata創(chuàng)建了一個(gè)5×5的七位數(shù)的隨機(jī)數(shù)表。這個(gè)隨機(jī)數(shù)表的數(shù)量可以有變化,也可以創(chuàng)建6×6或者20×6的隨機(jī)數(shù)表。假如創(chuàng)建20×6的隨機(jī)數(shù)表,在命令中輸入set obs 20,并利用命令gen x6=uniform(),這樣就可以創(chuàng)建一個(gè)20×6的一個(gè)隨機(jī)數(shù)表。
2.進(jìn)行等距抽樣
等距選樣是指按照相同的間隔從審計(jì)對(duì)象總體中等距離地選取樣本的一種選樣方法。采用等距選樣法,首先要計(jì)算選樣間距,確定選樣起點(diǎn),然后再根據(jù)間距順序地選取樣本。假設(shè)審計(jì)人員需要抽查下表中的材料,以3為間距等距選擇樣本。
在輸入數(shù)據(jù)時(shí),可把數(shù)據(jù)用Excel表編輯,保存成CSV格式,在stata中選擇File →Import →ASCII data created by a spreadsheet ,在彈出的對(duì)話框中Browse,找到保存的CSV文件導(dǎo)入即可。具體進(jìn)行等距選樣的命令如下:
>keep if mod(xh,3)==0
>list
輸出的結(jié)果如圖4所示:
由于等距抽樣是以序號(hào)作為變量去除以間距,所以序號(hào)一列尤為重要,在命令中括號(hào)內(nèi)的變量名稱必須是序號(hào)的變量。從圖4中可以看到審計(jì)人員應(yīng)選擇材料三、材料六和材料九進(jìn)行審計(jì)。
參考文獻(xiàn):
王群勇:STATA在統(tǒng)計(jì)與計(jì)量分析中的應(yīng)用[M].天津:南開大學(xué)出版社,2007