亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        小樣本條件下二階分層抽樣的樣本最優(yōu)分配研究

        2012-07-24 09:35:08張金寶
        統(tǒng)計與決策 2012年20期
        關(guān)鍵詞:居民家庭樣本量分配

        張金寶

        (北京第二外國語學(xué)院 旅游管理學(xué)院,北京 100024)

        0 引言

        近年來,國內(nèi)消費金融得到了較快的發(fā)展,汽車貸款、耐用消費品貸款、信用卡等越來越多的金融產(chǎn)品開始走進了中國居民的家庭。消費金融產(chǎn)品無疑將成為與普通家庭聯(lián)系最密切的金融產(chǎn)品之一,這意味著消費金融的健康發(fā)展關(guān)乎千萬家庭的切身利益。如何發(fā)揮其促進消費的積極作用,同時通過合理的政策和監(jiān)管防范和化解風(fēng)險,應(yīng)引起政府足夠的關(guān)注。

        當(dāng)然,關(guān)注的首要任務(wù)應(yīng)是對中國居民消費金融的現(xiàn)狀有最基本的了解。在國外,了解消費金融基本狀況、獲取消費金融基礎(chǔ)數(shù)據(jù)的一個重要方法,就是在全國范圍內(nèi)開展以家庭為單位的消費金融調(diào)查。早在1961年,美國就開始了全國范圍內(nèi)的消費金融調(diào)查(Survey of consumer finance,SCF)。從1983年開始,調(diào)查開始常態(tài)化,每隔三年進行一次。加拿大、英國、塞浦路斯等國也進行了類似的調(diào)查(Alex Karagrigorou 2005)。我國的消費金融調(diào)查尚處在起步階段,大規(guī)模的消費金融調(diào)查并未真正開始。那么,首先進行小規(guī)模的消費金融調(diào)查,積累相關(guān)的經(jīng)驗,為后期的大規(guī)模調(diào)查做準(zhǔn)備不失為一個穩(wěn)健可行的辦法。

        在此情況下,受某單位的委托我們進行了一次小規(guī)模的消費金融調(diào)查??紤]到現(xiàn)階段我國的消費金融市場主要在城市,我們的消費金融調(diào)查確定以城市居民家庭為調(diào)查對象。具體地說,就是在城市的市轄區(qū)生活和居住的家庭。根據(jù)國外的經(jīng)驗,如何提高調(diào)查數(shù)據(jù)質(zhì)量是調(diào)研的關(guān)鍵。從技術(shù)的環(huán)節(jié)看所采用的途徑不外乎兩種:一種是通過設(shè)計問卷題目,使獲得的調(diào)查數(shù)據(jù)更加合理規(guī)范,降低非抽樣誤差。另一種則是設(shè)計合理的抽樣方案盡量降低調(diào)查的抽樣誤差。受研究經(jīng)費的限制,本次調(diào)查總的樣本量為5000個家庭,擬在全國范圍內(nèi)調(diào)查24個城市。在制定抽樣方案時,如何合理分配調(diào)查樣本降低抽樣誤差,成為抽樣設(shè)計中重點考慮的因素之一。

        1 研究的準(zhǔn)備

        由于此前鮮有針對居民家庭的廣泛的消費金融調(diào)查,所以關(guān)于家庭消費金融的基本狀況的數(shù)據(jù)資料比較匱乏。事實上,僅僅根據(jù)現(xiàn)有的資料來制定抽樣方案和分配樣本是不現(xiàn)實的。但從國外的研究和國內(nèi)的實踐經(jīng)驗看,消費金融與城鎮(zhèn)居民家庭的資產(chǎn)、收入、消費和儲蓄等密切相關(guān)(Campbell,2006)。舉個簡單的例子,信用卡的授信額度、汽車貸款額度等都與居民的收入和資產(chǎn)成近似的正比關(guān)系。換個角度看,如果調(diào)查的樣本中居民家庭的資產(chǎn)、收入、消費和儲蓄等數(shù)據(jù)比較準(zhǔn)確可靠,我們獲得的這些家庭的消費金融數(shù)據(jù)就可能更加接近城市居民家庭消費金融的真實狀況。

        這給我們一定的啟發(fā):我們可以參考這些與消費金融密切相關(guān)的經(jīng)濟變量的信息來制定抽樣方案。城市的規(guī)模和地理位置顯著影響家庭的經(jīng)濟條件,這使得居民家庭的資產(chǎn)、收入、消費和儲蓄等經(jīng)濟變量,不僅與居民家庭自身的特征變量(如人口、年齡、教育程度)有關(guān),還與家庭所處的城市有關(guān)。因此,調(diào)查抽樣擬定為二階抽樣,首先對全國的城市進行分類,在每類中先抽取城市;然后在抽中的城市里通過隨機抽樣最終確定調(diào)查的家庭。

        研究的準(zhǔn)備工作從城市的分類開始。對城市的分類主要考慮城市的規(guī)模、經(jīng)濟發(fā)展水平、儲蓄水平、消費水平、消費條件等。城市規(guī)模用城市市轄區(qū)的人口來表示,經(jīng)濟發(fā)展水平用城市的生產(chǎn)總值(GDP)來表示,儲蓄水平用市轄區(qū)居民的儲蓄余額來表示,消費水平采用的是市轄區(qū)社會消費品零售額。根據(jù)樊綱和王小魯(2003)的研究,對消費條件我們主要考慮了城市的交通條件、醫(yī)療條件、教育發(fā)展水平、社會保障水平、失業(yè)率等。通過聚類分析將全國的地級以上城市分成3大類。

        其次,考慮到我國地區(qū)發(fā)展的不平衡,我們將全國的城市(不含港澳臺地區(qū))在地理位置上按東北、華北、華東、華南、華中、西南、西北七個大區(qū)進行劃分,抽樣家庭的樣本數(shù)量在各個大區(qū)之間根據(jù)家庭戶數(shù)按比例分配。5000個家庭樣本相對于全國1億兩千萬個城市家庭而言是非常小的。在樣本數(shù)量有限的條件下,設(shè)計者希望每個大區(qū)至少抽取三類城市各一個。這樣獲得的調(diào)研數(shù)據(jù),既能反映地理位置因素對消費金融狀況的影響,也能反映不同城市類別對家庭的影響,使初步獲得的調(diào)研數(shù)據(jù)盡可能多地反映家庭消費金融的基本狀況,積累原始的調(diào)查經(jīng)驗。

        具體到每個大區(qū)的樣本如何在一、二、三類城市進行分配,則牽涉到本文的主題即樣本最優(yōu)分配問題。以華北區(qū)為例,根據(jù)總的樣本分配方案,華北地區(qū)的樣本數(shù)量為800個家庭。由于樣本數(shù)量的限制,抽樣的城市不可能太多。又由于我們希望通過抽樣,對每類城市的消費金融狀況都有個初步的了解,以便為下一步更大規(guī)模的消費金融調(diào)查積累經(jīng)驗,則每類城市至少要有一個城市入選。事實上,在華北地區(qū)我們只能在每類城市中抽取一個城市,然后在選中的城市中再按照隨機抽樣的原則抽取家庭。如果我們把城市的分類看做是對城市的分層,那么在每個層中我們進行的都是先抽取初級單位(城市)再抽取次級單位(家庭)的二階抽樣。

        問題在于,盡管我們對城市進行了分層,但在每個層中城市的大小仍各不相同。我們面臨的情況較之馮士雍、施錫銓(1995)論述的二級抽樣的情況更為復(fù)雜。馮、施兩人的著作討論了總體的初級單元大小不等且只能取一個初級單元的情況下,抽樣誤差的估計問題。就本文的情況而言,書中討論的情況則是發(fā)生在每個層中。本文想要解決的問題是如何在華北區(qū)三個不同類別的城市中分配800個家庭的抽樣樣本以便盡量降低抽樣誤差。因此除非特殊說明,下文討論的“總體”均指某個大區(qū)內(nèi)所有的城市居民家庭。

        2 問題描述

        如前所述,在缺少關(guān)于消費金融入戶調(diào)查的前期資料的情況下,我們在設(shè)計抽樣方案和分配樣本時,更多的是考慮利用與消費金融有關(guān)的重要經(jīng)濟變量的間接信息。首先,使抽樣方案能夠?qū)@些變量的平均水平有個比較準(zhǔn)確地估計。為此需要描述分層情況下,由樣本推測的總體均值的估計誤差。

        2.1 由樣本推斷的總體均值的誤差

        簡單起見,我們只討論一個變量的情形。設(shè)變量Y是要調(diào)查的家庭的經(jīng)濟變量(如,家庭的收入等),h代表抽樣時對初級單位所劃分的層,層數(shù)為L.每個層有Nh個初級單元即城市。第h個層抽取的初級單元樣本數(shù)為nh=1。對于一般的分層抽樣而言,由于每層之間的抽樣是獨立的,所以由樣本推斷的總體均值估計量的誤差可以用公式(1)來表示:

        其中,為由樣本推斷的總體均值,代表由樣本推斷的每層的均值。V代表求方差運算。Wh代表是每個層的權(quán)重,權(quán)重由每一層城市的家庭總數(shù)占整個總體家庭總數(shù)的比例來表示。式(1)表明對總體均值的估計誤差是每個層的均值的估計誤差的加權(quán)平均。在城市分層已經(jīng)確定的條件下,根據(jù)《中國城市(鎮(zhèn))生活與價格年鑒2009》公布的統(tǒng)計數(shù)據(jù),很容易可以算出各層的權(quán)重。因此,要描述總體均值的估計誤差,關(guān)鍵是對每個層均值的誤差作出估計就可以了。

        在討論每個層時,如果把每個層看成一個子總體的話,在這個子總體中初級單位即每個城市的大小是不同的,且在該子總體中我們只能選擇一個初級單位。這個情形則與馮士雍、施錫銓(1995)論述情形頗為相似。

        2.2 由每層樣本推斷的每層樣本均值的誤差

        參考馮士雍、施錫銓(1995)著作,對每個層我們先規(guī)定一些標(biāo)記符號:

        hYij表示第h層第i個城市第j個家庭的經(jīng)濟變量的觀測值,相應(yīng)的樣本記為hyij;第h層包含Nh個城市,每個層抽取的初級單位的樣本數(shù)為nh。

        對于h層某個固定的城市i,hMi表示該城市家庭的總數(shù),第二階段抽取的家庭戶數(shù)為hmi,則:

        對h層及該層所有的家庭而言:

        hM0=,第h層樣本和總體所包含的家庭的總數(shù);

        hY=第h層樣本和總體所包含的家庭的重要經(jīng)濟變量的總和;

        h第h層按家庭總戶數(shù)計算的經(jīng)濟變量的平均值;

        h第h層按城市計算的經(jīng)濟變量的平均值。

        馮士雍、施錫銓(1995)分五種情況討論了在不同的初級單元抽取方式下,抽樣誤差如何估計的問題。其中,在每層中按與初級單元(城市)的大小hMi成正比的概率抽取初級單元時(也即第h層第i城市被抽中的概率為hMi/hM0),所獲得的均值估計量為無偏估計且方差最小,并且指出這種結(jié)論具有普遍意義。鑒于此,我們在每層的初級單元抽取時均采用此種方法,則每層中對家庭重要經(jīng)濟變量的均值的估計方差可以表示為:

        將公式(2)所表達的每層抽樣的均值估計量的方差代入到公式(1),就可以得到總的抽樣誤差。即

        2.3 小樣本條件下二階分層抽樣樣本的最優(yōu)分配問題

        Beardwood(1959)討論了簡單的分層抽樣方案中,樣本量在不同的層之間如何最優(yōu)分配的問題,并給出了實現(xiàn)最優(yōu)分配時不同層的樣本量之間的比例關(guān)系。但Beardwood考慮的約束條件是調(diào)查成本與各層的樣本量呈正比的情況,與本文的限定樣本量的約束條件有所不同。關(guān)于二階分層抽樣的成本,第一階段的城市分層的成本主要是技術(shù)人員的數(shù)據(jù)分析發(fā)生的成本??紤]到這部分成本在總成本中占比很小,本文對其忽略不計,主要考慮第二階段的入戶調(diào)查成本。筆者在實際調(diào)研的過程中,發(fā)現(xiàn)調(diào)查公司的成本通常是按每戶來報價,如130元/戶,150元/戶等。此外,大城市調(diào)查的交通成本比較低而入戶成本高,小城市的入戶成本低但交通成本較高。綜合來看,不同類別的城市調(diào)查一戶家庭的成本相差并不大,在處理時可按相等來處理。設(shè)每戶的成本為c元,總的費用為tc元,則“總的調(diào)查成本一定”等價于“調(diào)查戶數(shù)一定”。

        假設(shè)總的樣本量為mst戶,在每個層分配的樣本量分別為hm0(h=1,2,…L)。若使樣本量在不同層之間實現(xiàn)最優(yōu)分配,實際上是一個如何進行樣本分配,使由樣本推測的總體均值的估計方差最小的問題。這個思路可以用如下的最小化問題來表示:

        與Bearwood(1959)提出的模型相比,由于采用的是二階分層抽樣,且每層抽取的初級單位只有一個,因此本文抽樣誤差在形式上更加復(fù)雜。此外,盡管傳統(tǒng)的成本約束與本文中限定樣本數(shù)量的約束在本質(zhì)上是一致的,但約束的數(shù)學(xué)表達仍有不同。需要說明的是,在每個層只選一個初級單元的情況下,層的樣本量hm0與選中的初級單元的樣本量hmi是一致的。參考Cochran W.G.(1977)《抽樣技術(shù)》推薦的方法(中譯本1985,張堯庭、吳輝譯),在公式(4)中我們將公式(3)中的hmi用hm0代替。具體到某個城市,反映家庭之間經(jīng)濟變量差異的方差可以參考已有的調(diào)查資料進行估算。城市家庭的總戶數(shù),家庭經(jīng)濟變量的參數(shù)、可以根據(jù)統(tǒng)計年鑒公布的資料計算得到。這樣在公式(4)中,只有樣本量的分配參數(shù)為未知,求解公式(4)便可以計算出樣本的最優(yōu)分配。

        3 研究實例

        為便于讀者理解本文的思路,我們?nèi)砸匀A北地區(qū)為例,來說明小樣本條件下二階分層抽樣的樣本分配問題。前期準(zhǔn)備工作即對華北地區(qū)的城市分層已經(jīng)完成,見表1。前已述及,鑒于國內(nèi)城市家庭消費金融狀況的資料比較匱乏,在設(shè)計抽樣方案和分配樣本時,我們更多地是采用與消費金融密切相關(guān)的經(jīng)濟變量的信息。事實上,為了穩(wěn)健起見可以同時利用幾個重要的變量,如家庭的收入、消費、儲蓄等來測算最優(yōu)樣本的分配,然后綜合考慮測算結(jié)果,確定最佳的分配方案。考慮到文章篇幅,本節(jié)僅以家庭消費為關(guān)鍵變量說明小樣本條件下,在每個層只選一個初級單位時,樣本量的最優(yōu)分配問題。

        表1 城市的分層明細

        表2給出了不同城市家庭全年消費的平均值,以及每個城市總的家庭戶數(shù)。其中,不同城市家庭全年消費的平均值是根據(jù)《中國城市(鎮(zhèn))家庭生活價格年鑒2009》中提供的城市市轄區(qū)社會消費品零售總額除以市轄區(qū)的家庭戶數(shù)計算得到。

        表2 華北地區(qū)的城市分級和城市家庭的平均消費水平

        整個華北地區(qū)每個層城市居民家庭的平均消費水平,即可以利用表2提供的數(shù)據(jù)按照上節(jié)給出的符號定義,通過加權(quán)平均計算得到。為了給出樣本的最佳分配,在公式(4)所表述的模型中,我們還需要知道不同城市家庭消費水平的方差,即目前,公開的資料鮮有披露。根據(jù)我們對北京、包頭和張家口等城市居民家庭月均消費情況的調(diào)查結(jié)果,北京市城鎮(zhèn)居民家庭的每月消費額的標(biāo)準(zhǔn)差為1414元,包頭城市居民家庭月均消費額的標(biāo)準(zhǔn)差約為900元,而張家口城市居民家庭的月均消費額度的標(biāo)準(zhǔn)差為550元。考慮到公開資料較少的客觀條件和簡化計算,我們將這三個城市居民家庭消費額度的標(biāo)準(zhǔn)差,換算成對應(yīng)的家庭年消費的標(biāo)準(zhǔn)差,作為每個層城市家庭消費額度標(biāo)準(zhǔn)差的近似值。即1S2i=1414*12=16968(i=1,2),2S2i=900*12=10800(i=1,2,…7),3S2i=550*12=6600(i=1,…22)。將上述已知條件代入到式(4),本節(jié)的具體問題則可以表述為:

        利用Matlab軟件通過編程計算可以求出上述問題的最優(yōu)解。求得的結(jié)果為:1m0=394.97,2m0=251.39,3m0=153.6。對計算結(jié)果進行圓整,可得總的樣本在每個層之間的最優(yōu)分配為:1m0=395,2m0=251,3m0=154。需強調(diào)是,計算得出的最優(yōu)分配僅僅是將居民家庭的消費作為計算樣本分配的關(guān)鍵變量所得到的結(jié)果。在實際操作中,可以同時考慮幾個與消費金融相關(guān)的重要變量進行測算。然后綜合考慮測算結(jié)果作出樣本分配的最佳方案。

        4 結(jié)束語

        根據(jù)國外的經(jīng)驗,消費金融調(diào)查往往涉及家庭經(jīng)濟活動的諸多方面,涉及家庭的資產(chǎn)、收入、消費、儲蓄等重要的經(jīng)濟變量。這種內(nèi)容繁多,范圍廣泛的調(diào)查活動往往不能一蹴而就。因此,先行的帶有試驗性質(zhì)的調(diào)查往往成為擴大調(diào)查規(guī)模之前不可缺少的環(huán)節(jié);反之,缺少這個環(huán)節(jié)盲目擴大調(diào)查規(guī)模則容易造成資源的浪費。這意味著,先行的試驗性質(zhì)的調(diào)查往往樣本量較小。如何在樣本量較小的情況下,通過合理分配樣本量獲得一個比較滿意的調(diào)查結(jié)果,成為現(xiàn)階段的消費金融調(diào)查必須面臨的問題。

        本文針對性地提出了一個解決方案。根據(jù)委托方提出的樣本容量的限制,設(shè)計了二階分層抽樣的方案。在每個層中,我們只選一個初級單位進行入戶調(diào)研。為了實現(xiàn)樣本量的最優(yōu)分配,我們參考馮士雍、施錫銓(1995)的著作給出了每個層的抽樣誤差,在此基礎(chǔ)上描述了整個抽樣方案的估計誤差。再考慮樣本總量限制的條件下,給出了優(yōu)化樣本分配的計算模型。根據(jù)模型的解設(shè)計的樣本分配方案,能夠在小樣本的條件下盡量減少抽樣誤差,達到既節(jié)省成本又盡量獲得準(zhǔn)確信息的目的。

        下一步可以根據(jù)本次調(diào)研獲得的數(shù)據(jù),更多地采用直接描述消費金融的變量(如家庭短期消費信貸的額度,信用卡的信用額度,住房貸款、教育貸款的參數(shù)等)來設(shè)計消費金融的抽樣和樣本分配方案??梢灶A(yù)見,抽樣方案和樣本分配的改進是一個逐步完善的過程。在這個過程中,只要在樣本量還比較小的情況下,本文提出的方法都具有一定的適應(yīng)性。當(dāng)然,它也可以解決其他領(lǐng)域的小樣本條件下二階分層抽樣的樣本分配問題。

        [1]Alex Karagrigorou.The Survey of Consumer Finance:Sampling and Surveying in Cyprus,[EB/OL].http://www.econ.ucy.ac.cy/~echalias/survey.html,2005.

        [2]Campbell John Y.Household Finance[J].Journal of Finance,2006.

        [3]樊綱,王小魯.消費條件模型和各地區(qū)消費條件指數(shù)[J].經(jīng)濟研究,2004,(5).

        [4]馮士雍,施錫全.抽樣調(diào)查——理論、方法和實踐[M].上海:上海科學(xué)技術(shù)出版社,1995.

        [5]Beardwood J,Halton J H,Hammersley J M.The Shortest Path through Many Points[J].Proc,Cambridge Phil.Soc.,1959,(55).

        [6]Cochran W.G.抽樣技術(shù)[M].張堯庭,吳輝譯.北京:中國統(tǒng)計出版社,1985.

        [7]國家統(tǒng)計局城市社會經(jīng)濟調(diào)查司.中國城市(鎮(zhèn))生活與價格年鑒2009[M].北京:中國統(tǒng)計出版社,2009.

        猜你喜歡
        居民家庭樣本量分配
        醫(yī)學(xué)研究中樣本量的選擇
        中國農(nóng)村居民消費影響因素分析
        應(yīng)答器THR和TFFR分配及SIL等級探討
        遺產(chǎn)的分配
        一種分配十分不均的財富
        航空裝備測試性試驗樣本量確定方法
        績效考核分配的實踐與思考
        Sample Size Calculations for Comparing Groups with Binary Outcomes
        基于空間行為約束的北京市居民家庭日常出行碳排放的比較分析
        自適應(yīng)樣本量調(diào)整中Fisher合并P值法和傳統(tǒng)檢驗法的模擬比較
        国产99视频精品免视看7 | 爆乳日韩尤物无码一区| 日本高清一区二区三区不卡| 中国国产不卡视频在线观看| 手机久草视频福利在线观看| 国产免费无遮挡吸奶头视频| 欧美性xxxx狂欢老少配| 国产成社区在线视频观看| 国产丝袜美腿在线视频| 国产精品久久久久高潮| 色老汉免费网站免费视频| 亚洲国产字幕| 亚洲乱码一区二区av高潮偷拍的| 亚洲av无码片vr一区二区三区| 一个人看的www免费视频中文| 白白青青视频在线免费观看| 蜜桃视频在线免费视频| 免费人成视频x8x8入口| 久草视频国产| 蜜桃在线观看视频在线观看| 精品一二三四区中文字幕| 免费特级毛片| 亚洲 无码 制服 丝袜 自拍| 免费看草逼操爽视频网站| 一女被多男玩喷潮视频| 香蕉视频www.5.在线观看| 亚洲精品国产精品av| 极品av一区二区三区| 无遮无挡爽爽免费毛片| 亚洲精品123区在线观看| 一区二区三区高清视频在线| 欧美性猛交xxxx免费看蜜桃| 五月天激情小说| 亚洲人成伊人成综合网中文| 久久午夜精品人妻一区二区三区| 乱人伦中文无码视频| 亚洲三级在线播放| 小池里奈第一部av在线观看| 成人国产精品一区二区视频| 国产V日韩V亚洲欧美久久| 国产亚洲日本精品二区|