胡雪梅 李文博
(東北財經(jīng)大學(xué)研究生學(xué)院,遼寧大連116025)
隨著各種掃描設(shè)備在商貿(mào)場所的普及使用,許多國家的統(tǒng)計部門開始著手考察掃描數(shù)據(jù)在指數(shù)編制中的有效性,以食物或日常消費類項目入手,大量資源被投入到銷售網(wǎng)點的價格采集上。
2009年,瑞典統(tǒng)計局發(fā)現(xiàn)在整理掃描數(shù)據(jù)的過程中,價格采集的失誤以及貨架、包裝中頻繁變化的價格信息會致使測量偏差頻發(fā)。因此,如何有效使用掃描數(shù)據(jù)并降低待估價格的標(biāo)準(zhǔn)誤、提高統(tǒng)計質(zhì)量并符合歐盟和國內(nèi)的統(tǒng)計制度,是當(dāng)今掃描數(shù)據(jù)有效性研究的重點。
掃描設(shè)備輸出的數(shù)據(jù)通常用EAN碼系統(tǒng)表示,EAN碼是一種用于給銷售網(wǎng)點中賣出商品標(biāo)號的國際編碼系統(tǒng)。開始的2~3位數(shù)字確定了生產(chǎn)商注冊的國家,接下來的4~5個數(shù)字指明該公司編號,末位數(shù)字則用于說明該產(chǎn)品的類別。但是EAN碼并不包含產(chǎn)品本身的信息,像品牌、重量、標(biāo)簽等信息是由銷售的收銀系統(tǒng)存儲的。每個掃描出售并貼有EAN條碼的商品,都會在此銷售網(wǎng)點的收銀系統(tǒng)儲存其全部信息。然后這些數(shù)據(jù)(掃描數(shù)據(jù))就會定期地傳送給該銷售連鎖機構(gòu)的總公司,并作為原始數(shù)據(jù)匯報給國家統(tǒng)計研究所(NSI),滿足統(tǒng)計需要。
瑞典統(tǒng)計局研究發(fā)現(xiàn),每個商業(yè)連鎖都有特定的數(shù)據(jù)格式,也即每個連鎖商店都需要根據(jù)自己編輯的程序量體裁衣。如與EAN碼不同,打折優(yōu)惠券擁有一套獨特的條形碼,當(dāng)顧客給出優(yōu)惠券時,條形碼作為獨立項目會在收銀系統(tǒng)中登記,而價格的優(yōu)惠部分會在收據(jù)上單獨打印。
調(diào)查結(jié)果表明,若一種商品永久退出生產(chǎn)線,其EAN碼可以在一段時期后再次利用在其他商品上。這個過程需要一年以上的時間,所以理論上不會引起混淆。
瑞典統(tǒng)計局的Dalén在1997年一次實驗中率先研究了掃描數(shù)據(jù)。該研究設(shè)計了4×4的實驗,分別將固定權(quán)數(shù)與單位值進行比較,單元值與月度單位值進行比較,直接指數(shù)與月度鏈?zhǔn)街笖?shù)進行比較,拉氏指數(shù)與費希爾指數(shù)進行比較。比較四個條目組(油脂、洗滌劑、早餐麥片和速凍魚)時使用的是尼爾森公司瑞典數(shù)據(jù)庫的掃描數(shù)據(jù)。盡管瑞典第一份關(guān)于“用于CPI計算的掃描數(shù)據(jù)使用”的報告描繪了進一步工作和拓寬實驗的前景,但是卻沒有后期跟進。Donmyer等(1991)指出,與此類似的是1972年俄亥俄州辛辛那提市的一家克羅格商店首次把掃描生成的銷售記錄與人工審計數(shù)據(jù)作出的比較,結(jié)果表明對于諸多條目和商品來說,掃描出的銷售業(yè)績相比之下更勝一籌。
Leaver、Larson(2001)發(fā)現(xiàn),在使用尼爾森價格信息的紐約大都會區(qū),美國勞工統(tǒng)計局給每個單獨的項目計算了一個以掃描數(shù)據(jù)為基礎(chǔ)的幾何價格指數(shù)作為實驗用檢驗指標(biāo)。Richardson(2003)認(rèn)為,這種檢驗指標(biāo)“把初級掃描指標(biāo)(只用掃描數(shù)據(jù))和CPI數(shù)據(jù)中非掃描總體構(gòu)建的指標(biāo)聯(lián)系在了一起”。這種實驗用途的CPI是一種額外的指數(shù),并且不會代替官方的CPI。
追求指標(biāo)編制領(lǐng)先水平的荷蘭統(tǒng)計局在2002年直接使用通過匹配項目得到掃描數(shù)據(jù)的方法來計算指標(biāo);2010年后,其CPI系統(tǒng)大規(guī)模并定期地推廣這種理論。
澳大利亞統(tǒng)計局(ABS)為改善官方統(tǒng)計,一直致力于研究掃描數(shù)據(jù),尤其是CPI體系,他們使用來自A.C尼爾森數(shù)據(jù)庫的信息來構(gòu)建掃描指標(biāo)(Alcausin等,2002)。
Rodriguez、Haraldsen(2006)的研究表明,為了計算出CPI中食物和軟飲料分類指數(shù),自2005年8月起,挪威統(tǒng)計局開始使用全面的掃描數(shù)據(jù)信息。計算過程涵蓋14000多個條目的價格信息,相比之下早年的非掃描數(shù)據(jù)系統(tǒng)只有250個項目。每月價格浮動在新系統(tǒng)中表現(xiàn)更明顯,尤其是對那些隨著季節(jié)變化營業(yè)額和價格波動很大的商品。
英國國家統(tǒng)計局(ONS,2006)申明其“一直以來都在探索電子掃描數(shù)據(jù)采集價格的可能性”。然而使用從商店直接得到的掃描數(shù)據(jù)已讓其意識到按月凈化這種數(shù)據(jù)會成為一項巨大而耗資的工程,而且問題數(shù)據(jù)極可能存在風(fēng)險。因此該局正在調(diào)查其他方法,如價格指標(biāo)的計算以及從大量家庭中收集的掃描數(shù)據(jù)的權(quán)重。
Muller等(2006)研究發(fā)現(xiàn),在市場研究機構(gòu)獲得各種條目的價格信息后,瑞士聯(lián)邦統(tǒng)計局也在力求研究直接應(yīng)用掃描數(shù)據(jù)計算指數(shù)。2008年該局首次推廣CPI編制中應(yīng)用掃描數(shù)據(jù),2010年則將該方法繼續(xù)推薦給更多零售商。問題可能影響指標(biāo)計算中掃描數(shù)據(jù)的應(yīng)用,即:(1)超市連鎖規(guī)模的大小會影響掃描數(shù)據(jù)的質(zhì)量并且統(tǒng)計局不得不依賴于超市每月回饋數(shù)據(jù)的意愿;(2)對數(shù)據(jù)結(jié)構(gòu)以及超市網(wǎng)絡(luò)IT系統(tǒng)具體特點的了解不夠充分;(3)盡管備有軟件,但需及時更新與超市網(wǎng)絡(luò)連接的補丁程序。
計算該指標(biāo)等同于將此法用于全國CPI的計算過程,即原集中的杰文斯指數(shù)(Jevons index)。采集零售商店的普通樣本時,零售商店和產(chǎn)品的樣本可以遠(yuǎn)大于目前的實際容量(瑞典統(tǒng)計局擁有50個采價網(wǎng)點和3×400個采價產(chǎn)品),較大標(biāo)準(zhǔn)差可在小成本的條件下降低(如果掃描數(shù)據(jù)是免費得到的)。
人工收集的小樣本會產(chǎn)生待估價格標(biāo)準(zhǔn)誤波動過大,對大樣本或者總體來說,將掃描數(shù)據(jù)作為輔助信息可以減少這個標(biāo)準(zhǔn)誤。步驟如下:
1.使用掃描數(shù)據(jù)計算出一個價格指數(shù);
2.在有高品質(zhì)測量方法的零售網(wǎng)點的一個小樣本中手工收集價格;
3.使用手工收集的價格和掃描數(shù)據(jù)價格的平均比率來調(diào)整掃描數(shù)據(jù)價格指數(shù)。
瑞典統(tǒng)計局承認(rèn)通過產(chǎn)品普查的掃描數(shù)據(jù)記錄計算指標(biāo)也許會存在一些問題。首先該局并不確定NSI工作人員是否擁有足夠的知識,將超過一萬種產(chǎn)品按其消耗用途正確分類。其次是瓶裝水的儲備、軟飲料和啤酒并沒有從價格體系中撤出,也即存款成本在指數(shù)計算上的估算發(fā)生變化,這與法規(guī)不符。第三,代替品不能被自動處理,比如說,一整包餐巾紙的數(shù)量減少而價格維持不變時,必須做出數(shù)量上的調(diào)整。
NSI可以使用掃描數(shù)審查手工價格采集。手動采集價格過程存在測量誤差,其出現(xiàn)的頻率與教育、人工操作、測量儀器、監(jiān)督等因素的運作有關(guān)。
從2008年開始,作為研究對象的瑞典零售連鎖商店約提供了49600個產(chǎn)品樣本,這些連鎖商店是通過掃描數(shù)據(jù)中的EAN碼來識別的。這意味著手工價格采集的目標(biāo)樣本中的39%是為食品設(shè)計的,其他的日用品樣本則要根據(jù)特定的總體來確定。
表1顯示了掃描數(shù)據(jù)與普通價格采集數(shù)據(jù)中匹配成套項目的最終結(jié)果。不等的價格類別(10.7%)包含著不同程度的差異。
表12009 年1月—11月掃描數(shù)據(jù)(SD)與手工采集價格(MCP)的對比 %
手工采集中有10%的產(chǎn)品不包含在掃描數(shù)據(jù)中。這個類別至少由因兩個原因不出售的產(chǎn)品組成。其一,如果條目描述是模糊的,一些價格采集者就會決定收集那種他們無意中得到而其他人卻熱衷收集的產(chǎn)品的價格。其二,即使商店中還有存貨,商品在一周的銷量也為零。當(dāng)產(chǎn)品銷量較小并且產(chǎn)品供給價格顯著提升時,后一種情況可能發(fā)生。
現(xiàn)存問題是一些零售商店中手工收集時沒有出現(xiàn)卻在掃描數(shù)據(jù)中出現(xiàn)的產(chǎn)品的大部分信息在整個月份當(dāng)中是“缺失”的,而這些信息在其他商店中卻唾手可得。沒有及時更新產(chǎn)品的EAN碼是對這種差異的一個合理解釋。瑞典統(tǒng)計局使用兩年期樣本來生成產(chǎn)品樣本并在當(dāng)年使用的做法會導(dǎo)致一部分EAN條形碼滯后。NSI若想得到較準(zhǔn)確的對比結(jié)果,就要定期更新EAN碼。
食品和日常消費品價格指數(shù)是在每年1—11月計算出來的。一個指數(shù)可以根據(jù)手工收集的126300種產(chǎn)品組成的體系計算而成,也可以通過使用掃描數(shù)據(jù)代替49600個產(chǎn)品的方法來計算這個指數(shù)。
表2 2009年大部分日常用品的每月價格指數(shù) %
注:基期為2008年12月
掃描數(shù)據(jù)指標(biāo)與普通CPI之間的不同顯示出了一個非常重要的差異:在0.1~0.2之間的掃描數(shù)據(jù)比普通指數(shù)要低一些。必須強調(diào),掃描指數(shù)基礎(chǔ)僅來自一個連鎖商店,這意味著當(dāng)掃描數(shù)據(jù)代替人工價格采集的數(shù)據(jù)時,其他銷售網(wǎng)點的這個差異也許會更大。2010年3月,瑞典統(tǒng)計局對選定的采價網(wǎng)點進行了審計考核,通過把手工價格采集數(shù)據(jù)與掃描數(shù)據(jù)進行對比發(fā)現(xiàn)這個網(wǎng)點中有20種產(chǎn)品存在價格差異。
歐盟內(nèi)部的CPI計算指南是從理事會條例(EC)中總結(jié)出來的。委員會條例(EC)No 2602/2000第三段規(guī)定:“用于HICP的價格必須是在貨幣交易中由家庭實際支付的、用于購買個人商品和服務(wù)用途的購買價格,在標(biāo)準(zhǔn)價格和收費的折扣或非購買高峰期減少之后,包括產(chǎn)品的稅費及補貼,并且在信貸合約及非購買行為發(fā)生期限內(nèi)付款的情況下,扣除利息和附加服務(wù)費。”對于瑞典手工采集指南來說,價格采集者必須檢查那些排除了任何制造商或支持優(yōu)惠的零售商、折扣、會員優(yōu)惠、攻擊者或者退款的價格。
文件No 2602/2000的一個基本要點就是:統(tǒng)計局可以把掃描數(shù)據(jù)的使用作為一種采集方法,并進行下一步研究。對于其在國民賬戶中的使用來說,交易價格必須是注冊過的;對提供的產(chǎn)品而言,掃描數(shù)據(jù)衡量了交易價格,這說明其比手工價格采集更有優(yōu)勢。
日常消費品價格浮動的統(tǒng)計質(zhì)量是根據(jù)抽樣框的缺陷性、產(chǎn)品與商店類型的權(quán)重、抽樣誤差、測量誤差等因素進行評價的。瑞典統(tǒng)計局使用的是商店和產(chǎn)品的抽樣概率。因為在大多數(shù)統(tǒng)計中,抽樣誤差可以估計,其他來源的誤差則不能,并且不能把它們簡單地假設(shè)為隨機生成的誤差。如果目標(biāo)參數(shù)是每月平均價格,那么為期一周或三周的平均價格優(yōu)于每月價格,因為抽樣時間點不同而產(chǎn)生的誤差減小了。
來自連鎖零售商店的數(shù)據(jù)并不包括會員優(yōu)惠或者組合優(yōu)惠,掃描數(shù)據(jù)也要刨除上述項目。我們必須假設(shè)手工采集的價格中存在測量誤差。為了減少誤差,瑞典統(tǒng)計局在價格采集者的教育、指導(dǎo)手冊、測量儀器以及審計上投入更多的精力。
兩個原因造成了手工價格采集中出現(xiàn)的產(chǎn)品中的10%沒有在掃描數(shù)據(jù)中出現(xiàn):其一,出售量較小的產(chǎn)品在一周內(nèi)可能“隨機地”滯留了;其二,一種產(chǎn)品的價格明顯上漲使得消費者選擇了另外的代替品或者另一家商店。這樣從掃描數(shù)據(jù)中得出的價格觀測值可能與指標(biāo)的參數(shù)相關(guān)。這種缺失值不可忽視并具有一定風(fēng)險,可能與一些統(tǒng)計推論相違背。沒有證據(jù)表明掃描數(shù)據(jù)存在這樣的影響。但假設(shè)這種影響存在,它在基期和報告期很有可能具有相同的規(guī)模,并且二者在一定程度上可能抵消。
作為質(zhì)量保證的一部分,瑞典統(tǒng)計局將一直致力于發(fā)展將價格采集誤差最小化的工作,因為CPI是一個重要的經(jīng)濟指標(biāo),必須在準(zhǔn)確而可靠的價格基礎(chǔ)上計算得出。
[1]Alcausin,G.,Anderson,M.,Khoo,J.a(chǎn)nd Tallis,K.(2002).Scanner Data in CPI Research and Compilation.Australian Bureau of Statistics.International Association of Official Statistics.Official Statistics and the New Economy.London.
[2]Dalén,J.(1997).Experiments with Swedish Scanner Data.International Working Group on Price Indices.Voorburg.
[3]ONS,Office for National Statistics.(2006).The consumer prices methodological programme:progress in 2005 and prospects for 2006.Economic Trends 627.
[4]Rodriguez,J.a(chǎn)nd Haraldsen,F(xiàn).(2006).The use of scanner data in the Norwegian CPI:The”new”index for food and non - alcoholic beverages.Economic Survey,4/2006