鄒文慧
(山東經(jīng)貿(mào)職業(yè)學(xué)院,山東 濰坊 261011)
數(shù)據(jù)化時(shí)代背景下,統(tǒng)計(jì)數(shù)據(jù)處理是數(shù)據(jù)分析全流程的基礎(chǔ)性環(huán)節(jié)。在眾多的數(shù)據(jù)類(lèi)型中,時(shí)間序列數(shù)據(jù)在社會(huì)經(jīng)濟(jì)問(wèn)題中最為廣泛存在,且每種細(xì)分類(lèi)型下,對(duì)應(yīng)的數(shù)據(jù)處理方法區(qū)別較大。然而,一些研究者在對(duì)時(shí)間序列數(shù)據(jù)進(jìn)行統(tǒng)計(jì)處理過(guò)程中仍采用“一刀切”策略,無(wú)論是何種類(lèi)型時(shí)間序列數(shù)據(jù),均采用直接匯總得總值又或者加總?cè)【档姆绞?,忽略了時(shí)間序列細(xì)分類(lèi)型之間的區(qū)別,導(dǎo)致不符合實(shí)際需求的數(shù)據(jù)處理結(jié)果。
針對(duì)上述問(wèn)題,本文以統(tǒng)計(jì)數(shù)據(jù)處理過(guò)程中最為常見(jiàn)的時(shí)間序列數(shù)據(jù)為研究對(duì)象,區(qū)分各細(xì)分類(lèi)型的基本概念,說(shuō)明每種細(xì)分類(lèi)型下的數(shù)據(jù)處理差異,旨在為數(shù)據(jù)分析者提高理論性認(rèn)識(shí)和提供可操作性參考。
在統(tǒng)計(jì)學(xué)理論中,首先需進(jìn)行數(shù)據(jù)處理才能開(kāi)展隨后的統(tǒng)計(jì)分析,統(tǒng)計(jì)數(shù)據(jù)處理尤其以同一空間不同時(shí)間的時(shí)間序列數(shù)據(jù)為對(duì)象,可從動(dòng)態(tài)角度反映目標(biāo)對(duì)象的發(fā)展水平和變化程度,因而要深入理解和把握時(shí)間序列數(shù)據(jù)的基本概念。當(dāng)今時(shí)代背景下,數(shù)據(jù)已滲透到生活的方方面面,小到菜市場(chǎng)買(mǎi)菜比價(jià),大到政府宏觀調(diào)控的政策依據(jù);數(shù)據(jù)的形式也不僅限于1、2、3、4...這些數(shù)字,還有圖片、文字、音頻和視頻等都是數(shù)據(jù)的表現(xiàn)形式。而時(shí)間序列數(shù)據(jù)不是通常意義上的數(shù)據(jù),是目標(biāo)對(duì)象的數(shù)據(jù)表現(xiàn)與時(shí)間項(xiàng)T 的組合,換言之,給每一個(gè)數(shù)據(jù)賦予一定的時(shí)間意義,以時(shí)間繼起原則進(jìn)行排序。例如菜市場(chǎng)的白菜,早市2 元,午市3 元,晚市1 元,那么就形成了一個(gè),,的時(shí)間序列數(shù)據(jù)。以此為例,就可以理解生活中許多的數(shù)據(jù)現(xiàn)象都是時(shí)間序列。綜上,所謂時(shí)間序列指的就是同一經(jīng)濟(jì)現(xiàn)象在不同時(shí)間點(diǎn)上的數(shù)列組合。這一概念與截面數(shù)據(jù),即同一經(jīng)濟(jì)現(xiàn)象在不同空間上的數(shù)列組合是不同的。因而,時(shí)間序列數(shù)據(jù)需正確區(qū)分類(lèi)型,針對(duì)不同類(lèi)型的數(shù)據(jù)需采用不同的處理方式,否則會(huì)出現(xiàn)結(jié)果上的重大偏頗。在此強(qiáng)調(diào),處理和分析數(shù)據(jù)的第一步是正確識(shí)別它們的類(lèi)型。
時(shí)間序列構(gòu)成的基礎(chǔ)是大大小小眾多的指標(biāo),其中最為常見(jiàn)的是總量指標(biāo),它是構(gòu)成平均指標(biāo)和相對(duì)指標(biāo)的基礎(chǔ)。總量指標(biāo)依據(jù)時(shí)間狀態(tài)的反映不同可以區(qū)分為時(shí)期指標(biāo)和時(shí)點(diǎn)指標(biāo),前者是指某一時(shí)間區(qū)間內(nèi)的流量,而后者是指某一時(shí)間節(jié)點(diǎn)上的存量。
將時(shí)間序列數(shù)據(jù)各細(xì)分類(lèi)型整理如圖1所示。
圖1 時(shí)間序列數(shù)據(jù)類(lèi)型
由于時(shí)期指標(biāo)和時(shí)點(diǎn)指標(biāo)在進(jìn)行數(shù)據(jù)處理時(shí)有顯著的差別,因而需明確識(shí)別時(shí)間序列數(shù)據(jù)總量指標(biāo)中的時(shí)期指標(biāo)和時(shí)點(diǎn)指標(biāo)。下文對(duì)兩者在定義、可加性及數(shù)據(jù)處理中的差異進(jìn)行詳細(xì)說(shuō)明。
從該角度分析時(shí)期指標(biāo)和時(shí)點(diǎn)指標(biāo)的不同,首先要區(qū)分“時(shí)間長(zhǎng)短”和“時(shí)間點(diǎn)”的概念。如果將兩者放在直尺等測(cè)量工具上進(jìn)行描述,那么前者就是線段,即一段區(qū)間;而后者只是直尺上的某個(gè)點(diǎn),又稱(chēng)時(shí)刻。時(shí)期指標(biāo)反映研究對(duì)象在觀測(cè)的一段時(shí)間內(nèi)發(fā)展變化的總量,它與觀測(cè)的時(shí)期長(zhǎng)短有著直接的關(guān)系,所以由于觀測(cè)時(shí)間段的不同也會(huì)導(dǎo)致時(shí)期指標(biāo)結(jié)果的不同;而時(shí)點(diǎn)指標(biāo)反映研究對(duì)象在某一時(shí)間點(diǎn)(瞬間或者時(shí)刻)狀態(tài)上的水平,它與觀測(cè)時(shí)間長(zhǎng)短沒(méi)有直接的關(guān)系,只與所處的時(shí)間點(diǎn)有關(guān)系,所以不同時(shí)刻上的時(shí)點(diǎn)指標(biāo)也不同。舉例說(shuō)明上述兩個(gè)概念:首先,“人口出生數(shù)”這一指標(biāo),反映的是一段時(shí)間內(nèi)某地區(qū)的出生人口總數(shù),與“時(shí)長(zhǎng)”相關(guān),因此是時(shí)期指標(biāo),則2019 年和2020 年的人口出生數(shù)不一致可以理解為,兩者所觀測(cè)的時(shí)間段是不同的;其次,“年末總?cè)丝凇敝笜?biāo),反映的是某一時(shí)刻上的數(shù)值,不涉及變化量,因而它是一個(gè)時(shí)點(diǎn)指標(biāo),則2019 年和2020 年的年末總?cè)丝诓灰恢驴衫斫鉃?,兩者所處的時(shí)間點(diǎn)是不同的。綜上,時(shí)期指標(biāo)依賴(lài)于所丈量的時(shí)間段,而時(shí)點(diǎn)指標(biāo)則有賴(lài)于所處的時(shí)間點(diǎn)。
時(shí)期指標(biāo)在經(jīng)濟(jì)管理上被稱(chēng)作流量,數(shù)學(xué)性質(zhì)和經(jīng)濟(jì)意義上具有可加性;而時(shí)點(diǎn)指標(biāo)被稱(chēng)作存量,不具有可加性。這就好比是蓄水池某段時(shí)間內(nèi)的流量和容積問(wèn)題:流水量的多少與時(shí)間有直接關(guān)系,把這一小時(shí)和前一小時(shí)的流水量相加代表兩個(gè)小時(shí)內(nèi)的流量,加總后具有實(shí)際意義,因此具有可加性;蓄水池的容積則是存量概念,把每個(gè)時(shí)間節(jié)點(diǎn)上的容積相加沒(méi)有任何意義,即存量不具有可加性。再比如,去超市購(gòu)物得積分,會(huì)顯示新增積分和積分總額,其中每?jī)善诨蚨嗥谛略龇e分相加是有意義的,代表該段時(shí)期的總積分,因而新增積分是時(shí)期指標(biāo);而任意幾期的積分總額相加是不具有任何實(shí)際意義的,即不具有可加性的就是時(shí)點(diǎn)指標(biāo)。綜上,區(qū)分時(shí)期指標(biāo)和時(shí)點(diǎn)指標(biāo)的另一重要依據(jù),就是看指標(biāo)相加是否有意義。
3.3.1 計(jì)算序列平均發(fā)展水平
在數(shù)據(jù)處理中常用取平均以反映一般水平的情況,即計(jì)算序列平均發(fā)展水平。通常意義上的平均,即加總除以個(gè)數(shù),然而這在序列水平分析中是不能通用的,需要根據(jù)指標(biāo)類(lèi)型選擇恰當(dāng)?shù)木涤?jì)算方法。
對(duì)于時(shí)期指標(biāo)構(gòu)成的序列是具有可加性的,因而可直接使用簡(jiǎn)便均值計(jì)算法。公式1 如下所示。
而對(duì)于時(shí)點(diǎn)序列,前文已述不可直接加總,那么如何進(jìn)行平均呢?為計(jì)算某一時(shí)點(diǎn)指標(biāo)在一定時(shí)間段內(nèi)的平均水平,操作步驟如下所述:第一步計(jì)算各時(shí)間節(jié)點(diǎn)之間的平均值作為該段時(shí)間的代表值,第二步以時(shí)點(diǎn)間隔長(zhǎng)度為權(quán)數(shù)進(jìn)行加權(quán)平均。公式2 如下所示。
特別地,當(dāng)?shù)怯洉r(shí)點(diǎn)指標(biāo)的各時(shí)點(diǎn)間隔相等時(shí),采用 “首尾折半法”,公式3 如下所示。
3.3.2 計(jì)算平均指標(biāo)和相對(duì)指標(biāo)的平均發(fā)展水平
前文已述,時(shí)期指標(biāo)和時(shí)點(diǎn)指標(biāo)是針對(duì)時(shí)間序列中總量指標(biāo)而言的,實(shí)際上,時(shí)間序列以總量指標(biāo)為基礎(chǔ),還衍生出相對(duì)指標(biāo)和平均指標(biāo),此上三者構(gòu)成時(shí)間序列全類(lèi)型。因而,要將時(shí)期和時(shí)點(diǎn)指標(biāo)的概念擴(kuò)展到平均指標(biāo)和相對(duì)指標(biāo)的平均發(fā)展水平計(jì)算和分析過(guò)程中。
在構(gòu)建由總量指標(biāo)衍生的眾多指標(biāo)時(shí),要注意區(qū)分不同狀況。分析之,平均指標(biāo)和相對(duì)指標(biāo)的類(lèi)型不外乎三種,第一,分子和分母都是時(shí)期指標(biāo);第二,分子和分母中其一是時(shí)期指標(biāo),另一是時(shí)點(diǎn)指標(biāo);第三,分子和分母都是時(shí)點(diǎn)指標(biāo)。針對(duì)第一種情況,例如“商品平均流通費(fèi)用率”,處理方法是:首先拆解“流通費(fèi)用率”的構(gòu)成,其分子“流通費(fèi)用額”和分母“零售額”都是時(shí)期指標(biāo),進(jìn)而對(duì)分子和分母分別使用簡(jiǎn)單平均(公式1),再結(jié)合計(jì)算最終平均流通費(fèi)用率的水平。第二種情況,例如“商品平均流轉(zhuǎn)次數(shù)”“人均GDP”等,無(wú)論分子、分母誰(shuí)是時(shí)點(diǎn)誰(shuí)又是時(shí)期指標(biāo),只需將時(shí)點(diǎn)指標(biāo)按首尾折半法處理(公式3),時(shí)期指標(biāo)簡(jiǎn)單平均處理即可。第三種情況,分子和分母都是時(shí)點(diǎn)指標(biāo),在時(shí)間間隔相等的前提下,都運(yùn)用首尾折半法處理,再結(jié)合為對(duì)應(yīng)的平均指標(biāo)或相對(duì)指標(biāo)即可。綜上,無(wú)論是平均指標(biāo)還是相對(duì)指標(biāo),計(jì)算其平均發(fā)展水平時(shí),首先要對(duì)指標(biāo)進(jìn)行拆解,例如,分析分子 和分母 的指標(biāo)類(lèi)型,再根據(jù)其類(lèi)型選擇相應(yīng)的平均數(shù)處理方法,最后結(jié)合為對(duì)應(yīng)的平均指標(biāo)或相對(duì)指標(biāo) 。需要強(qiáng)調(diào)的是,由于兩者都是分?jǐn)?shù)類(lèi)型的指標(biāo),在處理時(shí)注意不要混淆平均的概念,這里的平均是指分?jǐn)?shù)線上下分別取平均,最后再結(jié)合分?jǐn)?shù)形式。
為幫助研究者深入理解和把握時(shí)期和時(shí)點(diǎn)指標(biāo)的區(qū)別,設(shè)想下列情形:某人手里共有50 元錢(qián),現(xiàn)在打算全部花出去,所以買(mǎi)衣服花20,剩30;買(mǎi)拖鞋花15,剩15;買(mǎi)糖果花9 元,剩6 元;最后6 元買(mǎi)了食品。綜上花的錢(qián)一共是50 元,可為什么剩余金額總計(jì)51 元了呢?上述過(guò)程如表1 所示。
表1 某人消費(fèi)支出與剩余情況 單位:元
在深入理解上文關(guān)于時(shí)期指標(biāo)和時(shí)點(diǎn)指標(biāo)的區(qū)別之后,該問(wèn)題就不再是難題,因?yàn)槭S嗟腻X(qián)相加是沒(méi)有意義的。從數(shù)據(jù)可加性的角度,“剩余的錢(qián)”是不同時(shí)點(diǎn)上的數(shù)據(jù),代表的是一種存量,即不可相加。這就好比我們每次去銀行取錢(qián),流水單會(huì)顯示支出和卡內(nèi)的余額,試想把幾次取款的卡余額相加并不能代表財(cái)富的多少,也沒(méi)有其他意義,所以諸如該類(lèi)的時(shí)點(diǎn)指標(biāo)是不能相加的。
綜上所述,進(jìn)行時(shí)間序列分析的必要前提是正確區(qū)分構(gòu)成時(shí)間序列各指標(biāo)的類(lèi)型,切勿盲目進(jìn)行一般化的處理,否則會(huì)造成結(jié)果有失。時(shí)間序列是目標(biāo)社會(huì)現(xiàn)象在不同時(shí)間點(diǎn)上的連續(xù)記錄,按時(shí)間先后原則順次排布,它是數(shù)據(jù)存在的主要形式之一,也是大數(shù)據(jù)時(shí)代數(shù)據(jù)生成并記錄的重要形式。正確識(shí)別時(shí)間序列的類(lèi)型,掌握時(shí)期指標(biāo)和時(shí)點(diǎn)指標(biāo)序列差別化的數(shù)據(jù)處理方式,有助于后續(xù)數(shù)據(jù)分析過(guò)程順利開(kāi)展,以準(zhǔn)確指導(dǎo)決策行為。