[摘 要]在經(jīng)濟(jì)學(xué)領(lǐng)域時(shí)間序列是一種十分重要的方法,通過(guò)這種方法可以有效的描述出數(shù)據(jù)在一段時(shí)間內(nèi)的具體變化規(guī)律,這對(duì)研究經(jīng)濟(jì)發(fā)展問(wèn)題、醫(yī)學(xué)發(fā)展、工程建設(shè)等都是十分重要的。而對(duì)非平穩(wěn)時(shí)間序列數(shù)據(jù)的相似性研究對(duì)于各個(gè)領(lǐng)域的發(fā)展所起到的作用也是十分重要的。所以接下來(lái)在本文中我們就來(lái)詳細(xì)的分析一下非平穩(wěn)時(shí)間序列數(shù)據(jù)所存在的相似性,以及具體的研究方法。
[關(guān)鍵詞]非平穩(wěn)時(shí)間序列 相似性 研究方法
一、引言
時(shí)間序列在經(jīng)濟(jì)學(xué)、醫(yī)學(xué)、工程建設(shè)研究過(guò)程中起到的作用是十分重要的,通過(guò)使用這種方法可以提高數(shù)據(jù)分析的準(zhǔn)確性。時(shí)間序列具體指的就是在一個(gè)隨機(jī)的過(guò)程中,如果隨著時(shí)間變化隨機(jī)過(guò)程的特征不發(fā)生變化,就是平穩(wěn)的時(shí)間序列,如果隨著時(shí)間的變化隨機(jī)過(guò)程特征也發(fā)生變化,就稱(chēng)為非平穩(wěn)的時(shí)間序列。在解決實(shí)際問(wèn)題過(guò)程中,序列是我們經(jīng)常遇見(jiàn)的,尤其是那些反映經(jīng)濟(jì)現(xiàn)象或者是社會(huì)問(wèn)題的序列,這些序列通常情況下都是不平穩(wěn)的,具有周期性和趨勢(shì)性。
二、非平穩(wěn)時(shí)間序列的預(yù)測(cè)方法
1.回歸方法,該方法是G.U.Yule在1920年提出的,但是這種方法在進(jìn)行數(shù)據(jù)預(yù)測(cè)時(shí)并沒(méi)有起到太大的影響。所以在實(shí)際研究過(guò)程中并沒(méi)有得到廣泛的應(yīng)用。
2.ARIMA模型,70年代以后提出了ARIMA模型出現(xiàn)了,該模型在國(guó)際上產(chǎn)生了極大的影響,是現(xiàn)在世界上理論最為完善的預(yù)測(cè)方式。隨著計(jì)算機(jī)技術(shù)的快速發(fā)展,該方法也得到了進(jìn)一步的發(fā)展,所以該方法得到了廣泛的關(guān)注。
三、時(shí)間序列相似性研究
1.時(shí)間序列分段算法
目前在計(jì)算非平穩(wěn)時(shí)間序列數(shù)據(jù)的相似性方法時(shí)最常用的方法就是分段計(jì)算。主要包括三個(gè)方面,即累計(jì)殘差、平均殘差以及最大偏差。
2.改進(jìn)算法
隨著社會(huì)的快速發(fā)展,傳統(tǒng)的分段算法已經(jīng)不能準(zhǔn)確的反映時(shí)間序列的發(fā)展?fàn)顩r,產(chǎn)生的結(jié)果也不能滿(mǎn)足各領(lǐng)域的發(fā)展需要。目前主要存在兩個(gè)問(wèn)題,一個(gè)是這種方法不能在短時(shí)間之內(nèi)有效的分析出數(shù)據(jù)的變化趨勢(shì);二是采用平均誤差分段算法不能在長(zhǎng)時(shí)間內(nèi)做好數(shù)據(jù)的分界工作,還會(huì)出現(xiàn)很大的偏差。
現(xiàn)在存在的分段線(xiàn)性算法都存在著很大的缺陷,通過(guò)分析我們可以發(fā)現(xiàn)以下兩個(gè)問(wèn)題:
①過(guò)擬合:在分析整個(gè)分段時(shí),我們可以將其分成兩段,這樣就可以獲得更好的效果。
②欠擬合:在短時(shí)間內(nèi),因?yàn)榇嬖诜e累殘差這樣就可能出現(xiàn)數(shù)據(jù)的大波動(dòng),這是由數(shù)據(jù)的不敏感性造成的。
3.子序列線(xiàn)性度
一般我們采用子序列線(xiàn)性度來(lái)衡量子序列的擬合程度,該方法是在累積殘差的基礎(chǔ)上進(jìn)行的。如果線(xiàn)性度越高,與原始數(shù)據(jù)之間的距離越近。
4.雙誤差閥值算法
累計(jì)殘差在計(jì)算數(shù)據(jù)序列時(shí)沒(méi)有考慮子序列平均殘差的狀況,所以能夠有效的覆蓋數(shù)據(jù)波動(dòng)的狀況。但是在實(shí)際分段過(guò)程中會(huì)存在較大的誤差。這也會(huì)影響計(jì)算的準(zhǔn)確性。
四、相似性分析方法的優(yōu)劣
在本文中我們?cè)敿?xì)的介紹了有關(guān)時(shí)間序列數(shù)據(jù)相似性分析的方法,通過(guò)對(duì)這些方法進(jìn)行分析和總結(jié)發(fā)現(xiàn)主要有以下三個(gè)問(wèn)題:
第一,在選擇分析相似性的度量標(biāo)準(zhǔn)時(shí),存在以下幾個(gè)問(wèn)題:
1.在度量時(shí)間距離相似性時(shí),如果選擇歐式幾何距離作為標(biāo)準(zhǔn)會(huì)存在很多問(wèn)題,盡管通過(guò)研究我們已經(jīng)提出了一些具體的改進(jìn)措施,但是仍然不能完全彌補(bǔ)這些問(wèn)題。
2.在提出相似性的概念時(shí)存在一定的主觀性,也就是說(shuō)相似性只存在在某些約束條件之下才能進(jìn)行。研究非平穩(wěn)時(shí)間序列數(shù)據(jù)相似問(wèn)題就是探討函數(shù)之間的關(guān)系。
第二,在計(jì)算序列數(shù)據(jù)相似性時(shí)最主要的就是要研究時(shí)間的復(fù)雜程度以及特征。所以在比較相似性時(shí)通常采取以下幾種方法,即分段累計(jì)近似、離散傅里葉變換、離散小波變換、界標(biāo)模型等等。這些方法在研究相似性問(wèn)題時(shí)主要有兩個(gè)基本思路,即處理分段特征以及處理正交變換。
第三,這些方法在雖然仍然存在一些問(wèn)題,但是在實(shí)際應(yīng)用過(guò)程中仍然發(fā)揮了極大的作用。
五、需要研究的問(wèn)題
對(duì)于非平穩(wěn)時(shí)間序列數(shù)據(jù)的相似性問(wèn)題已經(jīng)得到了一定的發(fā)展,但是在研究過(guò)程中仍然存在很多難點(diǎn),比如相似性的定義,具體的算法,以及復(fù)雜程度的衡量等等。
六、總結(jié)
隨著社會(huì)與經(jīng)濟(jì)的快速發(fā)展,對(duì)經(jīng)濟(jì)的研究也越來(lái)越多,這就需要我們加強(qiáng)對(duì)經(jīng)濟(jì)發(fā)展中各種數(shù)據(jù)的研究,這樣才能獲取更多有用的信息,才能進(jìn)一步掌握經(jīng)濟(jì)發(fā)展的規(guī)律,制定適當(dāng)?shù)陌l(fā)展計(jì)劃。而非平穩(wěn)時(shí)間序列數(shù)據(jù)的分析就是一種極其重要的方法,在未來(lái)該方法會(huì)起到極其重要的作用,我們應(yīng)該加強(qiáng)對(duì)這種方式的研究。
參考文獻(xiàn):
[1]毛國(guó)君.段麗娟等,數(shù)據(jù)挖掘原理與算法.[M].清華大學(xué)出版社.2005
[2]張軍.基于時(shí)間序列相似性的數(shù)據(jù)挖掘方法研究.[D].南京.東南大學(xué).2004
[3]王露珊.對(duì)時(shí)間序列相似性查詢(xún)的最優(yōu)小波誤差估計(jì).[J].計(jì)算機(jī)應(yīng)用.2007