陳昭陽(yáng),楊德智,馬 薇,高 虹,彭 燕
國(guó)家知識(shí)產(chǎn)權(quán)局專利審查協(xié)作中心,北京 100084
基于小波包分析的組合模型的專利申請(qǐng)量預(yù)測(cè)
陳昭陽(yáng),楊德智,馬 薇,高 虹,彭 燕
國(guó)家知識(shí)產(chǎn)權(quán)局專利審查協(xié)作中心,北京 100084
運(yùn)用小波包多分辨分解和重構(gòu)技術(shù),將專利申請(qǐng)量時(shí)間序列分解為同尺度的趨勢(shì)項(xiàng)、季節(jié)項(xiàng)、循環(huán)項(xiàng)和不規(guī)則項(xiàng)等四項(xiàng)內(nèi)在規(guī)律項(xiàng),再把分解后的四項(xiàng)進(jìn)行單支重構(gòu),針對(duì)重構(gòu)各項(xiàng)的統(tǒng)計(jì)特征分別采用ARIMA和ARMA不同模型進(jìn)行建模預(yù)測(cè),最后根據(jù)各項(xiàng)預(yù)測(cè)結(jié)果計(jì)算出專利申請(qǐng)量的預(yù)測(cè)值。通過對(duì)分類號(hào)為A61B專利申請(qǐng)量的分析和驗(yàn)證,表明基于小波包分析的組合預(yù)測(cè)模型比傳統(tǒng)單一預(yù)測(cè)模型的預(yù)測(cè)精度更高。
小波包分析;專利申請(qǐng)量;ARIMA模型;ARMA模型;時(shí)間序列;預(yù)測(cè)
對(duì)各國(guó)家專利局而言,準(zhǔn)確預(yù)測(cè)和估計(jì)專利申請(qǐng)量對(duì)審查能力規(guī)劃決策至關(guān)重要。歐美的專利局長(zhǎng)期把握著該項(xiàng)預(yù)測(cè)工作的關(guān)鍵技術(shù)和發(fā)展脈絡(luò)[1,2],這些局大多采用了傳統(tǒng)的專利申請(qǐng)量的數(shù)理統(tǒng)計(jì)模型預(yù)測(cè)方法,包括自回歸模型(AR)、滑動(dòng)平均模型(MA)、自回歸滑動(dòng)平均模型(ARMA)以及整合自回歸滑動(dòng)平均模型(ARIMA),這些方法大多采用單一模型對(duì)專利申請(qǐng)量進(jìn)行預(yù)測(cè),不考慮專利申請(qǐng)量的時(shí)間序列內(nèi)在的變化情況,通常會(huì)丟失重要的趨勢(shì)項(xiàng)信息,因此,無(wú)法取得高精度的預(yù)測(cè)結(jié)果[1-5]。作為一種典型的時(shí)間序列,專利申請(qǐng)量基本運(yùn)動(dòng)變化是由趨勢(shì)項(xiàng)、季節(jié)項(xiàng)、循環(huán)項(xiàng)和不規(guī)則項(xiàng)疊加構(gòu)成。而且,趨勢(shì)項(xiàng)、季節(jié)項(xiàng)、循環(huán)項(xiàng)和不規(guī)則項(xiàng)描述了專利申請(qǐng)量的時(shí)間序列按不同時(shí)間和頻率運(yùn)動(dòng)變化的本質(zhì)。因此,要全面掌握和預(yù)測(cè)專利申請(qǐng)量的動(dòng)態(tài)變化,獲得專利申請(qǐng)量時(shí)間序列的基本運(yùn)動(dòng)成分是關(guān)鍵。
小波包分析作為一種自適應(yīng)的時(shí)-頻局部分析理論,采用多分辨分解與重構(gòu)將時(shí)間序列分解到同尺度下的不同頻率上,從而聚焦專利申請(qǐng)量的動(dòng)態(tài)發(fā)展變化的各細(xì)節(jié)。采用小波包分析將專利申請(qǐng)量分解為趨勢(shì)項(xiàng)、季節(jié)項(xiàng)、循環(huán)項(xiàng)和不規(guī)則項(xiàng),然后根據(jù)各項(xiàng)的統(tǒng)計(jì)特征分別采用ARIMA和ARMA組合建模方法,能夠獲得較為準(zhǔn)確的專利申請(qǐng)量的預(yù)測(cè)模型。這樣將小波包分析與經(jīng)典的時(shí)間序列預(yù)測(cè)建模方法結(jié)合起來,從而為專利申請(qǐng)量的建模與預(yù)測(cè)提供了一種新的方法,可提高預(yù)測(cè)精度。
對(duì)于專利申請(qǐng)量的時(shí)間序列,將其進(jìn)行i=2層小波包分解為趨勢(shì)項(xiàng)、季節(jié)項(xiàng)、循環(huán)項(xiàng)和不規(guī)則項(xiàng)四項(xiàng),然后進(jìn)行重建為如下四項(xiàng):
對(duì)于專利申請(qǐng)量的時(shí)間序列,采用小波包分解為2層,獲得同尺度下的趨勢(shì)項(xiàng)、季節(jié)項(xiàng)、循環(huán)項(xiàng)和不規(guī)則項(xiàng)等4個(gè)內(nèi)在規(guī)律項(xiàng),然后進(jìn)行單支重構(gòu),對(duì)重構(gòu)的各項(xiàng)分別采用ARIMA和ARMA模型進(jìn)行預(yù)測(cè)建模,建立起專利申請(qǐng)量的小波包分析組合預(yù)測(cè)模型,如下圖所示:
專利申請(qǐng)量時(shí)間序列的小波包預(yù)測(cè)組合模型圖
首先,按月統(tǒng)計(jì)從1985年4月1日至2008年12月間的(一共282個(gè)月)、分類號(hào)為A61B的發(fā)明專利申請(qǐng)量,如圖1所示。
采用‘db4’小波函數(shù)對(duì)上述分類號(hào)為A61B的專利申請(qǐng)量進(jìn)行小波包分解,分解2層后獲得專利申請(qǐng)量的趨勢(shì)項(xiàng)、季節(jié)項(xiàng)、循環(huán)項(xiàng)和不規(guī)則項(xiàng),如圖2所示。
圖1 A61B發(fā)明專利申請(qǐng)的時(shí)間序列圖
圖2 專利申請(qǐng)量的小波包分解圖
然后對(duì)小波包分解后的各項(xiàng)進(jìn)行小波包單支重構(gòu),如圖3所示:
圖3 專利申請(qǐng)量的小波包重構(gòu)圖
圖4 對(duì)趨勢(shì)項(xiàng)、季節(jié)項(xiàng)、循環(huán)項(xiàng)和不規(guī)則項(xiàng)的預(yù)測(cè)值
將專利申請(qǐng)量的小波包分解重構(gòu)的趨勢(shì)項(xiàng)進(jìn)行平穩(wěn)性校驗(yàn),由該序列的校驗(yàn)特征顯示該趨勢(shì)項(xiàng)為非平穩(wěn)序列,則采用ARIMA進(jìn)行12個(gè)月的專利申請(qǐng)量預(yù)測(cè);對(duì)小波包分解重構(gòu)的季節(jié)項(xiàng)、循環(huán)項(xiàng)和不規(guī)則項(xiàng)進(jìn)行平穩(wěn)性校驗(yàn),結(jié)果均為平穩(wěn)序列,則采用ARMA進(jìn)行12個(gè)月專利申請(qǐng)量的預(yù)測(cè)。
最后累加上述四項(xiàng)預(yù)測(cè)值就獲得A61B領(lǐng)域的2009年度的12個(gè)月的發(fā)明專利申請(qǐng)量的預(yù)測(cè)值,各項(xiàng)由282個(gè)月的專利申請(qǐng)量對(duì)后12個(gè)月的預(yù)測(cè)值如圖4所示。
采用單一的ARIMA模型和基于小波包分析的組合模型預(yù)測(cè)分別對(duì)A61B領(lǐng)域的2009年度12個(gè)月的專利申請(qǐng)量進(jìn)行預(yù)測(cè),并與實(shí)際值進(jìn)行比較,計(jì)算相對(duì)誤差,如表1所示:
表1 兩種模型的專利申請(qǐng)量預(yù)測(cè)值與實(shí)際值的比較
由計(jì)算出的相對(duì)誤差,得出兩種預(yù)測(cè)方法的各月的平均相對(duì)誤差分別是:17.13%和13.1%,可見基于小波包分析的組合模型對(duì)專利申請(qǐng)量的預(yù)測(cè)更為準(zhǔn)確。
本文針對(duì)專利申請(qǐng)量的時(shí)間序列預(yù)測(cè)問題,提出了基于小波包分析的組合模型,對(duì)專利申請(qǐng)的時(shí)間序列進(jìn)行小波包分解,獲得申請(qǐng)量的同尺度下的趨勢(shì)項(xiàng)、季節(jié)項(xiàng)、循環(huán)項(xiàng)和不規(guī)則項(xiàng),針對(duì)四項(xiàng)不同的統(tǒng)計(jì)特征匹配不同的預(yù)測(cè)模型,建立了與歐美專利不同的專利申請(qǐng)量預(yù)測(cè)方法,由以上實(shí)證研究表明:基于小波包分析的組合模型的預(yù)測(cè)方法的預(yù)測(cè)精度要遠(yuǎn)高于單一的ARIMA模型預(yù)測(cè)的精度,為我國(guó)專利申請(qǐng)量預(yù)測(cè)方法提供了更多的參考,同時(shí),也為我國(guó)專利局規(guī)劃和布局資源提供了必要的支持。
[1]P.Hingley and M.Nicolas.Methods for forecasting numbers of patent applications at the european patent office.World Patent Information[J],2004,3(26):191-204.
[2]彼得·欣利,馬可·尼古拉斯.創(chuàng)新力預(yù)測(cè):專利申請(qǐng)量預(yù)測(cè)方法研究[M].知識(shí)產(chǎn)權(quán)出版社,2010,1.
[3]Sheng XU,Tao QI,Liping ZHENG.Forecasting the Patent Applications Based on the Wavelet Transform and Potential Support Vector Machines.Journal of Computational Information Systems[J],2010,Vol.6(11):3633-3641.
[4]梁津娣,馬歡,等.中國(guó)專利申請(qǐng)量預(yù)測(cè)體系的初步研究[M].國(guó)家知識(shí)產(chǎn)權(quán)局學(xué)術(shù)委員會(huì)一般課題(Y060201),2007,3.
[5]陳小霞.專利申請(qǐng)量預(yù)測(cè)與實(shí)際申請(qǐng)量存在較大誤差[J].中國(guó)發(fā)明與專利,2008(1):85-86.
[6]王卓群,孫志國(guó).一種小波分解回聲狀態(tài)網(wǎng)絡(luò)時(shí)間序列預(yù)測(cè)方法[J].電子測(cè)量與儀器學(xué)報(bào),2010,24(10):947-952.
TP39
A
1674-6708(2011)50-0227-02