杜彤彤
(天津商業(yè)大學,天津 300000)
我國知識產(chǎn)權(quán)事業(yè)不斷發(fā)展,發(fā)明專利是知識產(chǎn)權(quán)的一種形式,作為技術(shù)創(chuàng)新信息的載體,發(fā)明專利的授權(quán)數(shù)量可以在一定程度上反應(yīng)社會公眾創(chuàng)新意識的程度,其中專利價值既包括對全社會知識存量貢獻的社會價值,又包括其所創(chuàng)造的經(jīng)濟價值[1],與地區(qū)發(fā)展之間有密切聯(lián)系。地區(qū)發(fā)明專利的授權(quán)數(shù)量可以較好地衡量地區(qū)突破性技術(shù)創(chuàng)新水平,反映地區(qū)的綜合實力[2]。本文運用ARIMA 模型和GM(1,1)模型對天津市發(fā)明專利的授權(quán)數(shù)量分別進行預測。通過本文的研究,為天津市出臺加強知識產(chǎn)權(quán)保護政策提供參考,同時能加深對知識產(chǎn)權(quán)保護和成果轉(zhuǎn)化的重視程度,在此基礎(chǔ)上對天津市制定地區(qū)專利規(guī)劃提出合理建議,具有重要的理論和現(xiàn)實意義。
本文為衡量天津市的綜合創(chuàng)新能力,選取2003—2020年天津市發(fā)明專利的授權(quán)數(shù)量作為原始數(shù)據(jù),共18 期數(shù)據(jù),來預測2021年和2022年兩年天津市發(fā)明專利的授權(quán)數(shù)量,數(shù)據(jù)均來源于天津市統(tǒng)計年鑒。
1.2.1 ARIMA 模型
本文選擇ARIMA 模型來建立預測模型。ARIMA 模型的全稱是差分自回歸移動平均(Auto-Regressive Integrated Moving Average)模型,其是由Box 和Jenkins 提出的時間序列預測方法,是一種精度較高的時間序列短期預測方法,目的是根據(jù)過去的行為對未來的行為進行預測。ARIMA 模型的基本思想是將預測對象隨時間推移而形成的數(shù)據(jù)序列視為一個隨機序列,用一定的數(shù)學模型來近似描述這個序列,這個模型一旦被識別后就可以通過時間序列的過去值及現(xiàn)在值來預測未來值,在實際分析的過程中,對于不平穩(wěn)的時間序列來說,經(jīng)過d 次差分,轉(zhuǎn)化為平穩(wěn)序列后服從ARMA(p,q)模型,則稱時間序列服從于ARIMA(p,d,q)模型,具體模型形式如公式(1)所示。
式中:yt為t年份的專利授權(quán)數(shù)取對數(shù);φp為自相關(guān)系數(shù);θq為滑動系數(shù);εt-q為q階誤差值。
具體建模步驟如下:首先,判斷序列的平穩(wěn)性,如果數(shù)據(jù)非平穩(wěn),那么對原序列進行d 階差分運算,使其轉(zhuǎn)化為平穩(wěn)序列。其次,根據(jù)時間序列的自相關(guān)系數(shù)(ACF)和偏自相關(guān)系數(shù)(PACF)識別參數(shù)p、q,擬合合適的ARMA模型。最后,檢驗?zāi)P蛥?shù)是否顯著,殘差是否為白噪聲序列,判斷模型的擬合程度和有效性,并利用所擬合的模型對未來數(shù)據(jù)進行預測分析。
1.2.2 GM(1,1)模型
灰色預測是對含有已知和未知信息的系統(tǒng)進行預測,通過對系統(tǒng)因素之間的發(fā)展趨勢進行關(guān)聯(lián)分析,尋找其變化的規(guī)律,并對事物的發(fā)展趨勢進行預測。主要特點是模型使用的不是原始數(shù)據(jù)序列,而是生成的數(shù)據(jù)序列?;疑A測所需的樣本較少,且對于具有不確定性因素的復雜系統(tǒng)預測效果較好,GM(1,1)預測模型是其最常見的模型,常被用于經(jīng)濟預測分析。具體模型如公式(2)~公式(5)所示。
設(shè)原始序列:
通過一次累加生成新序列:
并做出X(1)的緊鄰均值序列:
建立GM(1,1)模型:
式中:x(0)(k)為原始數(shù)據(jù),即已知年份專利授權(quán)數(shù);a為發(fā)展系數(shù),它反映的是x(1)和x(0)之間的發(fā)展態(tài)勢;b為灰作用量,它的大小反映數(shù)據(jù)變化之間的關(guān)系。z(1)(k)為通過一次累加生成新序列后的緊鄰均值序列數(shù)據(jù)。
模型最小二乘估計滿足公式(6)。
求解a,b后,得到GM(1,1)灰色微分方程的白化方程,如公式(7)所示。
其離散解,如公式(8)所示。
式中:a為發(fā)展系數(shù),其反映x(1)與x(0)之間的發(fā)展態(tài)勢;b為灰作用量,其大小反映數(shù)據(jù)變化之間的關(guān)系。
最終得到還原值,如公式(9)所示。
對得出的模型進行殘差檢驗和后驗查檢驗。
其次,計算其相對誤差序列,如公式(12)和公式(13)所示。
最后,計算平均相對誤差,如公式(14)所示。
平均相對誤差值越小,說明模型的預測效果越好。使用后驗差檢驗時,計算原始序列的標準差,如公式(15)所示。
式中:X(0)(i)為原始序列。
和絕對誤差的標準差如公式(16)所示。
計算方差比,如公式(17)所示。
和小概率誤差如公式(18)所示。
式中:S1為原始序列的標準差。
根據(jù)方差比和小概率誤差的值對比后驗查檢驗判別參照表判斷模型的精度。
首先,檢驗原始時間序列是否具有平穩(wěn)性,根據(jù)2003—2020年天津市發(fā)明專利的授權(quán)數(shù)量對數(shù)繪制專利授權(quán)數(shù)量對數(shù)隨著年份變化的時序圖,觀察圖中走勢可以發(fā)現(xiàn),專利授權(quán)書對數(shù)隨著年份更迭呈現(xiàn)穩(wěn)定增長的趨勢。為精確地判斷序列的平穩(wěn)性,運用SPSS 軟件對序列進行單位根檢驗,并選擇適合的差分階數(shù)對序列進行平穩(wěn)化處理(見表1)。對數(shù)時序圖如圖1所示。
圖1 專利授權(quán)數(shù)量對數(shù)時序圖
表1 一階差分序列ADF 檢驗結(jié)果
由檢驗結(jié)果可知,原始序列不能拒絕存在單位根的原假設(shè),因此原始序列不平穩(wěn)。對一階差分序列檢驗的P<0.05,因此拒絕原假設(shè),一階差分序列具有平穩(wěn)性。通過觀察一階差分時序圖的走勢可以發(fā)現(xiàn),在一階差分時序圖中的時間序列走勢已經(jīng)趨于平穩(wěn)狀態(tài),觀察表1 可知,0階差分時的P值為0.265,1 階差分時的P值為0.007,根據(jù)一階差分序列ADF 的檢驗結(jié)果和時序圖走勢可以判斷在一階差分序列已經(jīng)趨于平穩(wěn)狀態(tài)。因此,確定ARIMA(p,d,q)模型中d=1。根據(jù)一階差分序列的自相關(guān)系數(shù)和偏自相關(guān)系數(shù)可確定模型中p和q的值。
一階差分序列自相關(guān)系數(shù)和偏自相關(guān)系數(shù)見表2,由1-15 階延遲的自相關(guān)系數(shù)變化趨勢和偏自相關(guān)系數(shù)變化趨勢可以看出偏自相關(guān)。函數(shù)表現(xiàn)為拖尾,自相關(guān)函數(shù)表現(xiàn)為一階截尾,經(jīng)過多次模型檢驗,并采取最小AIC 準則,最終本文選擇的模型為ARIMA(0,1,1),模型參數(shù)估計見表3。
表2 一階差分的自相關(guān)性
表3 模型參數(shù)估計
對模型殘差進行白噪聲檢驗,得出1-12 階的AC值分別為0.001、-0.061、0.157、0.041、-0.073、0.113、0.081、-0.080、-0.234、0.139、-0.012、-0.084。
PAC值分別為0.001、-0.061、0.158,0.036、-0.056、0.097,0.062、-0.055,-0.263、0.114、-0.007、-0.004。
標準誤差分別為0.00004,0.0796、0.6464、0.6883、0.8315,1.2059、1.4170、1.6473,3.8532、4.7385、4.7458、5.2007。
2-12 階的p值分別為0.778、0.724、0.876,0.934、0.944、0.965、0.977、0.870、0.856、0.907、0.921。
可以看出各階相關(guān)系數(shù)的p值>0.05,說明殘差為白噪聲序列,原始序列中的有效信息已被充分提取。
根據(jù)表中模型參數(shù)估計的結(jié)果可知:C值為0.184358,MA(1)的值為0.744589,模型擬合公式如公式(19)所示。
式中:yt為預測值;εt-1為t-1 時刻的殘差。
用模型對2019年和2020年天津市發(fā)明專利的授權(quán)數(shù)量進行預測,將得到的數(shù)據(jù)與實際數(shù)據(jù)進行對比,并利用該模型對2021年和2022年天津市發(fā)明專利的授權(quán)數(shù)量進行預測,得到的結(jié)果見表4。即通過ARIMA(0,1,1)模型預測的2019年和2020年天津市發(fā)明專利的授權(quán)數(shù)量的相對誤差分別為0.08 和0.05。
表4 模型ARIMA(0,1,1)預測值和預測誤差
GM 模型適應(yīng)于小樣本情況,為選擇最佳數(shù)據(jù)維度,列舉2013—2018年、2012—2018年及2011—2018年的數(shù)據(jù)對2019年和2020年的預測結(jié)果。選用后驗查檢驗對模型進行檢驗和選擇。其中,m為數(shù)據(jù)維度,c為模型方差比,p為小殘差概率。根據(jù)預測結(jié)果并結(jié)合后驗查檢驗判別參照表,選取m等于7 的GM(1,1)模型對2021年和2022年天津市發(fā)明專利的授權(quán)數(shù)量進行預測,所得到的預測數(shù)據(jù)見表5。通過GM(1,1)模型預測2019年天津市發(fā)明專利的授權(quán)數(shù)量2013—2018年、2012—2018年及2011—2018年的相對誤差分別為0.17、0.06、0.08;2020年天津市發(fā)明專利的授權(quán)數(shù)量2013—2018年、2012—2018年及2011—2018年的相對誤差分別為0.13、0.03、0.08。
表5 模型GM(1,1)預測值和預測誤差
從表6 可以看出ARIMA(0,1,1)模型和GM(1,1)模型預測的平均相對誤差都較小,ARIMA(0,1,1)模型預測的平均相對誤差為0.065,而GM(1,1)模型預測的平均相對誤差為0.045。對于預測天津市發(fā)明專利的授權(quán)數(shù)量,GM(1,1)模型的預測結(jié)果更精準,更適用于小樣本情況下的短期預測。
表6 模型預測結(jié)果對比
利用GM(1,1)模型所預測2021年和2022年的預測值與實際值之間的平均相對誤差<5%,說明該模型的預測結(jié)果可靠,可以用該模型預測未來天津市發(fā)明專利授權(quán)數(shù)量的變化規(guī)律。通過ARIMA(0,1,1)模型和GM(1,1)模型的預測結(jié)果可知,天津市發(fā)明專利授權(quán)數(shù)量呈上升趨勢,創(chuàng)新能力將進一步提高。地區(qū)的發(fā)明專利對其經(jīng)濟高質(zhì)量發(fā)展有促進作用,這體現(xiàn)了創(chuàng)新對于社會發(fā)展的重要意義。提高創(chuàng)新能力,加大創(chuàng)新對社會經(jīng)濟的影響應(yīng)注重以下幾個方面。首先,應(yīng)從公眾角度提高社會公眾的產(chǎn)權(quán)意識。其次,專利數(shù)量是衡量地區(qū)創(chuàng)新能力的一種方法,應(yīng)重視創(chuàng)新質(zhì)量的提升,要協(xié)調(diào)專利數(shù)量和質(zhì)量的協(xié)調(diào)發(fā)展。最后,提高各產(chǎn)業(yè)積極投身于創(chuàng)新研發(fā)的動力,激勵更多的人們投身于高質(zhì)量創(chuàng)新的事業(yè)中,不斷促進社會主義市場經(jīng)濟的發(fā)展。