盧成曉
(閩南師范大學(xué) 圖書館,福建 漳州 363000)
微信公眾號作為高校圖書館服務(wù)讀者的主要工具之一,其用戶的數(shù)量和活躍度是反映圖書館服務(wù)成效的關(guān)鍵指標(biāo)之一。由于受多種因素,如微信公眾號推廣工作的力度、推送圖文消息的頻率、圖文內(nèi)容等的影響[1],用戶關(guān)注量會時刻發(fā)生變化。為了準(zhǔn)確把握高校圖書館微服務(wù)規(guī)律及特征,提升服務(wù)質(zhì)量,對用戶關(guān)注量的變化趨勢做出精準(zhǔn)預(yù)測是非常有必要的。
目前有關(guān)時間序列模型應(yīng)用于高校圖書館微信公眾號用戶關(guān)注量預(yù)測研究的文獻(xiàn)比較少。熊楓等人采用時間序列ARIMA模型對微信公眾號用戶量進(jìn)行了預(yù)測分析。ARIMA模型采用差分方法建模,可以比較充分地提取確定性信息,不足之處是不易對模型做出直觀解釋。殘差自回歸模型彌補了ARIMA模型的這一缺點,不僅提取了確定性信息,還擬合了殘差序列,其優(yōu)點是結(jié)果便于解釋、擬合精度高等,被廣泛應(yīng)用于確定性趨勢明顯的時間序列數(shù)據(jù)[2-4],如傳染病發(fā)病數(shù)預(yù)測[4]、GDP預(yù)測[5]等。二次指數(shù)平滑法適用于線性趨勢預(yù)測[6],如GDP預(yù)測[7]、價格預(yù)測[8]等,其計算結(jié)果能應(yīng)用統(tǒng)計軟件快速得到。
筆者擬采用殘差自回歸模型和二次指數(shù)平滑法,運用計量經(jīng)濟(jì)學(xué)軟件Eviews 10對某高校圖書館微信公眾號關(guān)注量進(jìn)行擬合預(yù)測,探索能反映其實際變化趨勢且精度較高的預(yù)測模型。
殘差自回歸模型是先利用確定性因素分解法提取序列中的主要確定性信息趨勢效應(yīng)和季節(jié)效應(yīng),然后采用Durbin-Waston檢驗(簡稱“DW檢驗”)來檢驗確定性模型擬合后的殘差序列{εt}的自相關(guān)性,若殘差序列不存在自相關(guān)性,則說明回歸模型對原始序列的信息提取比較充分,模型擬合停止;若殘差序列自相關(guān)性顯著,為了提高擬合精度,需進(jìn)一步對殘差序列進(jìn)行擬合來提取相關(guān)信息。該模型具體公式如下[2]:
(1)
式中,Tt為趨勢效應(yīng)擬合,St為季節(jié)效應(yīng)擬合,θi為回歸系數(shù),εt為殘差序列,且滿足E(vt)=0,D(vt)=σ2,CoV(vt,vt-i)=0,?i≥1。
二次指數(shù)平滑是在一次指數(shù)的基礎(chǔ)上對數(shù)據(jù)再做一次指數(shù)平滑。該方法適用于線性趨勢預(yù)測。計算公式如下[6]:
St=αyt+(1-α)St-1,Dt=αSt+(1-α)Dt-1
(2)
其中:St是一次指數(shù)平滑值;Dt是二次指數(shù)平滑值;α(0≤α≤1)是平滑系數(shù)。
預(yù)測公式為:
(3)
從某高校微信后臺獲取2016年1月—2021年3月的圖書館微信用戶日增長數(shù)據(jù),整理得到2016年1月—2021年3月共63個月的微信公眾號累計關(guān)注人數(shù)的月數(shù)據(jù),并將其作為微信公眾號關(guān)注量。
本文選取前60個月數(shù)據(jù)作為訓(xùn)練樣本建立預(yù)測模型,后3個月數(shù)據(jù)作為測試樣本檢驗?zāi)P偷挠行裕詈罄眠x取的模型預(yù)測2021年4月—6月的微信公眾號關(guān)注量。
2.3.1 殘差自回歸模型建立。利用Eviews 10軟件繪制出2016年1月—2020年12月的微信公眾號關(guān)注量的時序圖,如圖1所示。
圖1 微信關(guān)注量Y的時序圖
由圖1可以看出,序列Y整體上呈明顯的線性增長趨勢。
將2016年1月—2020年12月依次對應(yīng)為時間變量t=1,2,3,…,60, 建立以時間變量t為自變量,Y為因變量的線性回歸模型,估計結(jié)果如圖2所示。
圖2 線性回歸模型估計結(jié)果
由圖2可以看出,該模型參數(shù)都具有統(tǒng)計意義,R2=0.985說明該模型提取了Y序列98.5%的信息,模型擬合度高;DW=0.498說明該模型的殘差序列{εt}具有很強的自相關(guān)性,需進(jìn)一步對殘差序列建立自回歸模型,提取相關(guān)信息。
殘差序列{εt}的自相關(guān)函數(shù)(ACF)和偏自相關(guān)函數(shù) (PACF)圖,如圖3所示。
圖3 殘差序列{εt}的ACF與PACF圖
由圖3可以看出,此序列的自相關(guān)函數(shù)拖尾,偏自相關(guān)函數(shù)截尾,可以考慮建立AR(p)模型,其中p選擇1或2。經(jīng)過模型結(jié)果對比,最終選擇建立AR(1)模型。模型估計結(jié)果如圖4所示。
圖4 AR(1)模型估計結(jié)果
由圖4可以看出,該模型參數(shù)具有統(tǒng)計意義,R2=0.555說明該模型擬合度較高。進(jìn)一步利用DW檢驗法檢驗此模型殘差序列的自相關(guān)性。判斷標(biāo)準(zhǔn)為dU (4) 2.3.2 二次指數(shù)平滑法預(yù)測。由于序列Y呈明顯的線性增長趨勢,故可選擇二次指數(shù)平滑法進(jìn)行預(yù)測。根據(jù)經(jīng)驗判斷法,當(dāng)時間序列呈現(xiàn)下降 (上升) 的發(fā)展趨勢時,α的值可在0.6~1中選擇[7]。本文分別選取α=0.6,0.65,0.7,0.75,0.8,0.85,0.9,0.95,利用Eviews 10中的Double(二次指數(shù)平滑)方法得到2021年1月—2021年3月的公眾號關(guān)注量的預(yù)測值,計算不同α值的平均絕對百分誤差分別為5.51、4.92、4.22、3.45、2.70、2.01、1.44、1.06。由此可見,隨著α的增加,預(yù)測的平均絕對百分誤差呈遞減趨勢,說明預(yù)測精度越來越高。故最終選取α=0.95的二次指數(shù)平滑法。 利用上述殘差自回歸模型(4)和α=0.95的二次指數(shù)平滑法計算2021年1月—6月的公眾號關(guān)注量的預(yù)測值,并將2021年1月—4月的預(yù)測值與真實值做比較。分析結(jié)果如表1所示。 表1 殘差自回歸模型、二次指數(shù)平滑法 由表1中的2021年1月—2021年3月的殘差自回歸模型的相對誤差可計算得到預(yù)測值的平均絕對百分誤差為0.79,對比由二次指數(shù)平滑法得到的平均絕對百分誤差1.06,結(jié)果顯示1月—3月兩種方法預(yù)測精度都很高,殘差自回歸模型預(yù)測結(jié)果更優(yōu)。觀察兩種預(yù)測方法的相對誤差變化趨勢發(fā)現(xiàn)2月開始?xì)埐钭曰貧w模型的上升幅度明顯高于二次指數(shù)平滑法的上升幅度;4月份二次指數(shù)平滑法的相對誤差為1.7%,小于殘差自回歸模型的相對誤差1.83%,預(yù)測值更接近于真實值。二次指數(shù)平滑法計算得到的5月份、6月份的預(yù)測值也更優(yōu)于殘差自回歸模型的預(yù)測值,說明二次指數(shù)平滑法的預(yù)測結(jié)果更優(yōu)。 本研究采用殘差自回歸模型和二次指數(shù)平滑法對某高校圖書館微信公眾號關(guān)注量2016年1月—2020年12月的數(shù)據(jù)進(jìn)行了擬合分析,并得到了2021年1月—6月微信公眾號關(guān)注量的預(yù)測值。預(yù)測結(jié)果顯示該校圖書館微信公眾號關(guān)注量在未來仍將呈遞增趨勢;兩種方法的預(yù)測精度都很高,短期內(nèi)殘差自回歸模型預(yù)測結(jié)果更優(yōu),較長期內(nèi)二次指數(shù)平滑法預(yù)測結(jié)果更優(yōu)。2.4 模型預(yù)測結(jié)果對比分析
3 結(jié)論