〔摘要〕運(yùn)用回歸分析預(yù)測(cè)法和時(shí)間序列分析法兩種模型,以文獻(xiàn)計(jì)量學(xué)為例,對(duì)近年來相關(guān)文獻(xiàn)量的統(tǒng)計(jì)數(shù)據(jù)進(jìn)行擬合與預(yù)測(cè),并對(duì)兩種預(yù)測(cè)模型的結(jié)果進(jìn)行對(duì)比分析。結(jié)果表明,時(shí)間序列預(yù)測(cè)模型對(duì)文獻(xiàn)計(jì)量學(xué)研究的模擬預(yù)測(cè)效果較好。兩種預(yù)測(cè)模型不僅適用于文獻(xiàn)計(jì)量學(xué)發(fā)展研究,對(duì)于其他領(lǐng)域也同樣適用。針對(duì)不同領(lǐng)域的學(xué)科發(fā)展趨勢(shì),在進(jìn)行數(shù)據(jù)模擬和分析預(yù)測(cè)時(shí)要根據(jù)統(tǒng)計(jì)數(shù)據(jù)的多少和分布情況,選取一種相對(duì)效果更好并且方便可行的預(yù)測(cè)方法。
〔關(guān)鍵詞〕文獻(xiàn)計(jì)量學(xué);回歸分析;時(shí)間序列分析;發(fā)展趨勢(shì)
〔中圖分類號(hào)〕G255〔文獻(xiàn)標(biāo)識(shí)碼〕A〔文章編號(hào)〕1008-0821(2013)02-0162-04
目前信息的分析與預(yù)測(cè)活動(dòng)已越來越深入到社會(huì)發(fā)展、經(jīng)濟(jì)生活、科技進(jìn)步等各個(gè)領(lǐng)域,成為社會(huì)發(fā)展與進(jìn)步的標(biāo)志[1]。針對(duì)某一學(xué)科專業(yè)研究的發(fā)展趨勢(shì)進(jìn)行分析與預(yù)測(cè),不僅可以揭示該學(xué)科研究的特點(diǎn)和發(fā)展規(guī)律,而且為今后的研究和工作提供科學(xué)的依據(jù)。如今,無論是情報(bào)學(xué)還是文獻(xiàn)學(xué)的發(fā)展都與文獻(xiàn)計(jì)量學(xué)息息相關(guān),文獻(xiàn)計(jì)量學(xué)也是情報(bào)學(xué)等相關(guān)學(xué)科的重要研究方法。對(duì)文獻(xiàn)計(jì)量學(xué)的發(fā)展趨勢(shì)進(jìn)行預(yù)測(cè),不僅可以預(yù)測(cè)出未來文獻(xiàn)計(jì)量學(xué)的發(fā)展趨勢(shì),而且可為其他學(xué)科尤其是圖書館學(xué)、情報(bào)學(xué)領(lǐng)域的理論研究提供了參考和借鑒[2]。
本文以文獻(xiàn)計(jì)量學(xué)為實(shí)例,通過定量的方法分析其論文數(shù)量的變化情況,應(yīng)用回歸分析模型和時(shí)間序列分析模型,對(duì)文獻(xiàn)計(jì)量學(xué)的發(fā)展趨勢(shì)進(jìn)行擬合和預(yù)測(cè),并針對(duì)兩種預(yù)測(cè)模型的預(yù)測(cè)結(jié)果進(jìn)行比較分析[3]。
1統(tǒng)計(jì)數(shù)據(jù)的來源與統(tǒng)計(jì)結(jié)果
利用中國(guó)知網(wǎng)(CNKI)數(shù)據(jù)庫檢索系統(tǒng),以文獻(xiàn)計(jì)量學(xué)為關(guān)鍵詞,統(tǒng)計(jì)時(shí)間為1996.01.01-2010.12.31進(jìn)行模糊檢索,對(duì)所檢索到的數(shù)據(jù)進(jìn)行處理后共得到論文2 100篇,按發(fā)表年份排列的論文篇數(shù)2.1回歸分析模型介紹
回歸分析法,是從各種現(xiàn)象之間的因果關(guān)系出發(fā),通過對(duì)與預(yù)測(cè)對(duì)象有聯(lián)系的事物或現(xiàn)象的變動(dòng)趨勢(shì)進(jìn)行分析,進(jìn)而推算出對(duì)象的未來數(shù)量狀態(tài)的一種預(yù)測(cè)方法。根據(jù)散布的數(shù)據(jù)點(diǎn)求出理想的回歸直線或曲線,建立起確定的回歸方程進(jìn)行預(yù)測(cè)[4]。
一元線性回歸方程的一般形式:
時(shí)間序列分析是以研究對(duì)象的歷史數(shù)據(jù)為基礎(chǔ),將研究對(duì)象的發(fā)展變化過程表述成時(shí)間序列,首先要識(shí)別時(shí)間序列的特征,進(jìn)而分析它隨時(shí)間的變化趨勢(shì),建立相應(yīng)的時(shí)間序列分析模型,并通過一定的時(shí)間序列預(yù)測(cè)方法,推測(cè)出研究對(duì)象的未來變化趨勢(shì)。
通過分析統(tǒng)計(jì)數(shù)據(jù),應(yīng)用時(shí)間序列分析法中的移動(dòng)平均法(M法)對(duì)文獻(xiàn)計(jì)量學(xué)的發(fā)展趨勢(shì)進(jìn)行擬合和預(yù)測(cè)。其基本方法是每次在時(shí)間序列上移動(dòng)一步求平均值。這樣的處理可對(duì)原始的無規(guī)則數(shù)據(jù)進(jìn)行“修勻”,消除樣本中的隨機(jī)干擾成分,形成平滑的趨勢(shì)線,突出序列本身的固有規(guī)律,從而為進(jìn)一步的建模和參數(shù)估計(jì)做好基礎(chǔ)[5]。
為進(jìn)一步提高預(yù)測(cè)值和實(shí)際值的吻合度,可以采用在一次移動(dòng)平均的基礎(chǔ)上再進(jìn)行一次移動(dòng)平均法,稱為二次移動(dòng)平均法。二次移動(dòng)平均是在一次移動(dòng)平均的基礎(chǔ)上,對(duì)具有線性趨勢(shì)的數(shù)據(jù)再進(jìn)行一次移動(dòng)平均。其計(jì)算公式為:
在利用時(shí)間序列模型進(jìn)行預(yù)測(cè)時(shí),可將對(duì)應(yīng)的T值代入式(7)中,通過線性時(shí)間關(guān)系模型求出i+T即為所要預(yù)測(cè)年份的論文篇數(shù)。
3文獻(xiàn)計(jì)量學(xué)研究發(fā)展趨勢(shì)的預(yù)測(cè)
3.1回歸分析預(yù)測(cè)模型
以文獻(xiàn)計(jì)量學(xué)發(fā)表論文的年份為自變量,各年份的論文篇數(shù)為因變量。通過散布的數(shù)據(jù)點(diǎn)繪制出散點(diǎn)圖,發(fā)現(xiàn)兩變量的關(guān)系近似于一條直線。為了方便計(jì)算,設(shè)1996-2010年時(shí)間t的取值分別為-7,-根據(jù)一元線性回歸方程的計(jì)算公式計(jì)算相關(guān)數(shù)據(jù)結(jié)果如下:
由此可知,回歸方程的擬合程度很好,可以應(yīng)用回歸分析預(yù)測(cè)模型對(duì)未來的文獻(xiàn)計(jì)量學(xué)相關(guān)文獻(xiàn)量進(jìn)行預(yù)測(cè)。
通過回歸分析預(yù)測(cè)模型可預(yù)測(cè)2011年文獻(xiàn)計(jì)量學(xué)的相關(guān)論文篇為2011=140+22.78t=322.24。
3.2時(shí)間序列分析預(yù)測(cè)模型
根據(jù)公式(4),分別取移平跨度n=3和n=5進(jìn)行一次移動(dòng)平均,如表3。
通常采用均方誤差(MSE)來檢驗(yàn)n值選擇的效果。表3一次平均移動(dòng)數(shù)據(jù)表
年份11論文篇數(shù)依據(jù)上述兩種預(yù)測(cè)模型,分別計(jì)算兩種模型1996-2010年的模擬值以及2011年、2012年的預(yù)測(cè)值,如表5。其中,
兩種預(yù)測(cè)模型的相關(guān)系數(shù)比較得:r1 5結(jié)語 以文獻(xiàn)計(jì)量學(xué)為例,采用兩種預(yù)測(cè)模型對(duì)其發(fā)展趨勢(shì)進(jìn)行擬合及預(yù)測(cè),克服了單一模型擬合和預(yù)測(cè)的局限性。預(yù)測(cè)結(jié)果表明,文獻(xiàn)計(jì)量學(xué)研究的論文篇數(shù)在未來3年將超過500篇,并且增長(zhǎng)趨勢(shì)較快。通過對(duì)兩種預(yù)測(cè)模型相關(guān)系數(shù)的比較,得出時(shí)間序列模型對(duì)文獻(xiàn)計(jì)量學(xué)研究發(fā)展的預(yù)測(cè)效果相對(duì)較好。時(shí)間序列模型在預(yù)測(cè)時(shí)不必考慮其他因素的影響,僅從實(shí)際變動(dòng)的數(shù)值序列自身出發(fā)建立相應(yīng)的模型進(jìn)行預(yù)測(cè),避免了尋找影響因素及識(shí)別主要因素和次要因素的困難?;貧w分析模型是從各種現(xiàn)象之間的因果關(guān)系著手,通過對(duì)與預(yù)測(cè)現(xiàn)象有聯(lián)系的事物或現(xiàn)象的變動(dòng)趨勢(shì)進(jìn)行分析。時(shí)間序列模型適用于某一領(lǐng)域的短期預(yù)測(cè),而回歸分析方法是經(jīng)濟(jì)預(yù)測(cè)的常用數(shù)學(xué)方法,利用統(tǒng)計(jì)數(shù)據(jù)確定變量之間的線性關(guān)系,并參考這種函數(shù)關(guān)系來預(yù)測(cè)未來發(fā)展趨勢(shì),適用于某一領(lǐng)域的長(zhǎng)期趨勢(shì)預(yù)測(cè)。兩種預(yù)測(cè)模型不僅適用于文獻(xiàn)計(jì)量學(xué)的發(fā)展研究,對(duì)于其他領(lǐng)域也同樣適用。針對(duì)不同領(lǐng)域的學(xué)科發(fā)展趨勢(shì),在進(jìn)行數(shù)據(jù)模擬和分析預(yù)測(cè)時(shí)要根據(jù)數(shù)據(jù)的多少和分布情況,選取一種相對(duì)效果更好并且方便可行的預(yù)測(cè)方法。 參考文獻(xiàn) [1]查先進(jìn).信息分析與預(yù)測(cè)[M].武昌:武漢大學(xué)出版社,2009:2,193-201,205-208. [2]鄭懷國(guó),趙靜娟,譚翠萍.基于文獻(xiàn)計(jì)量學(xué)的科技情報(bào)分析與服務(wù)[J].情報(bào)雜志,2010,(12):39-40. [3]吳淑玲.兩種數(shù)字圖書館發(fā)展趨勢(shì)預(yù)測(cè)模型的比較[J].情報(bào)科學(xué),2004,(11):1317-1320. [4]王筠.專業(yè)研究發(fā)展趨勢(shì)的預(yù)測(cè)模型——以競(jìng)爭(zhēng)情報(bào)研究為例[J].情報(bào)雜志,2010,(7):12-14. [5]江三寶,毛振鵬.信息分預(yù)測(cè)[M].北京:清華大學(xué)出版社,2008:56-63,77-90. [6]王筠.文獻(xiàn)老化的回歸分析與預(yù)測(cè)[J].情報(bào)雜志,2006,(6):68-69. [7]蔡時(shí)連.一元線性回歸分析模型在期刊訂購(gòu)預(yù)測(cè)中的應(yīng)用[J].圖書情報(bào)工作,2010,(2):112,126-128. (本文責(zé)任編輯:馬卓)