亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        讀者借閱行為的時(shí)間序列分析及預(yù)測

        2013-04-25 09:51:28
        河北科技圖苑 2013年5期
        關(guān)鍵詞:時(shí)序校區(qū)差分

        張 淼

        (華南師范大學(xué)圖書館 廣東 廣州 510631)

        1 研究背景與目的

        隨著信息研究范式從“以系統(tǒng)為中心”到“以用戶為中心”的轉(zhuǎn)變[1],對用戶信息行為的全面分析日益成為圖書館學(xué)研究的熱點(diǎn)。讀者的借閱行為是讀者最主要的信息行為之一,對讀者借閱歷史行為的客觀記錄進(jìn)行分析,可以改變讀者工作主觀經(jīng)驗(yàn)積累的現(xiàn)狀,也是圖書館開展深層次服務(wù)工作的前提條件。同時(shí),隨著圖書館信息化的發(fā)展,館藏信息資源的購買數(shù)量、比例分布都發(fā)生了明顯的變化,對讀者借閱行為的發(fā)展趨勢進(jìn)行分析和預(yù)測,可以了解紙質(zhì)館藏借閱的發(fā)展情況、變化規(guī)律,完成預(yù)測未來行為等決策性工作。而時(shí)間序列分析,作為統(tǒng)計(jì)分析預(yù)測的方法之一[2],可以對讀者借閱行為進(jìn)行良好的分析與預(yù)測。

        2 研究方法及研究對象

        所謂時(shí)間序列分析(Time Series Analysis),是一種動態(tài)數(shù)據(jù)處理的統(tǒng)計(jì)方法,該方法基于隨機(jī)過程理論和數(shù)理統(tǒng)計(jì)學(xué)方法,研究隨機(jī)數(shù)據(jù)序列所遵從的統(tǒng)計(jì)規(guī)律,以用于解決實(shí)際問題[3]。時(shí)間序列分析方法豐富多樣,有不同的流派和方法,其中簡單回歸分析法、趨勢外推法、指數(shù)平滑法等都是產(chǎn)生時(shí)間較長且較簡單直觀的分析方法。而B-J算法的ARMA、ARIMA模型等則是較新的、近期才逐漸受到關(guān)注的方法。這些方法對時(shí)間序列有著不同的考察角度,因而有著自己適合的分析領(lǐng)域和用途。本文根據(jù)讀者借閱數(shù)據(jù)的序列特點(diǎn),選取其中適合的三種模型分別進(jìn)行比較分析。

        通過華南師范大學(xué)圖書館(以下簡稱本館)匯文文獻(xiàn)信息服務(wù)系統(tǒng)中的統(tǒng)計(jì)模塊,以2000年1月1日到2011年12月31日為限,收集一校三區(qū)圖書館(石牌校區(qū)、大學(xué)城校區(qū)、南海校區(qū))11年以來的紙本中文圖書的借閱信息,分別進(jìn)行統(tǒng)計(jì)整理與分析。本研究使用SPSS17.0作為統(tǒng)計(jì)分析工具。

        3 時(shí)間序列分析與預(yù)測

        3.1 時(shí)序特性分析

        為了建立適宜的時(shí)序模型,首先需要對序列的特性進(jìn)行分析,即對時(shí)間序列的隨機(jī)性、平穩(wěn)性、季節(jié)性的判斷分析。圖1是根據(jù)正在流通的中文圖書的借閱數(shù)據(jù)繪制的時(shí)序曲線圖,即時(shí)序分布圖。

        圖1 時(shí)序分布圖

        從圖1直觀地看,數(shù)據(jù)從2000年開始慢慢走高,在2008年開始回落,之后漸漸走低。序列是帶有明顯的趨勢性、波動性、伴有周期性的季節(jié)變動的非平穩(wěn)數(shù)據(jù),且波動幅度不斷增大。由于序列中數(shù)據(jù)較多,可以繼續(xù)利用自相關(guān)函數(shù)圖(自相關(guān)函數(shù)圖是序列平穩(wěn)性考察中首當(dāng)其沖的圖形工具,對識別時(shí)間序列的各種非平穩(wěn)性和確定時(shí)序模型中的參數(shù)有非常重要的作用[2])進(jìn)行序列判斷。圖2是本序列的自相關(guān)函數(shù)圖,由圖2可知,25階自相關(guān)函數(shù)值大部分超出隨機(jī)區(qū)間,序列為非平穩(wěn)序列,具有趨勢性、波動性變動,并在k=6、12、18、24處取值較大,再次確認(rèn)序列具有明顯的季節(jié)性。

        圖2 自相關(guān)函數(shù)圖

        運(yùn)用時(shí)間序列分析法的關(guān)鍵就是模型選擇,根據(jù)時(shí)間按序列的特性選擇一個(gè)與實(shí)際過程相吻合的模型結(jié)果,即模型選擇[3],不同的時(shí)序分析方法采用不同的工具選擇模型。根據(jù)本序列的時(shí)序特征分析,可以初步選定三類模型:傳統(tǒng)時(shí)序分析中的指數(shù)平滑模型(假設(shè)為A型)、隨機(jī)時(shí)序分析中的ARIMA模型(B型)、季節(jié)分解模型(C型)。接下來分別闡述并比較三種模型。

        圖3 預(yù)測殘差

        3.2 指數(shù)平滑模型

        指數(shù)平滑模型是在B-J方法產(chǎn)生之前最為常見的一種方法,它是在加權(quán)移動平均法的基礎(chǔ)上形成,可以對不規(guī)則數(shù)據(jù)加以平滑,從而獲得其變化規(guī)律和趨勢,以此對未來的數(shù)據(jù)進(jìn)行預(yù)測[4]。主要有三種方法:Simple、Holt、Winter。這些模型在其趨勢和季節(jié)構(gòu)成方面是不同的,根據(jù)對趨勢和季節(jié)的不同假設(shè),可任一選擇相應(yīng)的模型對不規(guī)則構(gòu)成的時(shí)間序列進(jìn)行平滑處理[5]。本序列采用季節(jié)性指數(shù)平滑WINTERS。統(tǒng)計(jì)結(jié)果顯示:平穩(wěn)的R方值為0.681,R方為0.853,從兩個(gè)R方值來看,該指數(shù)平滑模型的擬合情況比較良好。殘差的自相關(guān)圖(ACF)和偏自相關(guān)圖(PACF)如圖3所示,可見兩個(gè)圖形都沒有顯著的趨勢特征,故可以初步判斷本序列所用模型比較適當(dāng)。預(yù)測結(jié)果和擬合圖形輸出如圖4所示,可以看出觀測值與預(yù)測值的擬合情況,最初的幾年擬合良好,之后前期不如后期。這與指數(shù)平滑模型的特點(diǎn)一致,指數(shù)平滑法的不足是模型有一定的不確定之處,預(yù)測只根據(jù)部分?jǐn)?shù)據(jù),對全部數(shù)據(jù)中的信息利用不足,因此如果是對2012年預(yù)測,可以選取比較臨近的數(shù)據(jù)進(jìn)行預(yù)測。下面介紹的ARIMA模型將對序列的整體趨勢利用得更充分。

        圖4 指數(shù)平滑模型擬合值圖

        3.3 ARIMA隨機(jī)時(shí)序模型

        ARIMA是自回歸綜合移動平均模型(Autoregressive Integrated Moving Average Models),是隨機(jī)性時(shí)間序列分析的代表性方法[2],也是時(shí)間序列分析模型中非常通用的方法[6],最常用于含有季節(jié)成分時(shí)間序列的分析[7],對于同時(shí)存在趨勢性和季節(jié)性的序列,其模型一般記為 ARIMA(p,d,q)(P,D,Q)s,其中P、Q為季節(jié)性的自回歸和移動平均階數(shù),D為季節(jié)差分的階數(shù),s為季節(jié)周期。ARIMA實(shí)際上是建立在平穩(wěn)序列基礎(chǔ)上的,因此首先要對非平穩(wěn)數(shù)據(jù)轉(zhuǎn)換為平穩(wěn)序列。

        3.3.1 數(shù)據(jù)平穩(wěn)化處理

        平穩(wěn)化指根據(jù)序列的特點(diǎn)和分析的需要對數(shù)據(jù)進(jìn)行必要的變換處理,目的使序列的特征體現(xiàn)得更加明顯,利于模型的選擇,包括階差分、季節(jié)差分、對數(shù)轉(zhuǎn)換等。過多平穩(wěn)化處理的數(shù)據(jù)不能真實(shí)的反應(yīng)數(shù)據(jù)的特點(diǎn),但如果平穩(wěn)化不足,也會給后面的預(yù)測帶來很大的誤差。由以上分析可知本序列具有趨勢性及季節(jié)變動,可進(jìn)行一階逐期差分,發(fā)現(xiàn)序列在K=6,12時(shí),自相關(guān)系數(shù)均較大,具有季節(jié)變動,對一階差分序列再進(jìn)行一階季節(jié)差分,再繪制差分后序列的自相關(guān)圖和偏自相關(guān)圖,如圖5、6所示,序列的趨勢、季節(jié)變動消除,序列已基本平穩(wěn)。

        圖5 平穩(wěn)化后的自相關(guān)圖

        圖6 平穩(wěn)化的偏自相關(guān)圖

        3.3.2 參數(shù)確定

        接下來,根據(jù)前面進(jìn)行的差分過程,嘗試建立ARIMA模型,并考察模型效果。AMIMA的完整形式是 ARIMA(p,d,q)(P,D,Q)s。平穩(wěn)化處理中進(jìn)行一階逐期差分和一階季節(jié)差分,得到了一個(gè)基本平穩(wěn)的序列。于是模型中d和D應(yīng)同時(shí)取1;從自相關(guān)圖5看,1階以后函數(shù)值明顯趨于0,呈拖尾性,可取q為1,而12階的函數(shù)值明顯不為0,因此Q可取1;再看偏自相關(guān)圖6,前3階函數(shù)值均顯著不為0,之后慢慢趨于0,因此P可取3或4,而第12階值在線以內(nèi),因此P可取0。于是得到初步的模型形式為:ARIMA(3,1,1)(0,1,1)12或 ARIMA(4,1,1)(0,1,1)12,比較以后可選前者,模型分析結(jié)果如圖7所示。

        圖7 ARIMA模型擬合圖

        3.4 季節(jié)分解模型

        以上兩種模型都是把季節(jié)性周期作為序列利用中的一個(gè)成分在預(yù)測時(shí)加以利用,而季節(jié)分解模型目的是將季節(jié)因素提取出來,從而更便于對剩余序列做進(jìn)一步的分析[2]。季節(jié)分解法認(rèn)為,時(shí)間序列有4種成分,分別是:趨勢性T(Trend)、季節(jié)性S(Seasonal)、周期性P(Periodicity)和不規(guī)則波動性I(Irregular Variations)。這些成分通過不同的組合方式影響時(shí)間序列的變化,通常分為加法模型和乘法模型。加法模型的一般形式為Y=T+S+P+I(xiàn),乘法模型的一般形式為Y=T×S×P×I。由于本序列具有趨勢性及明顯的季節(jié)性,因此在季節(jié)分解中應(yīng)引入趨勢因素、季節(jié)因素,序列上下波動幅度有增大的趨勢,這點(diǎn)提示可以采用乘法模型?;具^程為先通過移動平均消除序列中的季節(jié)性和其他波動,再剔除趨勢因素,計(jì)算出季節(jié)指數(shù)(SAF),之后剔除季節(jié)成分,得到季節(jié)調(diào)整的序列(SAS),再進(jìn)行平滑處理得到循環(huán)波動序列(STC),最后根據(jù)STC值進(jìn)行線性回歸,預(yù)測2012年的借閱量。由SPSS進(jìn)行季節(jié)分解,可以得到四個(gè)新變量:ERR(誤差項(xiàng))、SAS(季節(jié)調(diào)整)、SAF(季節(jié)指數(shù))、STC_1(周期變化指數(shù))。季節(jié)指數(shù)如圖8所示,每年的2月是寒假,是借閱量第一個(gè)最低點(diǎn),之后3月份開學(xué)是整年中借閱量最大的月份,之后一路走低,到8月份是整年借閱量的最低點(diǎn),暑假開學(xué)后由于各類考試的增多,借閱量不斷走高。對獲得的STC值進(jìn)行SPSS中的專家模型預(yù)測,將預(yù)測值與季節(jié)指數(shù)相乘,最終得到2012年的預(yù)測值。

        圖8 季節(jié)比率圖

        圖9 季節(jié)分解法擬合圖

        4 分析、預(yù)測及結(jié)論

        4.1 各模型比較分析

        對歷史數(shù)據(jù)擬合效果分析,由圖4、7、9可以看出,三種模型的擬合效果都不錯(cuò),他們對2012年預(yù)測如表1所示,將表格作折線圖如圖10所示。從三種模型對借閱量的擬合與試預(yù)測效果看,ARIMA模型的精度高于傳統(tǒng)模型;在傳統(tǒng)模型中,WINTERS指數(shù)平滑法效果略好于季節(jié)分解法。ARIMA模型適用于短期預(yù)測,若預(yù)測借閱量下一年各月的變化,在外界環(huán)境相對穩(wěn)定的情況下,從實(shí)用的角度可選用 ARIMA(3,1,1)(0,1,1)12預(yù)測較好,若預(yù)測借閱量一段時(shí)期的變化,ARIMA模型可能不如傳統(tǒng)時(shí)序模型。

        表1 2012年1-11月借閱實(shí)際值與各模型預(yù)測值

        圖10 2012年1-11月借閱實(shí)際值與各模型預(yù)測值

        4.2 各校區(qū)館藏、借閱量比較分析

        利用時(shí)間序列圖的比較分析仍然可以發(fā)現(xiàn)一些有趣的結(jié)論,例如,對石牌校區(qū)、大學(xué)城兩校區(qū)的館藏及借閱年度增長量進(jìn)行比較分析,如圖11??梢钥闯?,2006年到2012年兩校區(qū)的館藏增加量基本相同,兩條曲線基本重合,都呈現(xiàn)逐漸下降的趨勢,這主要是由于購書經(jīng)費(fèi)的減少以及采購策略的變化(逐步減少對紙本資源的購買力度,擴(kuò)大電子資源的購買)。與之相應(yīng)的兩校區(qū)的借閱增長的幅度也逐漸下滑,下滑速度比館藏的下滑速度更為明顯。到2008年,由于當(dāng)年政府招標(biāo)采購出現(xiàn)誤差造成新書到館延遲,上半年基本沒有新書入庫,而上半年正是學(xué)生撰寫畢業(yè)論文,導(dǎo)致2008年與2007年相比借閱量大幅下滑,增長量開始出現(xiàn)負(fù)值。

        圖11 兩校區(qū)館藏與借閱的增長量

        另外,本館近年來在暑假期間堅(jiān)持開放,逐年延長開放時(shí)間,結(jié)合石牌校區(qū)借閱庫室的劃分,將社科書庫(A-F與 H)、理科書庫(N-Z)、文藝書庫(IJK類)、教育書庫(G類)的各年8月份借閱量及總量繪制在一起,如圖12所示。2008年以前有波動,之后借閱量逐步升高,但2012年突然下滑,其中可能的原因與2012年暑假前夕將本館的自修室取消有關(guān)。暑假期間是考研等各類考試的準(zhǔn)備期,來館自修也會間接地借閱圖書。當(dāng)然,讀者借閱量的變化與館藏入庫新書量的變化、入館人數(shù)是否有關(guān),相關(guān)的程度又如何,還需進(jìn)一步的驗(yàn)證。例如,可以對兩校區(qū)2006年到2012年館藏的增加量與借閱量進(jìn)行一個(gè)積差相關(guān)(皮爾遜相關(guān)),可以得到二者在0.01水平(雙側(cè))上顯著相關(guān),相關(guān)系數(shù)(r)=0.688,二者呈正相關(guān)。

        圖12 石牌校區(qū)歷年8月份借閱量

        4.3 圖書館應(yīng)建立長效而深入的分析機(jī)制

        從時(shí)間序列分析的預(yù)測結(jié)果看,讀者借閱量的變化容易受到各種環(huán)境因素的干擾。例如,本研究中2004年我館本科評估時(shí)購買大量的圖書補(bǔ)充進(jìn)來促使當(dāng)時(shí)的借閱量上升明顯,2008年由于招標(biāo)采購的政策問題導(dǎo)致年底才有新書入庫從而使當(dāng)年借閱量大幅下降,2012年暑假石牌校區(qū)庫室調(diào)整關(guān)閉自修室導(dǎo)致8月份借閱量顯著下滑。而外部環(huán)境的劇烈變化造成借閱量的波動都會對時(shí)間序列預(yù)測結(jié)果的精度產(chǎn)生影響??梢哉f,目前讀者工作的開展更多地停留在主觀經(jīng)驗(yàn)的積累,這種形式的積累不利于傳承,不利于應(yīng)用,也使得政策決策缺乏客觀依據(jù)。那么如何客觀有效地把握館藏利用的動態(tài)規(guī)律、讀者閱讀心理與行為的內(nèi)在機(jī)制呢?基于圖書館自動化信息系統(tǒng),對其積攢的大量館藏及利用數(shù)據(jù)進(jìn)行客觀、深入、長效的統(tǒng)計(jì)分析就是一種思路,這種分析不是短期的、個(gè)體館員的零散行為,而是長期的、深入的圖書館的機(jī)構(gòu)行為。將圖書館的統(tǒng)計(jì)分析成為各級館員都能動態(tài)掌握的工具,作為工作的常態(tài)進(jìn)行開展,將讀者借閱看成是有生命的有機(jī)體,傾聽其中傳遞的聲音,制定相應(yīng)靈活、適用于本館的規(guī)則與決策,使讀者工作變得鮮活。

        [1]李桂華.信息服務(wù)設(shè)計(jì)與管理[M].北京:清華大學(xué)出版社,2009:1-245.

        [2]薛微.SPSS統(tǒng)計(jì)分析方法及應(yīng)用[M].北京:電子工業(yè)出版社,2004:402-407.

        [3]馮力.統(tǒng)計(jì)學(xué)實(shí)驗(yàn)[M].大連:東北財(cái)經(jīng)大學(xué)出版社,2008:134-142.

        [4]劉震,吳廣,丁維岱,等.SPSS統(tǒng)計(jì)分析與應(yīng)用[M].北京:電子工業(yè)出版社,2011:339-363.

        [5]呂振通,張凌云.SPSS統(tǒng)計(jì)分析與應(yīng)用[M].北京:機(jī)械工業(yè)出版社,2009:253-257.

        [6]胡平,崔文田,徐青川.應(yīng)用統(tǒng)計(jì)分析教學(xué)實(shí)踐案例集[M].北京:清華大學(xué)出版社,2007:30-34.

        [7]黃潤龍.數(shù)據(jù)統(tǒng)計(jì)分析——SPSS原理及應(yīng)用[M].北京:高等教育出版社,2010:310-318.

        猜你喜歡
        時(shí)序校區(qū)差分
        時(shí)序坐標(biāo)
        成都醫(yī)學(xué)院新都校區(qū)南大門
        成都醫(yī)學(xué)院新都校區(qū)一角
        基于Sentinel-2時(shí)序NDVI的麥冬識別研究
        數(shù)列與差分
        山東大學(xué)青島校區(qū)
        文苑(2018年23期)2018-12-14 01:06:04
        我校臨安校區(qū)簡介
        一種毫米波放大器時(shí)序直流電源的設(shè)計(jì)
        電子制作(2016年15期)2017-01-15 13:39:08
        基于差分隱私的大數(shù)據(jù)隱私保護(hù)
        相對差分單項(xiàng)測距△DOR
        太空探索(2014年1期)2014-07-10 13:41:50
        日本道精品一区二区三区| 欧美日韩激情在线一区二区| 人妻精品一区二区免费| 91国产超碰在线观看| 午夜视频一区二区三区播放| 亚洲成人中文字幕在线视频| 一区二区三区内射美女毛片 | 97久久人人超碰超碰窝窝| 国产又色又爽无遮挡免费动态图| 午夜高清福利| 中文字幕精品人妻av在线| 日韩av毛片在线观看| 国产精品乱码人妻一区二区三区| 国产精品久久久久av福利动漫| 熟妇人妻中文字幕无码老熟妇| 日本精品久久久久中文字幕1| 精品一区二区三区亚洲综合| 精品厕所偷拍一区二区视频| 97久久精品无码一区二区天美| 国产亚洲精品第一综合麻豆| 麻豆国产av尤物网站尤物| 亚洲人成网站在线播放小说| 亚洲国产精品悠悠久久琪琪| 亚洲成av人片不卡无码| 农村欧美丰满熟妇xxxx| 少妇AV射精精品蜜桃专区| 人片在线观看无码| 丰满又紧又爽又丰满视频| 新婚人妻不戴套国产精品| 精品人妻伦九区久久aaa片69| 亚洲一区二区三区av在线免费| 亚洲成av在线免费不卡| 午夜福利一区在线观看中文字幕| 一个人看的视频www免费| 国产亚洲精品自在久久77| 国产91熟女高潮一曲区| 亚洲中文字幕乱码一二三| 特黄做受又粗又长又大又硬 | 中文字幕日本韩国精品免费观看| 不卡一区二区黄色av| 久久综合九色综合网站|