劉 丹
(南京大學(xué)信息管理學(xué)院 江蘇南京 210093)
20世紀(jì)90年代以來,數(shù)字資源在我國呈現(xiàn)出蓬勃的發(fā)展態(tài)勢,數(shù)字期刊更是憑借其單篇文章的零散化使用優(yōu)勢受到用戶的廣泛青睞,據(jù)最新發(fā)布的《2012-2013中國數(shù)字出版產(chǎn)業(yè)年度報(bào)告》顯示,2012年我國數(shù)字期刊收入已達(dá)10.83億元,同比2008年翻了一倍,并保持著較高的增長勢頭。面對用戶持續(xù)增長的利用需求與同樣高漲的數(shù)字期刊采購費(fèi)用,圖書館等文獻(xiàn)機(jī)構(gòu)迫切需要對期刊的影響力和利用績效做出評估,利用數(shù)據(jù)的統(tǒng)計(jì)則為其提供了重要的數(shù)據(jù)支撐。利用數(shù)據(jù)不僅可以作為圖書館選購期刊、數(shù)據(jù)商(即各類數(shù)字服務(wù)提供商)調(diào)整運(yùn)營策略的決策依據(jù),還可以為圖書館與數(shù)據(jù)商之間針對訂購模式及價(jià)格問題的談判提供參考。
現(xiàn)階段,我國數(shù)字期刊的利用數(shù)據(jù)主要來源于各數(shù)據(jù)商,但由于標(biāo)準(zhǔn)不統(tǒng)一,統(tǒng)計(jì)結(jié)果不具有可比性,部分圖書館嘗試自行統(tǒng)計(jì),而統(tǒng)計(jì)指標(biāo)又缺乏規(guī)范性,也有不少機(jī)構(gòu)對利用數(shù)據(jù)認(rèn)識(shí)不足,僅以引文數(shù)據(jù)取代之,而且國內(nèi)尚未形成受期刊界廣泛認(rèn)可的統(tǒng)計(jì)標(biāo)準(zhǔn),相關(guān)規(guī)范中的指標(biāo)也都比較寬泛,總體來看,國內(nèi)的統(tǒng)計(jì)指標(biāo)發(fā)展現(xiàn)狀不容樂觀。相比之下,國外的統(tǒng)計(jì)實(shí)踐則遠(yuǎn)超國內(nèi),一些學(xué)術(shù)團(tuán)體和標(biāo)準(zhǔn)化組織已相繼制定了較為成熟的統(tǒng)計(jì)標(biāo)準(zhǔn),考慮到國內(nèi)外數(shù)字期刊發(fā)展情況的差異,相關(guān)指標(biāo)可供借鑒但并不完全適用于我國。
近年來,統(tǒng)計(jì)指標(biāo)的有關(guān)問題,也逐漸引起了學(xué)者們的關(guān)注,相關(guān)研究成果中,國內(nèi)以論文為主,國外則多為應(yīng)用性項(xiàng)目,其中影響最廣的是英國的COUNTER(Counting Online Usage of Networked Electronic Resources),該項(xiàng)目自2002年就發(fā)布了有關(guān)數(shù)字期刊在線利用統(tǒng)計(jì)的實(shí)施規(guī)范,詳細(xì)規(guī)定了利用數(shù)據(jù)的統(tǒng)計(jì)細(xì)則,而PIRUS(Publisher and Institutional Repository Usage Statistics)項(xiàng)目的提出,又為COUNTER增添了期刊單篇文章級的統(tǒng)計(jì)規(guī)范。國內(nèi)學(xué)者的相關(guān)研究則大多是對國外已有成果的單純介紹,或著眼于數(shù)字資源整體,概括分析其利用統(tǒng)計(jì)指標(biāo),當(dāng)前針對中國數(shù)字期刊細(xì)致探討相關(guān)指標(biāo)的文章比較少:季山針對“下載影響因子”等上網(wǎng)期刊Web文獻(xiàn)計(jì)量指標(biāo)的涵義進(jìn)行了討論;劉雪立根據(jù)期刊被引半衰期的概念,提出“期刊下載量半衰期”并揭示其計(jì)量學(xué)意義;陳丹、楊萌從有效瀏覽量的角度提出了“數(shù)字期刊閱讀量”的計(jì)算方法,但其適用范圍僅限于龍?jiān)雌诳W(wǎng)。有鑒于此,本文以中國數(shù)字期刊為研究主體,綜合國內(nèi)外相關(guān)指標(biāo),擬從期刊利用的揭示層級和深度入手,提出不同類型的利用統(tǒng)計(jì)定量指標(biāo),力求更多維地揭示期刊的利用情況,并對指標(biāo)的統(tǒng)計(jì)方法和功能進(jìn)行統(tǒng)一分析,旨在解決現(xiàn)有利用數(shù)據(jù)缺乏可比性和可靠性的問題,這對于今后我國數(shù)字期刊利用統(tǒng)計(jì)指標(biāo)的規(guī)范具有重要的現(xiàn)實(shí)意義。
傳統(tǒng)的期刊利用統(tǒng)計(jì)往往基于文獻(xiàn)計(jì)量學(xué)中的被引指標(biāo),但過度依賴被引指標(biāo)測度數(shù)字環(huán)境下的期刊利用率與影響力也存在諸多問題:其忽略了非作者用戶、時(shí)滯較長、存在用而不引、無法區(qū)分被引期刊是數(shù)字期刊還是印刷型期刊、高質(zhì)量低引用的小眾期刊常被低估等,可見其反映用戶利用情況的功能很有限。若要全面揭示數(shù)字期刊的利用情況,應(yīng)從用戶視角出發(fā)多維度、多粒度地統(tǒng)計(jì)利用數(shù)據(jù),基于此,本文將適用于我國數(shù)字期刊的利用統(tǒng)計(jì)指標(biāo)劃分為以下類型(見圖1):按照期刊利用情況被揭示的層級,分為“期刊層級”指標(biāo)與“期刊單篇文章層級”指標(biāo);按照用戶對期刊的利用深度,又分為“淺層使用”指標(biāo)和“深度利用”指標(biāo),淺層使用,即對期刊文章內(nèi)容的直接獲取,如閱讀、下載等,此類指標(biāo)可直觀即時(shí)地揭示期刊被用戶使用的情況,深度利用是經(jīng)用戶吸收、轉(zhuǎn)化到最終反饋的利用行為,考慮到期刊被引指標(biāo)是當(dāng)前較為公認(rèn)的深度利用情況的外在表征,且數(shù)字期刊在被引期刊中占有較大比重,將其暫列為深度利用指標(biāo)。本文選取各類指標(biāo)中易測度、有代表性的指標(biāo)進(jìn)行分析,供數(shù)據(jù)商與各機(jī)構(gòu)根據(jù)需要進(jìn)行選擇、擴(kuò)展,這些指標(biāo)互為補(bǔ)充,共同構(gòu)成中國數(shù)字期刊的利用統(tǒng)計(jì)指標(biāo)。
統(tǒng)計(jì)期刊層級的淺層使用數(shù)據(jù)時(shí),需要提供每種數(shù)字期刊的描述性元數(shù)據(jù)(見表1),以此作為相應(yīng)的匹配和定位依據(jù),其中核心項(xiàng)的匹配程度較高,擴(kuò)展項(xiàng)可作為輔助。
3.1.1 期刊基本使用數(shù)據(jù)
基本使用數(shù)據(jù),是基于用戶淺層使用行為的總量指標(biāo),也是其他相對指標(biāo)的統(tǒng)計(jì)基礎(chǔ),因此,對下列原始數(shù)據(jù)的準(zhǔn)確收集與分析,在利用統(tǒng)計(jì)整體工作中具有至關(guān)重要的作用。
圖1 數(shù)字期刊利用統(tǒng)計(jì)指標(biāo)類型圖
表1 數(shù)字期刊的元數(shù)據(jù)集
(1)單位時(shí)段內(nèi)、每種期刊所有全文文章的成功請求量
指標(biāo)含義:全文文章成功請求量,是數(shù)字期刊最主要的利用數(shù)據(jù),而該指標(biāo)是其基本組成單元。全文文章,即一篇文章完整的文本,除正文外,還有參考文獻(xiàn)、圖表及輔助材料鏈接,通常包含HTML、PDF等格式。用戶對全文文章的請求行為,包括閱讀、下載、電郵、打印等方式,當(dāng)前的請求量統(tǒng)計(jì)通常以“下載量”、“閱讀量”為主。
統(tǒng)計(jì)方法:服務(wù)器會(huì)自動(dòng)記錄請求信息,被計(jì)數(shù)的“成功”請求,在服務(wù)器日志中有特定返回碼,為提高數(shù)據(jù)有效性,用戶對HTML格式10秒內(nèi)的多次請求及對PDF等格式30秒內(nèi)的多次請求,應(yīng)按最后一次記錄。在具體統(tǒng)計(jì)操作中,應(yīng)確保數(shù)據(jù)的即時(shí)更新,從而靈活選擇統(tǒng)計(jì)時(shí)長,通常情況下,單位時(shí)段為“1個(gè)月”,為充分揭示使用情況的變化,需將統(tǒng)計(jì)時(shí)長延至1年,而若要提供當(dāng)前任意12個(gè)月的數(shù)據(jù),則至少連續(xù)統(tǒng)計(jì)24個(gè)月,累積計(jì)算請求總量,并分別提供文章每種格式的請求量。以CNKI中國知網(wǎng)收錄的《圖書與情報(bào)》期刊為例,假設(shè)在2013年1月1日至2013年12月31日內(nèi),分別統(tǒng)計(jì)用戶每月對該刊文章的成功請求量為 421、613、901、1402、1203、912、456、512、1213、1452、1024、891,則該刊 2013 年的請求總量為11000(單位為次)。
指標(biāo)功能:該指標(biāo)數(shù)值越大,表明用戶對期刊的使用量越多。橫向?qū)Ρ炔煌诳谕粫r(shí)期內(nèi)的數(shù)據(jù),可以了解各刊的使用量,針對使用量少的期刊,圖書館應(yīng)綜合分析原因來決定停止訂購抑或提高使用率;比較不同數(shù)據(jù)商提供的數(shù)據(jù),可以了解用戶對期刊獲取途徑的選擇傾向;縱向?qū)Ρ韧黄诳煌瑫r(shí)段的數(shù)據(jù),可以預(yù)測用戶的使用趨勢。
此外,當(dāng)統(tǒng)計(jì)的單位時(shí)段為“1年”時(shí)(“某年”即期刊出版年),被記錄的請求就是用戶對該年出版期刊的使用請求,將統(tǒng)計(jì)時(shí)長設(shè)為近20年,便可得到回溯庫中過刊的使用量,圖書館可以依此劃定回溯采購的起始點(diǎn)。
(2)單位時(shí)段內(nèi)、每種期刊、每種內(nèi)容單元的成功請求量
除上文所提的全文文章外,用戶對期刊的使用粒度,還可以細(xì)分到期刊的各內(nèi)容單元。數(shù)字期刊的內(nèi)容單元,包括不同格式的全文文章、文摘、目次等純文本類型,也包括圖像、音頻等非文本類型。該指標(biāo)增加了統(tǒng)計(jì)的細(xì)粒度,也提高了統(tǒng)計(jì)難度,統(tǒng)計(jì)方法與全文文章的成功請求量類似,按月統(tǒng)計(jì),并計(jì)算年度總量,例如,假設(shè)統(tǒng)計(jì)得2013年內(nèi)對《圖書與情報(bào)》中HTML格式文章、PDF格式文章、文摘、圖片的成功請求總量分別為4630、5322、6345、2360,可以看出用戶偏向于使用該刊文摘,而針對文章更傾向于使用PDF格式。對比不同內(nèi)容單元的使用數(shù)據(jù),有利于數(shù)據(jù)商和圖書館判斷用戶的使用偏好,從而有針對性地開展個(gè)性化服務(wù)和培訓(xùn)活動(dòng)。
(3)單位時(shí)段內(nèi)、每種期刊的被拒請求量
被拒絕的請求量,反映的是用戶需要但未被滿足的請求數(shù)量,數(shù)值越大,說明用戶的需求滿足率越低。請求被拒絕的類型,除了因訪問人數(shù)超過用戶最大并發(fā)數(shù)導(dǎo)致的被拒,還包括因未獲得使用授權(quán)造成的被拒,但不包括因口令錯(cuò)誤等引起的請求失敗。該指標(biāo)通常按月統(tǒng)計(jì),提供年度總量,并分別計(jì)算兩種類別的被拒請求量,對比這兩類數(shù)據(jù)有助于分析請求被拒的原因,例如,假設(shè)統(tǒng)計(jì)得《圖書與情報(bào)》于2013年的兩類被拒請求總量分別為9620、6901,可知因訪問人數(shù)過載引起的被拒次數(shù)更多,此時(shí)數(shù)據(jù)商可考慮放寬用戶許可數(shù),若主要因未獲得使用授權(quán)造成被拒,圖書館則應(yīng)綜合考慮購買成本、印刷型期刊利用率等因素后決定最終的獲取途徑,進(jìn)而調(diào)整印刷型期刊和數(shù)字期刊的采購比例。
上述數(shù)據(jù)常用的分析方法,是借助分析工具或采用數(shù)據(jù)挖掘方式來分析服務(wù)器的日志記錄,其中包含代理服務(wù)器及中間網(wǎng)頁網(wǎng)關(guān)的記錄,這種“日志分析法”主要依靠IP追蹤用戶,而在實(shí)際統(tǒng)計(jì)中,人為或代理軟件的重復(fù)請求、惡意攻擊、網(wǎng)絡(luò)爬蟲應(yīng)用等不規(guī)范的使用行為,都會(huì)加大統(tǒng)計(jì)噪聲,導(dǎo)致統(tǒng)計(jì)數(shù)值虛高,因此,可以結(jié)合更適于第三方統(tǒng)計(jì)的“在線統(tǒng)計(jì)法”,通過Cookie識(shí)別已訪問用戶,在此基礎(chǔ)上,不斷優(yōu)化統(tǒng)計(jì)系統(tǒng)結(jié)構(gòu)和分析工具,綜合考慮用戶各種訪問路徑產(chǎn)生的數(shù)據(jù),從而濾去無效數(shù)據(jù),提高數(shù)據(jù)精確度。
此外,統(tǒng)計(jì)上述數(shù)據(jù)時(shí),數(shù)據(jù)商也可以獲得用戶的數(shù)目、類型等信息,若能估算不同機(jī)構(gòu)的最終用戶總數(shù),就可以提供上述數(shù)據(jù)的人均使用量,便于在不同機(jī)構(gòu)間對比。但是,因受制于當(dāng)前的技術(shù)條件和用戶隱私保護(hù),用戶信息的精準(zhǔn)度不高且不便公開,相比之下,由機(jī)構(gòu)內(nèi)部收集更具可行性,西安交通大學(xué)圖書館自行設(shè)計(jì)了一套“電子資源訪問網(wǎng)關(guān)系統(tǒng)”,通過用戶認(rèn)證可以了解用戶的學(xué)科和數(shù)目,只記錄與其學(xué)科相符的使用請求,精確提供反映其需求的使數(shù)據(jù)。
3.1.2 期刊使用因子(Journal Usage Factor,以下簡稱JUF)
JUF是COUNTER Online Metrics公司與英國期刊協(xié)會(huì)(the UK Serials Group)于2007年聯(lián)合提出的與期刊影響因子(Journal Impact Factor,JIF)原理類似的新指標(biāo),旨在從實(shí)際使用量的角度衡量期刊影響力,計(jì)算公式為:
該指標(biāo)的計(jì)算,基于上文中請求量(以下指成功請求量)的統(tǒng)計(jì)結(jié)果,依據(jù)國際通行的觀點(diǎn),時(shí)間窗x長度通常為1年或2年,出版時(shí)間窗y一般為兩年??紤]到算術(shù)平均值對極值有較強(qiáng)的敏感性,采用“中位數(shù)”估算均值,如將《圖書與情報(bào)》2012~2013年在線出版的全文文章于2012-2013年每月的請求量按大小排成數(shù)列,取其中值,就可得到該刊2012~2013年的JUF,所得終值為整數(shù)。JUF作為一個(gè)相對指標(biāo),反映了數(shù)字期刊中內(nèi)容單元(全文文章為主)的平均使用率,在不同期刊間更具可比性。我國的“下載影響因子”指標(biāo)也有相似的統(tǒng)計(jì)原理,但其統(tǒng)計(jì)時(shí)間窗擴(kuò)大為3年,與淺層使用量的峰值不符,同樣,JUF的時(shí)間窗設(shè)定問題也有待進(jìn)一步商榷。雖然JUF的算法還有待完善,但已引起了期刊界的廣泛關(guān)注,調(diào)查顯示它在影響圖書館期刊采購決策方面,排名第2,并在JIF之前,相比 JIF,JUF能有效地反映應(yīng)用性期刊的影響力,而且其反應(yīng)及時(shí)、沒有時(shí)間間隔,可包含統(tǒng)計(jì)當(dāng)年的數(shù)據(jù),同樣適用于新刊,當(dāng)前不少文章作者、出版者、科研資助機(jī)構(gòu)都非常認(rèn)同將其應(yīng)用到期刊評價(jià)中作為JIF的補(bǔ)充指標(biāo),遏制過分強(qiáng)調(diào)JIF的傾向。
3.1.3 期刊使用即年指數(shù)(Journal Usage Immediacy Index)
使用即年指數(shù),是反映用戶對數(shù)字期刊使用速率及期刊即時(shí)影響力的相對指標(biāo),實(shí)際上,它是統(tǒng)計(jì)某期刊當(dāng)年在線出版文章的請求量與該刊當(dāng)年在線出版文章總量的一個(gè)比值,例如,假設(shè)《圖書與情報(bào)》2013年在線出版的文章總量為170篇,同年對文章請求總量為11000次,則該刊2013年的使用即年指數(shù)為65,此數(shù)值越大,表明期刊文章在線出版后被使用的速率越快,即時(shí)影響力越大,該刊所屬主題的學(xué)者對熱點(diǎn)問題也有較高關(guān)注度。使用即年指數(shù),相比傳統(tǒng)的引用即年指數(shù),更具統(tǒng)計(jì)意義,因?yàn)榘l(fā)文存在較長時(shí)滯,某年發(fā)表的文章很難在當(dāng)年被引用,尤其體現(xiàn)在人文社科類期刊中,但淺層使用行為的反應(yīng)速率要迅速得多;使用即年指數(shù),相比我國現(xiàn)已作為期刊評價(jià)指標(biāo)之一的“Web即年下載率”,統(tǒng)計(jì)范圍也更全面,包含了下載行為以外的使用形式,但該指標(biāo)相對缺乏穩(wěn)定性,僅可用于數(shù)字期刊的短期評價(jià)。
3.1.4 期刊使用半衰期(Journal Usage Half-life)
使用半衰期,是從出版年角度測度數(shù)字期刊老化速度和長期影響力的指標(biāo),它的計(jì)量原理與被引半衰期類似,即統(tǒng)計(jì)當(dāng)年某期刊所有文章的總請求量中,較新的一半文章在線出版的時(shí)間跨度,按年計(jì)量,例如,假設(shè)將2013年《圖書與情報(bào)》的請求量按照請求文章的在線出版年自2013年倒序排列,其中接近50%的累積請求百分比分別為47.43%、56.43%,其所屬出版年分別為2011年、2010年,則該刊2013年的使用半衰期為2013-2011+(50-47.43)/(56.43-47.43)=3.3(年)。該數(shù)值越大,代表期刊文章在線出版后的老化速度越慢,也表明其及時(shí)反映速率越慢,期刊具有較長的使用壽命和長期的學(xué)術(shù)影響力,因此,該指標(biāo)對于數(shù)據(jù)商制定數(shù)字期刊定價(jià)策略及選擇存檔期刊具有參考價(jià)值,分析比較同刊各年度的半衰期,也可為每年的期刊組稿、編輯質(zhì)量提供評價(jià)依據(jù),但需注意,使用半衰期通常受期刊所屬主題或?qū)W科的研究領(lǐng)域影響較大。
3.2.1 期刊被引指標(biāo)
有關(guān)被引指標(biāo)計(jì)算方法的相關(guān)探討已有很多,文中不作贅述。常用的被引指標(biāo),主要包括總被引頻次、JIF、即年指數(shù)、被引半衰期及其他修正擴(kuò)展指標(biāo),其中最具代表性的是JIF,國際通用的ISI算法中,其時(shí)間窗長度為2年,而考慮到自然科學(xué)與人文社會(huì)科學(xué)文章引用時(shí)間的差異及發(fā)文的較長時(shí)滯,可靈活調(diào)整時(shí)間窗長度,綜合比較期刊的短期影響與長期影響。被引指標(biāo)屬于靜態(tài)指標(biāo),統(tǒng)計(jì)結(jié)果相對穩(wěn)定,但當(dāng)前國內(nèi)的統(tǒng)計(jì)結(jié)果因統(tǒng)計(jì)源不同而差別較大,舉例說明,受收錄期刊范圍的影響,2013年CNKI發(fā)布的《圖書與情報(bào)》綜合JIF為1.111,而萬方數(shù)據(jù)《中國科技期刊引證報(bào)告》(擴(kuò)刊版)中其JIF為1.654,對此,可以考慮由第三方統(tǒng)計(jì)或整合多方數(shù)值統(tǒng)一發(fā)布復(fù)合數(shù)據(jù)。同時(shí)需要注意,JIF具有學(xué)科領(lǐng)域覆蓋面窄、只重視理論性學(xué)術(shù)期刊等局限,反映期刊的被利用程度有限,但此類數(shù)據(jù)對后繼的淺層使用存在一定影響,可作為參考。
3.2.2 網(wǎng)絡(luò)影響因子(Web Impact Factor,WIF)
隨著期刊載體的轉(zhuǎn)變,期刊研究者的視線也逐漸轉(zhuǎn)向了作為網(wǎng)絡(luò)計(jì)量學(xué)研究重點(diǎn)之一的鏈接分析指標(biāo),并將其應(yīng)用到期刊網(wǎng)站網(wǎng)頁的利用分析中,WIF就是其中最具代表性的指標(biāo)。它是JIF在網(wǎng)絡(luò)環(huán)境中的引申,基于“外部鏈接相當(dāng)于用戶對期刊網(wǎng)站的引用”這一理論假設(shè),計(jì)算方法是某一時(shí)段用某期刊網(wǎng)站的外部鏈接總數(shù)除以該刊網(wǎng)站下的網(wǎng)頁總數(shù),得到每個(gè)網(wǎng)頁的鏈接均值,例如,假設(shè)在2013年12月20日8:00~9:00間借助All The Web等工具搜索得《大學(xué)圖書館學(xué)報(bào)》期刊網(wǎng)站的外部鏈接數(shù)為40,網(wǎng)站網(wǎng)頁數(shù)為30,其WIF則為1.333,該數(shù)值越大,代表被引程度越高。然而,WIF也存在較大的局限性:鏈接結(jié)構(gòu)與引用結(jié)構(gòu)的不同降低了理論假設(shè)的合理性,算法自身缺陷使得指標(biāo)難于精確統(tǒng)計(jì),加之我國期刊網(wǎng)站的發(fā)展程度不高,該指標(biāo)的參考價(jià)值較小。
用戶對數(shù)字期刊的利用,通常是按照主題查找并利用其中的單篇文章,很少以期刊整體作為使用對象,因此,對單篇文章層級的計(jì)量(Article-level Metrics)更能深入期刊內(nèi)容揭示其利用效能,而這也提高了統(tǒng)計(jì)要求。
統(tǒng)計(jì)此類指標(biāo)時(shí),除了需要提供表1中文章所屬期刊的描述性元數(shù)據(jù),還需提供單篇文章的描述性元數(shù)據(jù)(見表2),以此作為相應(yīng)的匹配依據(jù)。
表2 數(shù)字期刊單篇文章的元數(shù)據(jù)集
4.1.1 單位時(shí)段內(nèi),每篇全文文章(或每種內(nèi)容單元)的成功請求量
單篇文章請求量的統(tǒng)計(jì)數(shù)據(jù)將為用戶選擇期刊文章提供指導(dǎo)。PIRUS項(xiàng)目對該數(shù)據(jù)的收集機(jī)制正處于探索階段,除了各數(shù)據(jù)商,各機(jī)構(gòu)知識(shí)庫也需要提供統(tǒng)計(jì)數(shù)據(jù)。我國的機(jī)構(gòu)知識(shí)庫發(fā)展緩慢,收錄文章的數(shù)量也與國際水平有較大差距,因此,可選取部分代表性的機(jī)構(gòu)知識(shí)庫作為試點(diǎn)。該指標(biāo)的統(tǒng)計(jì)方法與上文中期刊層級的請求量類似,但統(tǒng)計(jì)起始時(shí)間應(yīng)按照文章在線出版日期來劃分,并分別統(tǒng)計(jì)文章各種版本的請求量,如針對表2中《圖書與情報(bào)》的文章《呼喚》,應(yīng)從2007年10月8日起,連續(xù)統(tǒng)計(jì)每個(gè)月的請求量,而不能任意劃定統(tǒng)計(jì)起始點(diǎn)。
4.2.1 文章被引頻次
文章被引頻次,是指期刊中單篇文章自發(fā)表以來在統(tǒng)計(jì)當(dāng)年的被引次數(shù),在一定程度上揭示了文章的學(xué)術(shù)影響力和被深度利用的程度,最終體現(xiàn)為學(xué)術(shù)產(chǎn)出的數(shù)量,可以作為用戶的使用參考。我國CSSCI中文社會(huì)科學(xué)引文索引現(xiàn)已在文章記錄中提供了該指標(biāo),可以查詢到表2中文章《呼喚》自2004年發(fā)表后,在2006年的被引次數(shù)為4次,至2013年累積被引次數(shù)為16次,但是受收錄文章數(shù)量的影響,不同的統(tǒng)計(jì)源針對該指標(biāo)的統(tǒng)計(jì)結(jié)果也有所差別,如CNKI提供的累積被引次數(shù)為25次,且多數(shù)統(tǒng)計(jì)源只提供了累積被引次數(shù),缺少各年度的被引數(shù)據(jù)。
4.2.2 社媒影響指標(biāo)
在Web2.0環(huán)境中,用戶對期刊文章的深度利用方式,已由傳統(tǒng)引用拓展到在社交媒體中對文章“納米級”內(nèi)容信息的分享、標(biāo)引與對話等,Altmetrics(“選擇性計(jì)量學(xué)”、或譯作“社媒影響計(jì)量學(xué)”、“網(wǎng)絡(luò)補(bǔ)充計(jì)量學(xué)”)這種新興計(jì)量方法的出現(xiàn),為這些在科研過程中即時(shí)產(chǎn)生的大眾利用數(shù)據(jù)的收集提供了新思路。國外的相關(guān)計(jì)量研究尚處于實(shí)驗(yàn)階段,學(xué)者們開發(fā)了ImpactStory等數(shù)據(jù)收集工具,追蹤用戶在Twitter、PLOS等社交媒體及開放獲取平臺(tái)中的學(xué)術(shù)交流行為,初步得出了部分社媒影響指標(biāo),主要包括標(biāo)簽數(shù)、標(biāo)簽密度、評論數(shù)、社會(huì)書簽數(shù)等,隨著相關(guān)研究的日臻完善,可將部分指標(biāo)用作我國數(shù)字期刊利用統(tǒng)計(jì)的補(bǔ)充指標(biāo),例如,通過Twitter Search API可收集到某篇英文文章在Twitter中的每日推薦數(shù)(Tweets),推廣到我國,則可以統(tǒng)計(jì)某篇文章在新浪微博中的每日發(fā)貼數(shù)。此外,還可對指標(biāo)進(jìn)行拓展,如針對“評論數(shù)”這一指標(biāo),可以分別統(tǒng)計(jì)在科學(xué)網(wǎng)等學(xué)術(shù)博客中與某篇文章相關(guān)的“正面評論數(shù)”與“負(fù)面評論數(shù)”,從正反兩方面深度揭示其影響力。
單篇文章層級的利用統(tǒng)計(jì)數(shù)據(jù),能夠即時(shí)、真實(shí)地反映作者研究成果的實(shí)際影響力與學(xué)術(shù)質(zhì)量,有利于扭轉(zhuǎn)學(xué)界片面化“以刊論文”的局面,對于文獻(xiàn)的知識(shí)亮點(diǎn)評價(jià)及知識(shí)管理亦有重要價(jià)值。
本文借鑒國內(nèi)外數(shù)字期刊利用統(tǒng)計(jì)指標(biāo),進(jìn)一步細(xì)化統(tǒng)計(jì)維度、粒度,提出綜合的適用于我國數(shù)字期刊的統(tǒng)計(jì)指標(biāo),并將其按照利用的揭示層級和深度分為不同類型,從理論上分析了各種指標(biāo)的含義、功能和統(tǒng)計(jì)方法。雖然部分新型指標(biāo)的可行性尚需實(shí)踐驗(yàn)證,但也利用統(tǒng)計(jì)提供了新的視角,彌補(bǔ)了單純依賴被引指標(biāo)的缺陷。針對統(tǒng)計(jì)指標(biāo)在我國數(shù)字期刊利用統(tǒng)計(jì)中的應(yīng)用和后續(xù)研究提出以下建議:其一,我國用戶對數(shù)字期刊的利用,雖然可以借助期刊網(wǎng)站、開放獲取等方式,但多數(shù)基于期刊全文數(shù)據(jù)庫,因此,當(dāng)前基本使用數(shù)據(jù)的統(tǒng)計(jì)主要依賴數(shù)據(jù)商,有統(tǒng)計(jì)條件的機(jī)構(gòu)可自行統(tǒng)計(jì)比對,數(shù)據(jù)商應(yīng)定期為用戶提供相應(yīng)數(shù)據(jù),并將統(tǒng)計(jì)數(shù)據(jù)按期刊所屬主題進(jìn)行歸類,對收錄文章情況不同的期刊進(jìn)行區(qū)分;其二,應(yīng)充分認(rèn)識(shí)到數(shù)字期刊多訪問途徑對統(tǒng)計(jì)結(jié)果的影響,將統(tǒng)計(jì)噪聲降至最低,可參考國外做法,建立“第三方”統(tǒng)計(jì)平臺(tái),收集數(shù)據(jù)商提供的基本使用數(shù)據(jù),用于更多指標(biāo)的計(jì)算分析和用戶的開放獲??;其三,用戶的利用行為具有復(fù)雜性,若要全面評價(jià)期刊的利用績效和影響力,需加入定性分析,考慮到數(shù)字環(huán)境下期刊利用形式的多變性,應(yīng)動(dòng)態(tài)調(diào)整相應(yīng)的統(tǒng)計(jì)指標(biāo),如JUF今后可以拓展出單篇文章層級或作者層級的新指標(biāo),社媒影響指標(biāo)也可以發(fā)展為期刊層級的新指標(biāo)。
[1]中國新聞出版研究院.“破局”之年的數(shù)字產(chǎn)業(yè)——《2012-2013中國數(shù)字出版產(chǎn)業(yè)年度報(bào)告》速覽[N/OL].[2013-10-12].http://media.people.com.cn/n/2013/1 010/c369775-23152808.html.
[2]全國信息與文獻(xiàn)標(biāo)準(zhǔn)化技術(shù)委員會(huì).GB/T 13191-2009信息與文獻(xiàn) 圖書館統(tǒng)計(jì)[S].北京:中國標(biāo)準(zhǔn)出版社,2009.
[3]呂淑萍,羅云川.圖書館數(shù)字資源統(tǒng)計(jì)標(biāo)準(zhǔn)和應(yīng)用指南[M].北京:北京圖書館出版社,2010:3-181.
[4]COUNTER [EB/OL].[2013-12-16].http://www.projectcounter.org/.
[5]COUNTER PIRUS [EB/OL].[2013-12-16].http://www.projectcounter.org/pirus.html.
[6]季山,胡致強(qiáng).關(guān)于上網(wǎng)期刊Web文獻(xiàn)計(jì)量指標(biāo)的討論[J].中國科枝期刊研究,2006,17(5):756-759.
[7]劉雪立.科技期刊下載量半衰期的建立及其文獻(xiàn)計(jì)量學(xué)意義[J].中國科技期刊究,2012,23(4):561-564.
[8]陳丹,楊萌.數(shù)字期刊閱讀量統(tǒng)計(jì)路徑及方法初探[J].圖書與情報(bào),2012,(2):18-22.
[9]張靜,閻曉弟,周奇.目前電子資源使用統(tǒng)計(jì)存在的問題及解決設(shè)想——以西安交通大學(xué)圖書館為例[J].圖書與情報(bào),2008,(5):82-85.
[10]Usage Factors Study-Final Report Now Available[R/OL].[2013-12-27].http://www.uksg.org/usagefactors/final.
[11]Ian Rowlands,David Nicholas.The missing link:journal usage metric[J].Aslib Proceedings,2007,(59):222-228.
[12]Phil Davis.Journal usage half-life[EB/OL].[2013-12-27].http://124.240.187.83:81/1Q2W3E4R5T6Y7U8I9O0P1 Z2X3C4V5B/www.publishers.org/_attachments/docs/jour nalusagehalflife.pdf.
[13]葉繼元.呼喚圖書館學(xué)情報(bào)學(xué)期刊的學(xué)術(shù)規(guī)范意識(shí)——紀(jì)念《圖書與情報(bào)》出版第100期[J].圖書與情報(bào),2004,(6):3-9.
[14]劉春麗.Web2.0環(huán)境下的科學(xué)計(jì)量學(xué):選擇性計(jì)量學(xué)[J].圖書情報(bào)工作,2012,7(14):52-56.
[15]Stefanie Haustein,Tobias Siebenlist.Applying social bookmarking data to evaluate journal usage[J].Journal of Informetrics,2013,(5):446-457.