〔摘 要〕以暨南大學Elsevier SD為例,分析了全文電子期刊數(shù)據(jù)庫使用中的帕累托效應。通過分析SD全文下載情況,發(fā)現(xiàn)以下因素導致了帕累托效應的產(chǎn)生即全文期刊覆蓋學校重點和強勢學科情況、全文期刊SCIE、SSCI和AHCI來源期刊數(shù)量、全文期刊中本校SCI論文載文期刊數(shù)量。帕累托效應對圖書館數(shù)字資源建設和服務有著非常重要的意義。在數(shù)字資源引進中要充分考慮資源的質量和使用對象,在數(shù)字資源續(xù)訂時可以考慮按學科子庫購買方式,在數(shù)字資源服務中,要通過各種途徑努力提高低使用率期刊的使用,充分發(fā)揮數(shù)字資源的最大使用價值。
〔關鍵詞〕電子期刊;數(shù)據(jù)庫;數(shù)字資源建設;帕累托效應
DOI:10.3969/j.issn.1008-0821.2010.12.036
〔中圖分類號〕G250.74 〔文獻標識碼〕A 〔文章編號〕1008-0821(2010)12-0125-05
Pareto Effect in the Using of Full-text Electronic Journals
——A Case Study of Elsevier SD in Jinan UniversityZhu Qiandong
(Library,Jinan University,Guangzhou 510632,China)
〔Abstract〕In this paper,taking Jinan University Elsevier SD as an example,analyzing the Pareto effect in the using of full-text electronic journal databases.By analyzing the SD full text downloads,it was found that the following factors led to the emergence of Pareto effect.The first was full text journals covering key and strong disciplines of university.The second was the number of full text journals which were the source journals of SCIE,SSCI and A HCI.The last was number of Journals which publish Jinan University SCI papers.Pareto effect plays an important part on the development of digital resources and digital services.The acquisition of digital resources needs considering the quality and users of the resources.When deciding whether to continue subscription of resources,we could purchase resources based on certain subject fields.In order to enhance the utilization of the low-use journals,a variety of measures should be used.
〔Keywords〕electronic journals;database;digital resources collection;Pareto effect
近幾年高校圖書館引進了大量的全文電子期刊數(shù)據(jù)庫,這些全文電子期刊數(shù)據(jù)庫極大地滿足了高校師生的教學、科研和學習的信息需求,有效地推動了學校的學科建設和科研發(fā)展。但引進這些數(shù)據(jù)庫占用了圖書館相當比例的文獻資源購置經(jīng)費,且數(shù)據(jù)庫的價格還在不斷上漲,這給圖書館數(shù)字資源建設提出了嚴峻的挑戰(zhàn)。為了使有限的數(shù)字資源經(jīng)費得到更科學合理地利用,分析和評估這些數(shù)據(jù)庫的使用變的日益重要。
在全文電子期刊數(shù)據(jù)庫的分析和評估中,年下載量和單篇使用成本是常用的兩個評價指標。但年下載量只能反映整個數(shù)據(jù)庫的使用情況,數(shù)據(jù)庫中不同期刊的下載量和分布狀況沒有反映。Ebrahim Emrani等人在研究聯(lián)盟采購的Elsevier Science Direct下載量期刊分布時發(fā)現(xiàn)電子期刊的使用遵循“80/20”法則或帕累托效應[1]。所謂“帕累托效應”或“二八定律”,即“以一個小的誘因、投入和努力,通??梢援a(chǎn)生大的結果、產(chǎn)出或酬勞。典型的模式會顯示:80%的產(chǎn)出來自20%的投入。[2]”換句話說,數(shù)據(jù)庫中全文下載量的80%來自于20%的期刊。本文將以單獨的暨南大學Elsevier SD使用為例,分析其2007-2009年全文下載量的期刊分布,并探析該分布形成的原因及對圖書館數(shù)字資源建設的意義。圖1 2005-2009年SODL數(shù)據(jù)庫全文下載量
圖2 2005-2009年SD數(shù)據(jù)庫篇均下載成本
2010年12月第30卷第12期全文電子期刊數(shù)據(jù)庫使用中的帕累托效應分析Dec.,20101 Elsevier SD數(shù)據(jù)庫使用中的帕累托效應
暨南大學自2002年起一直訂購Elsevier的SD數(shù)據(jù)庫,SD數(shù)據(jù)庫也一直是我校讀者最為熟悉和最常用的外文全文電子期刊數(shù)據(jù)庫。由圖1和圖2可以看出,2005-2008年全文下載量一直呈遞增狀態(tài),2009年略有下降,2005-2009年篇均下載成本一直在遞減,這些表明SD數(shù)據(jù)庫達到了較好的使用效果和經(jīng)濟效益。
Elsevier提供了符合COUNTER標準的期刊使用報告,目前提供了2007-2009年的詳細數(shù)據(jù)。圖3、圖4和圖5分別是SD數(shù)據(jù)庫2007、2008和2009年全文下載量期刊分布。
圖3 2007年SD數(shù)據(jù)庫全文下載量期刊分布
2007-2009年全文下載量的期刊分布呈現(xiàn)非常明顯的帕累托效應:2007年27.67%的期刊提供了80%的全文下載量;2008年21.03%的期刊提供了80%的全文下載量;2009年23.72%的期刊提供了80%的全文下載量。表1中的期刊總數(shù)是至少有1篇全文下載記錄的期刊總數(shù),實際上可以訪問的全文期刊總數(shù)要大于這個數(shù)字,即有部分可以訪問全文的期刊年全文下載次數(shù)為0。以2009年為例,我??梢栽L問的期刊總數(shù)為2 029種,至少下載1篇全文的期刊數(shù)量是1 876種,有153種期刊全文下載次數(shù)是0。若以2029種作為期刊總數(shù)計算,則2009年21.93%的期刊占據(jù)了80%的全文下載量。
由此可見,如果粗略地統(tǒng)計,則20%的期刊(以下簡稱20%期刊)提供了80%的下載量,而80%的期刊(以下簡稱80%期刊)僅占有20%的下載量。圖4 2008年SD數(shù)據(jù)庫全文下載量期刊分布
圖5 2009年SD數(shù)據(jù)庫全文下載量期刊分布
表1 2007-2009年SD數(shù)據(jù)庫全文下載量的期刊分布數(shù)據(jù)
年份全文
下載量占全文
下載量80%的
期刊數(shù)量期刊
總數(shù)80%下載量的
期刊占期刊
總數(shù)比例(%)2007265 8594331 56527.672008457 4973991 89721.032009403 9154451 87623.72
表2 2007-2009年SD中20%和80%期刊的數(shù)量及其比例
年 份期刊數(shù)量占總數(shù)比例(%)200720%期刊43327.6780%期刊1 13272.33200820%期刊39921.0380%期刊1 49878.97200920%期刊44523.7280%期刊1 43176.28
2 Elsevier SD數(shù)據(jù)庫使用中帕累托效應產(chǎn)生原因分析用戶使用全文電子期刊時,論文與用戶信息需求的相關度、全文電子期刊質量和用戶發(fā)表學術論文的需求等都是影響用戶下載和閱讀的重要因素。筆者將從SD年度全文下載的學科分布、20%期刊80%期刊分別收錄SCIE、SSCI和AHCI來源期刊數(shù)量以及20%和80%期刊本校SCI論文載文數(shù)量3個方面進行分析。
2.1 SD年度全文下載的學科分布
高校中教師和學生尤其是研究生是外文期刊的主要用戶,他們進行課題研究、發(fā)表學術論文或完成畢業(yè)論文往往都要下載和閱讀一定數(shù)量的外文文獻。他們下載的文獻與他們所從事的學科或所屬的專業(yè)密切相關。筆者統(tǒng)計了2007-2009年不同學科期刊年度全文下載量及其在年度全文下載總量中所占比例,期刊的學科劃分以Elsevier對SD中的期刊學科劃分為準。
由表3中的數(shù)據(jù)可以看出,2007年在所有的23個學科中,Biochemistry,Genetics and Molecular Biology的期刊論文年度下載量及其在年度下載總量中所占比例都是最高,下載量和所占比例分別是62 869篇和23.65%;2008年,Computer Science的期刊論文年度下載量及其在年度下載總量中所占比例都是最高,下載量和所占比例分別是84 489篇和18.47%;2009年,Biochemistry,Genetics and Molecular Biology在這2個指標上再次排名第一,下載量和所占比例分別是93 066篇和23.04。
生物化學、遺傳學和分子生物學(Biochemistry,Genetics and Molecular Biology)期刊論文下載量一直很大,這與這些學科在我校的現(xiàn)狀和發(fā)展情況是一致的。在生物化學、遺傳學和分子生物學方面,暨南大學擁有水生生物學國家級重點學科;生物醫(yī)學工程、水生生物學、生物化學與分子生物學廣東省重點學科;免疫學國務院僑辦重點學科;基因組藥物教育部工程中心;再生醫(yī)學教育部重點實驗室(暨南大學—香港中文大學聯(lián)系);廣東省生物工程藥物重點實驗室,是國家基因工程中心的參與單位;設有2個博士后流動站生物學、生物醫(yī)學工程等。由此可見,學校重點學科師生和研究人員是學術期刊使用的重要主體,這也是產(chǎn)生全文期刊論文下載量帕累托效應的原因之一。劉亞茹、韓鵬鳴、閆裴[3],郭振宇[4]等人的研究也表明與國家和學校重點學科相關的期刊論文下載量較大。
表3 2007-2009年不同學科期刊年度全文下載量及其所占比例
學 科200720082009下載比例(%)下載比例(%)下載比例(%)Biochemistry,Genetics and Molecular Biology62 86923.6575 39116.4893 06623.04Agricultural and Biological Sciences28 82010.8446 33610.1342 77710.59Environmental Science12 2584.6116 1553.5321 6145.35Immunology and Microbiology10 9414.1213 1112.8712 5313.10Neuroscience11 3824.2823 0655.0414 8143.67Health Sciences18 7777.0631 6576.9246 44811.50Nursing and Health Professions110.005130.11130.00Pharmacology,Toxicology and Pharmaceutical Science6 9812.639 7342.139 7922.42Veterinary Science and Veterinary Medicine00.0000.0000.00Chemical Engineering14 2095.3414 8293.2415 3823.81Chemistry15 3035.7619 0594.1721 7445.38Computer Science14 2355.3584 48918.4717 5584.35Earth and Planetary Sciences2 0600.772 7370.603 5260.87Energy1 3640.511 5490.341 8880.47Engineering9 5143.5823 7795.2014 8413.67Materials Science14 9495.6218 3474.0121 6525.36Mathematics5 4142.0429 3536.425 2441.30Physics and Astronomy4 1171.554 3030.944 2141.04Business,Management and Accounting17 9016.7322 3494.8931 9677.91Decision Sciences3040.114050.096520.16Economics,Econometrics and Finance10 3963.9113 2492.9019 0134.71Psychology1 6180.612 5270.551 7890.44Social Sciences2 4360.924 5601.003 3900.84
2.2 SD中20%和80%期刊分別收錄SCIE、SSCI和AHCI來源期刊情況SCIE、SSCI和AHCI每年的來源期刊都有一定的變化,為保證統(tǒng)計標準的惟一性,筆者以2009年6月份發(fā)布的JCR報告中SCIE、SSCI、AHCI來源的期刊為標準。根據(jù)該標準統(tǒng)計了2007-2009年SD的20/80期刊各自收錄的SCIE、SSCI、AHCI來源期刊的數(shù)量,統(tǒng)計結果如表4所示。
表4 2007-2009年20/80期刊收錄SCIE、SSCI和AHCI來源期刊情況
年份20%或80%
期刊數(shù)量占期刊總數(shù)
比例(%)SCIE收錄SSCI收錄AHCI收錄收錄期刊數(shù)量收錄期刊比例
(%)200743327.6736853(10)2(2)42194.9220071 13272.33686168(53)14(9)80671.2200839921.0335045(11)1(1)38496.2420081 49878.97831192(56)13(10)97064.75200944523.7237360(11)2(2)42294.8320091 43176.28791167(56)11(8)90563.24(注:SSCI括號中的數(shù)字表示其與SCIE重合的數(shù)量,AHCI括號中的數(shù)字表示其與SCIE、SSCI重合的數(shù)量,收錄期刊數(shù)量是指去重后3個索引的收錄數(shù)量)由表4中的數(shù)據(jù)可以看出,2007-2009年SD中20%期刊收錄SCIE、SSCI和AHCI來源期刊數(shù)量均高于80%期刊,分別高于80%期刊23.72%、31.49%和31.59%。這說明了用戶傾向于選擇高質量全文期刊的論文,而且這種傾向性隨著時間的推移表現(xiàn)得越來越明顯。
2.3 SD中20%和80%期刊本校SCI論文載文分析
在高校,教師在年度考核或職稱晉升時,其發(fā)表的SCI(包括SSCI、AHCI,下同)論文數(shù)量是一個重要的評價因素。此外,博士研究生畢業(yè)學校通常要求其必須發(fā)表一定數(shù)量的SCI論文。發(fā)表SCI論文,首先必須得對SCI來源期刊上的論文有一定程度的了解;其次,要根據(jù)SCI來源期刊上的論文,跟蹤和把握學術研究的熱點和趨勢。當SCI來源期刊上發(fā)表了教師和博士的論文后,該來源期刊往往也成為其他教師和博士關注的對象。筆者統(tǒng)計了2007-2009年SD中20%和80%期刊分別載有本校師生SCI論文的期刊數(shù)量及論文篇數(shù)。
由表5可以看出,20%期刊在刊載暨南大學論文的期刊數(shù)量和論文篇數(shù)上都要大大高于80%期刊。2007年20%期刊中刊載暨南大學論文的期刊數(shù)量和論文篇數(shù)分別是80%期刊的2.81倍和2.53倍;2008年20%期刊中刊載暨南大學論文的期刊數(shù)量和論文篇數(shù)分別是80%期刊的3.63倍和4.68倍;2009年20%期刊中刊載暨南大學論文的期刊數(shù)量和論文篇數(shù)分別是80%期刊的3.94倍和3.41倍。由此可見,20%期刊在期刊數(shù)量和論文篇數(shù)2個指標上遠遠高于80%期刊,且20%期刊和80%期刊在期刊數(shù)量這一指標上的差距呈明顯擴大趨勢。表5 SD中20%和80%期刊分別載有暨南大學
論文的期刊數(shù)量及論文篇數(shù)
年份20%或
80%期刊SCI、SSCI、
AHCI收錄刊載暨南
大學論文的
期刊數(shù)量刊載暨南
大學論文的
篇數(shù)200720%期刊4215976200780%期刊8062130200820%期刊3845889200880%期刊9701619200920%期刊4227192200980%期刊9051827
表6 SD下載排名前十期刊中載有暨南大學論文的期刊及下載情況
年份刊 名載文數(shù)量下載排名下載次數(shù)2007Food Chemistry123 9222007Biochemical and Biophysical Research Communications233 6362007European Journal of Operational Research182 0812007Journal of Chromatography A2101 7402008Computers Mathematics with Applications145 5332008Biochemical and Biophysical Research Communications174 6212009Biochemical and Biophysical Research Communications528 1172009Phytochemistry163 5052009Food Chemistry183 345
從表6可以看出部分載有暨南大學論文的期刊,其下載次數(shù)和下載排名都比較靠前。從2007-2009年,《Food Chemistry》有2次進入下載排名前十;《Biochemical and Biophysical Research Communications》有3次進入下載排名前十,且該刊在這3年間共刊載了8篇暨南大學的論文。因此,發(fā)表有暨南大學論文的SCI來源期刊更受用戶關注和使用,這也是導致SD使用中產(chǎn)生帕累托效應的原因之一。
3 帕累托效應對圖書館數(shù)字資源建設和服務的意義
3.1 數(shù)字資源的引進
圖書館引進新資源或續(xù)訂原有資源都要充分考慮資源的質量和使用對象。從SD使用中的帕累托效應可以看出信息資源質量和使用對象的信息需求在很大程度上決定了資源的使用情況。因此,在引進數(shù)字資源時要先評估數(shù)字資源的質量,其次要申請試用并分析試用期間的使用數(shù)據(jù)和讀者反饋。在綜合數(shù)字資源質量和用戶使用情況后,再根據(jù)已購資源學科分布、與已購資源重復情況等因素決定是否購買。否則,購買的資源得不到充分使用,難以實現(xiàn)其使用價值和經(jīng)濟效益。
3.2 數(shù)字資源的續(xù)訂
帕累托效應表明了全文期刊數(shù)據(jù)庫中20%的期刊提供了80%的全文下載量。當前,很多高校都面臨著兩大難題:一是學校不斷壓縮圖書館的文獻資源購置經(jīng)費;二是全文電子期刊數(shù)據(jù)庫每年都在漲價,很多數(shù)據(jù)庫漲價幅度超過5%,在這樣的背景下,選擇一個合適的數(shù)據(jù)庫定價模式越來越重要。對于國外大的綜合性數(shù)據(jù)庫,如果20%的期刊集中于某個和數(shù)個學科,應當努力爭取按學科子庫進行購買。這樣可以節(jié)約數(shù)字資源購置經(jīng)費,并且充分發(fā)揮數(shù)字資源的最大價值。3.3 數(shù)字資源服務
全文期刊數(shù)據(jù)庫中有80%的期刊只提供了20%的下載量,但80%期刊同樣花費了圖書館的數(shù)字資源經(jīng)費。另外,在80%期刊中也有部分高質量的期刊與學校現(xiàn)有學科相關。圖書館可以采取網(wǎng)站宣傳、學科期刊導航、在OPAC中整合、讀者培訓、館內(nèi)告示、學科信息推介、期刊投稿指南等方式,讓讀者熟悉和使用這些期刊,既服務于學校的教學科研需要,也有效提高這些期刊的利用率。
參考文獻
[1]Ebrahim Emrani,Amin Moradi-Salari,Hamid R.Jamali.Usage Data,E-journal Selection,and Negotiations:An Iranian Consortium Experience[J].Serials Review,2010,36(2):86-92.
[2]李漢昭.帕累托80/20效率法則[M].北京:海潮出版社,2001:4.
[3]劉亞茹,韓鵬鳴,閆裴.全文電子期刊數(shù)據(jù)庫利用率統(tǒng)計分析研究——大學Elsevier SDOL為例[J].圖書館工作與研究,2010,(1):73-76.
[4]郭振宇.外文電子期刊利用率統(tǒng)計與分析[J].首都醫(yī)科大學學報:社會科學版增刊,2009:146-148.