伊雷 王婷 郭倩玲 張建文
(北京化工大學(xué)圖書(shū)館,北京100029)
大數(shù)據(jù)背景下高校圖書(shū)館開(kāi)展知識(shí)服務(wù)的探索與實(shí)踐*——以北京化工大學(xué)圖書(shū)館為例
伊雷王婷郭倩玲張建文
(北京化工大學(xué)圖書(shū)館,北京100029)
大數(shù)據(jù)時(shí)代究竟如何通過(guò)挖掘海量文獻(xiàn)數(shù)據(jù)提供知識(shí)服務(wù),在高校圖書(shū)館界尚未達(dá)成一致意見(jiàn)。但開(kāi)展大數(shù)據(jù)知識(shí)服務(wù),是高校圖書(shū)館未來(lái)發(fā)展的一個(gè)重要方向,這一點(diǎn)已經(jīng)逐漸成為共識(shí)。利用文獻(xiàn)計(jì)量學(xué)分析高校學(xué)科發(fā)展?fàn)顩r,為學(xué)校制定學(xué)科發(fā)展戰(zhàn)略提供參考依據(jù),是目前高校圖書(shū)館利用大數(shù)據(jù)開(kāi)展知識(shí)服務(wù)的具體途徑之一。
高校圖書(shū)館大數(shù)據(jù)知識(shí)服務(wù)
“隨著云計(jì)算、物聯(lián)網(wǎng)以及信息獲取和存儲(chǔ)技術(shù)的飛速發(fā)展,數(shù)據(jù)正以幾何級(jí)數(shù)的速率迅速增長(zhǎng)和積累。目前全球已經(jīng)步入了大數(shù)據(jù)時(shí)代[1]。”大數(shù)據(jù)時(shí)代是網(wǎng)絡(luò)社會(huì)發(fā)展的更高階段,其特點(diǎn)是“數(shù)據(jù)生成速度加快、采集實(shí)現(xiàn)自動(dòng)化、存儲(chǔ)和傳輸成本大幅降低,數(shù)據(jù)量急劇膨脹”[2]。在這一背景下,高校廣大師生獲取文獻(xiàn)資源的途徑越來(lái)越多,高校圖書(shū)館傳統(tǒng)粗放的服務(wù)方式已然不能適應(yīng)學(xué)校發(fā)展需要,這就要求必須在保證文獻(xiàn)資源數(shù)量與質(zhì)量的同時(shí),在服務(wù)師生的方式、方法上不斷創(chuàng)新。因此,高校圖書(shū)館如何為師生提供大數(shù)據(jù)知識(shí)服務(wù),已成為值得研究的課題。所謂大數(shù)據(jù)知識(shí)服務(wù)“是為適應(yīng)信息服務(wù)智慧化、協(xié)作化、綠色化、先覺(jué)化和泛在化的發(fā)展趨勢(shì)而衍生的一種基于網(wǎng)絡(luò)的信息服務(wù)新模式”[3]。高校圖書(shū)館開(kāi)展大數(shù)據(jù)知識(shí)服務(wù)就是要通過(guò)挖掘海量學(xué)術(shù)數(shù)據(jù)資源為廣大師生提供前瞻性服務(wù)。
高校圖書(shū)館歷來(lái)對(duì)信息技術(shù)的應(yīng)用非常重視,幾乎每一項(xiàng)新技術(shù)的出現(xiàn),都能推動(dòng)其服務(wù)升級(jí)。大數(shù)據(jù)時(shí)代,高校圖書(shū)館的數(shù)據(jù)處理方式、目的等都將發(fā)生巨變。在數(shù)字時(shí)代,高校圖書(shū)館的數(shù)據(jù)處理主要是將文獻(xiàn)資料數(shù)字化、網(wǎng)絡(luò)化,其目的是實(shí)現(xiàn)師生對(duì)學(xué)術(shù)數(shù)據(jù)的充分利用;進(jìn)入大數(shù)據(jù)時(shí)代,對(duì)海量文獻(xiàn)數(shù)據(jù)的分析、處理將成為高校圖書(shū)館發(fā)展的新趨勢(shì),其服務(wù)重心也會(huì)逐漸由傳統(tǒng)業(yè)務(wù)向數(shù)據(jù)挖掘轉(zhuǎn)移。在實(shí)踐方面,哈佛大學(xué)圖書(shū)館已引入大數(shù)據(jù)服務(wù)[4];清華大學(xué)圖書(shū)館正嘗試在大數(shù)據(jù)環(huán)境下從元數(shù)據(jù)中提取關(guān)鍵詞等信息,分析關(guān)鍵詞走向及作者與合作者的關(guān)系,試圖建立以人為中心的知識(shí)關(guān)聯(lián)網(wǎng)絡(luò)[5]。
作為一種全新的服務(wù)方式,大數(shù)據(jù)知識(shí)服務(wù)是在海量數(shù)據(jù)的獲取、存儲(chǔ)、分析等過(guò)程產(chǎn)生的以數(shù)字化、網(wǎng)絡(luò)化、智能化為基礎(chǔ)的服務(wù)模式。在大數(shù)據(jù)時(shí)代對(duì)海量數(shù)據(jù)的處理能力意味著獲取知識(shí)方式的改變。Jim Gray因此提出科學(xué)研究的第四范式——以協(xié)同化、網(wǎng)絡(luò)化與數(shù)據(jù)驅(qū)動(dòng)為其主要特征的數(shù)據(jù)密集型科學(xué)研究[6]。作為未來(lái)服務(wù)的新模式,大數(shù)據(jù)知識(shí)服務(wù)將成為高校圖書(shū)館轉(zhuǎn)型發(fā)展的新方向。
如何在大數(shù)據(jù)時(shí)代開(kāi)展知識(shí)服務(wù),目前高校圖書(shū)館界正處于探索階段,尚沒(méi)有統(tǒng)一的模式。北京化工大學(xué)圖書(shū)館也進(jìn)行了一些嘗試。主要涉及以下幾個(gè)方面:第一,采用定量分析方法,通過(guò)引文數(shù)據(jù)庫(kù)Web of Science考察了2001~2014年北京化工大學(xué)(以下簡(jiǎn)稱(chēng)北化)學(xué)者們的總發(fā)文量、總被引次數(shù)、每篇論文的平均被引次數(shù)、H指數(shù)等多個(gè)指標(biāo),利用H指數(shù)將數(shù)量指標(biāo)(論文數(shù)量)和質(zhì)量指標(biāo)(被引頻次)有機(jī)結(jié)合,使評(píng)價(jià)結(jié)果更加合理。在此基礎(chǔ)上,結(jié)合人才類(lèi)型、研究人員層次、學(xué)術(shù)生涯年限等多個(gè)影響因素,探討現(xiàn)有文獻(xiàn)計(jì)量方法和體系的局限性,闡釋如何正確解讀上述評(píng)價(jià)指標(biāo),以便學(xué)校決策者們能夠正確地應(yīng)用這些指標(biāo),對(duì)老師們的學(xué)術(shù)影響力做出科學(xué)評(píng)價(jià)。第二,對(duì)2001~2014年度以北化為機(jī)構(gòu)的SCI收錄論文進(jìn)行分析。并從研究方向、發(fā)表期刊分布特點(diǎn)以及論文作者群等屬性進(jìn)行統(tǒng)計(jì),對(duì)它們的分布規(guī)律和內(nèi)在聯(lián)系進(jìn)行梳理,以期研究科研產(chǎn)出特點(diǎn),為學(xué)校制定科研政策、交叉學(xué)科發(fā)展、國(guó)際化戰(zhàn)略等提供數(shù)據(jù)支撐。第三,利用文獻(xiàn)計(jì)量分析法,借助Cite Space軟件生成可視化圖譜,通過(guò)學(xué)科地圖等形式,定量、可視化地深入揭示北化各科群的分布情況,進(jìn)而系統(tǒng)探討其研究維度,以期把握北化的學(xué)科交叉以及滲透融合狀況,內(nèi)容包括學(xué)科分布、合作情況分析、研究方向演化及研究熱點(diǎn)分析、研究前沿分析等。第四,利用Innography專(zhuān)利檢索與分析平臺(tái)制作了詳細(xì)的專(zhuān)利分析報(bào)告,內(nèi)容涉及當(dāng)前北化的專(zhuān)利擁有量、專(zhuān)利價(jià)值評(píng)價(jià)、創(chuàng)新優(yōu)勢(shì)學(xué)科、活躍學(xué)科發(fā)明人、專(zhuān)利的合作申請(qǐng)分析、國(guó)外專(zhuān)利申請(qǐng)情況分析等。
3.1利用文獻(xiàn)計(jì)量分析學(xué)科發(fā)展水平
利用文獻(xiàn)計(jì)量分析學(xué)科發(fā)展水平,是高校圖書(shū)館在大數(shù)據(jù)時(shí)代開(kāi)展知識(shí)服務(wù)的具體途徑之一。例如,通過(guò)大量文獻(xiàn)計(jì)量分析,我們發(fā)現(xiàn)Chemistry、Materials Science、Engineer?ing、Polymer Science和Physics為北化最為集中的研究方向。
圖1 主要研究方向及其分布
對(duì)以上5個(gè)主要科研方向求和,得到的總計(jì)數(shù)以及總百分比數(shù)(110%)均高于所發(fā)表論文的總篇數(shù),說(shuō)明這5個(gè)研究方向及其交叉學(xué)科是北化科研產(chǎn)出的重要組成部分。并由此可以看出,北化科研產(chǎn)出具有較強(qiáng)的學(xué)科集中性。
圖2化學(xué)方向關(guān)聯(lián)情況
同時(shí)通過(guò)Citespace軟件對(duì)熱點(diǎn)研究方向相關(guān)文獻(xiàn)的分布情況進(jìn)行分析(用節(jié)點(diǎn)代表分析對(duì)象,節(jié)點(diǎn)大小表明對(duì)象的量級(jí),用節(jié)點(diǎn)之間連接線(xiàn)表明文獻(xiàn)之間的關(guān)聯(lián)性)發(fā)現(xiàn)nanoparticles是出現(xiàn)次數(shù)最多的
,與之關(guān)聯(lián)的為nanocrystals(圖2)。此外,由water、seperation和absorbtion為
的文獻(xiàn)構(gòu)成了一組關(guān)聯(lián)性非常強(qiáng)的研究熱點(diǎn)。用同樣方法對(duì)其他4個(gè)熱點(diǎn)研究方向進(jìn)行分析得到圖3。
圖3材料科學(xué)方向關(guān)聯(lián)情況
圖4工程方向關(guān)聯(lián)情況
圖5高分子科學(xué)方向關(guān)聯(lián)情況
圖6物理學(xué)方向關(guān)聯(lián)情況
通過(guò)對(duì)圖2~6進(jìn)行分析,發(fā)現(xiàn)上述5個(gè)熱點(diǎn)研究方向其有著非常強(qiáng)的相似性。由此可見(jiàn)北化的研究領(lǐng)域單一,分散性差,高水平研究方向過(guò)于集中,學(xué)科發(fā)展不均衡。
3.2利用專(zhuān)業(yè)平臺(tái)分析學(xué)科發(fā)展特色
利用Innograph對(duì)北化專(zhuān)利數(shù)據(jù)進(jìn)行統(tǒng)計(jì),研究其背后的學(xué)科發(fā)展信息。
第一,重點(diǎn)研究領(lǐng)域分析。將北化全部專(zhuān)利申請(qǐng)按照IPC統(tǒng)計(jì)分析生成樹(shù)狀分布圖(圖7),圖7中區(qū)塊的不同顏色表示某領(lǐng)域全球?qū)@偭康亩嗌?,區(qū)塊面積的大小代表北化專(zhuān)利申請(qǐng)數(shù)量在某領(lǐng)域的多少。由圖7可見(jiàn)北化在B部和C部申請(qǐng)的專(zhuān)利最多。再取專(zhuān)利申請(qǐng)量排名前10位的IPC小類(lèi)進(jìn)行分析,由此可看出北化的重點(diǎn)研發(fā)方向。表1為專(zhuān)利申請(qǐng)量排名前10位的IPC小類(lèi)及對(duì)應(yīng)的技術(shù)領(lǐng)域。結(jié)合圖7和表1可以看出,北化申請(qǐng)的專(zhuān)利中,B部中以催化和塑料加工領(lǐng)域?yàn)橹鳎珻部中以高分子化合物領(lǐng)域?yàn)樽疃?。說(shuō)明北化專(zhuān)利發(fā)明集中在催化、塑料加工、高分子材料等領(lǐng)域。
圖7 北化專(zhuān)利IPC分類(lèi)樹(shù)狀分布
第二,熱門(mén)研究領(lǐng)域競(jìng)爭(zhēng)力分析。北化專(zhuān)利在該領(lǐng)域的國(guó)內(nèi)競(jìng)爭(zhēng)力情況見(jiàn)圖8。競(jìng)爭(zhēng)力分析圖中氣泡大小代表專(zhuān)利數(shù)量多少;橫坐標(biāo)與專(zhuān)利比重、專(zhuān)利分類(lèi)、引用情況相關(guān),橫坐標(biāo)越大,說(shuō)明其專(zhuān)利技術(shù)性越強(qiáng);縱坐標(biāo)與專(zhuān)利權(quán)人的收入高低、專(zhuān)利國(guó)家分布、專(zhuān)利涉案情況有關(guān),縱坐標(biāo)越大,說(shuō)明專(zhuān)利權(quán)人實(shí)力越強(qiáng)。在該領(lǐng)域,中石化在公司實(shí)力、專(zhuān)利質(zhì)量和數(shù)量上遙遙領(lǐng)先,巴斯夫的專(zhuān)利數(shù)量較大。其他機(jī)構(gòu)在專(zhuān)利質(zhì)量和數(shù)量上相差不大,在這些機(jī)構(gòu)中,除中石油、贏創(chuàng)、殼牌、美孚、住友、陶氏等幾家公司外,主要為高校,北化在這些機(jī)構(gòu)中占有一席之地,但也面臨著激烈競(jìng)爭(zhēng)。
表1 北化專(zhuān)利申請(qǐng)量排名前10位的IPC小類(lèi)及對(duì)應(yīng)的技術(shù)領(lǐng)域
圖8 催化領(lǐng)域北化有效專(zhuān)利在國(guó)內(nèi)的競(jìng)爭(zhēng)力
北化面臨的競(jìng)爭(zhēng)主要來(lái)自清華、復(fù)旦等大學(xué)。為了更好地了解對(duì)手,對(duì)清華、復(fù)旦等大學(xué)在該領(lǐng)域的專(zhuān)利申請(qǐng)進(jìn)行文本聚類(lèi)分析,以了解這兩所大學(xué)的研究技術(shù)熱點(diǎn)。兩所大學(xué)專(zhuān)利申請(qǐng)的文本聚類(lèi)如圖9所示。由圖9可以看出,清華大學(xué)的主要研究熱點(diǎn)為催化活性組分和催化反應(yīng)器;復(fù)旦大學(xué)的研究熱點(diǎn)為沸石、分子篩和二氧化鈦在催化方面的應(yīng)用。北化在該領(lǐng)域的研究熱點(diǎn)為復(fù)合金屬氧化物、納米粒子和分子篩在催化方面的應(yīng)用及催化劑活性組分方面,其在反應(yīng)器和廢水處理方面研究較少。
圖9 兩所大學(xué)在催化領(lǐng)域?qū)@暾?qǐng)的文本聚類(lèi)
3.3利用大數(shù)據(jù)發(fā)現(xiàn)潛在學(xué)科領(lǐng)軍人才
高校學(xué)科建設(shè)領(lǐng)軍人才是促進(jìn)高校學(xué)科建設(shè)的核心人物。在普通高校中,所謂學(xué)科建設(shè)領(lǐng)軍人才主要包括4個(gè)層次:第一層次是以我國(guó)兩院院士為代表的高級(jí)人才。第二層次是以“長(zhǎng)江學(xué)者”為代表的高端人才,也包括“千人計(jì)劃”及“973首席科學(xué)家”等。第三層次是國(guó)家杰出青年科學(xué)基金入選者。國(guó)家杰出青年科學(xué)基金用于支持在基礎(chǔ)研究方面已取得突出成績(jī)的青年學(xué)者自主選擇研究方向開(kāi)展創(chuàng)新研究,旨在培養(yǎng)造就一批進(jìn)入世界科技前沿的優(yōu)秀學(xué)術(shù)帶頭人。第四層次是“新世紀(jì)優(yōu)秀人才支持計(jì)劃”入選者?!靶率兰o(jì)優(yōu)秀人才支持計(jì)劃”屬于教育部“高層次創(chuàng)造性人才計(jì)劃”的第二層次(第一層次是“長(zhǎng)江學(xué)者”),是對(duì)高校優(yōu)秀青年學(xué)術(shù)帶頭人的一個(gè)支持計(jì)劃。
然而,對(duì)于高校而言,直接引進(jìn)這些人才的成本太高。另一方面,這些人才都是稀缺資源,高校對(duì)他們的爭(zhēng)奪也很激烈,所以在操作層面即使不計(jì)成本,這些人才也并不是很好引進(jìn)的。因此,如果能夠利用學(xué)術(shù)大數(shù)據(jù)挖掘一批好苗子進(jìn)行引進(jìn),假以數(shù)年培養(yǎng),使其成為領(lǐng)軍人才,其成本和難度則會(huì)大大降低。
在北化引進(jìn)人才的過(guò)程中,我們?cè)O(shè)想利用H指數(shù)和ESI高被引論文等多種指標(biāo)對(duì)其學(xué)術(shù)潛力進(jìn)行多方面考察,看其是否具備成長(zhǎng)為長(zhǎng)江學(xué)者和院士的素質(zhì)。H指數(shù)的優(yōu)點(diǎn)是既考慮了論文的數(shù)量指標(biāo),又考慮了論文的質(zhì)量指標(biāo),而且更多地聚焦于高被引頻次論文,只有當(dāng)論文數(shù)量和質(zhì)量均有良好表現(xiàn)時(shí),才會(huì)獲得較高的H指數(shù),這是目前世界上公認(rèn)的相對(duì)比較科學(xué)的評(píng)價(jià)指標(biāo)。從北化的具體情況來(lái)看,第一梯隊(duì)人才的H指數(shù)一般都能夠達(dá)到30以上,第二梯隊(duì)人才的H指數(shù)介于20~30之間。
然而,H指數(shù)也存在不足之處。具體表現(xiàn)為H指數(shù)更多地反映了學(xué)者在基礎(chǔ)研究領(lǐng)域內(nèi)的影響力,對(duì)于主要從事應(yīng)用技術(shù)開(kāi)發(fā)的科研人員,用H指數(shù)就無(wú)法公正地體現(xiàn)其學(xué)術(shù)貢獻(xiàn);尤其是對(duì)于年輕的學(xué)術(shù)新星,即使單篇論文的被引頻次很高,也無(wú)法獲得較高的H指數(shù)。他們必須經(jīng)過(guò)長(zhǎng)期的學(xué)術(shù)積累,才能夠在H指數(shù)上有較好的表現(xiàn)。因此,單從H指數(shù)來(lái)評(píng)價(jià)年輕學(xué)者,不利于發(fā)掘新人;H指數(shù)學(xué)科差異性很大,對(duì)不同學(xué)科人才的H指數(shù)進(jìn)行橫向?qū)Ρ仁遣豢扇〉摹?/p>
因此,運(yùn)用H指數(shù)進(jìn)行評(píng)價(jià)時(shí),還要綜合考慮被評(píng)價(jià)學(xué)者的類(lèi)型、學(xué)科領(lǐng)域、層次、學(xué)術(shù)生涯年限等諸多因素影響,并結(jié)合專(zhuān)利授權(quán)量和轉(zhuǎn)化量、獲得國(guó)家獎(jiǎng)勵(lì)情況等多種評(píng)價(jià)指標(biāo)建立綜合評(píng)價(jià)體系(例如,ESI高被引論文應(yīng)納入考察和發(fā)掘科學(xué)領(lǐng)軍人才的重要指標(biāo)之一),才能使得評(píng)價(jià)結(jié)果更為合理、客觀(guān)和科學(xué)。
總之,合理運(yùn)用多項(xiàng)評(píng)價(jià)指標(biāo),密切關(guān)注高層次的學(xué)術(shù)影響力動(dòng)態(tài),及時(shí)發(fā)掘新人,才能進(jìn)一步推動(dòng)高校人才隊(duì)伍建設(shè)和學(xué)科發(fā)展。
目前,高校圖書(shū)館開(kāi)展大數(shù)據(jù)知識(shí)服務(wù)正處于探索階段。究竟如何通過(guò)挖掘海量文獻(xiàn)數(shù)據(jù),從大數(shù)據(jù)中獲取新知,在高校圖書(shū)館界尚未達(dá)成共識(shí)。但開(kāi)展大數(shù)據(jù)知識(shí)服務(wù),從而不斷提升高校圖書(shū)館的服務(wù)品質(zhì),是高校圖書(shū)館未來(lái)發(fā)展的一個(gè)重要方向,這一點(diǎn)應(yīng)該不會(huì)有疑義。開(kāi)展大數(shù)據(jù)知識(shí)服務(wù)將使高校圖書(shū)館迎來(lái)一個(gè)新時(shí)代。高校圖書(shū)館不同于公共圖書(shū)館之處在于其服務(wù)對(duì)象和服務(wù)功能相對(duì)單一,主要對(duì)象是高校廣大師生,其主要功能是服務(wù)高校的教學(xué)、科研發(fā)展。因此,北化圖書(shū)館在開(kāi)展大數(shù)據(jù)知識(shí)服務(wù)探索時(shí),特別關(guān)注兩個(gè)方向,其一為知識(shí)發(fā)現(xiàn),其二為人才發(fā)現(xiàn)。這兩個(gè)方向?qū)⑹俏覀兾磥?lái)開(kāi)展大數(shù)據(jù)知識(shí)服務(wù)的主要方向。
[1]秦小華,王紅濤.大數(shù)據(jù)時(shí)代的高校圖書(shū)館服務(wù)創(chuàng)新[J].中國(guó)科技信息,2014(22):221-222.
[2]鐘輝新.大數(shù)據(jù)時(shí)代信息服務(wù)的發(fā)展走向及高校圖書(shū)館應(yīng)對(duì)策略[C].廣東圖書(shū)館學(xué)會(huì)學(xué)術(shù)年會(huì)論文集,2013.
[3]秦曉珠,李晨暉,麥范金.大數(shù)據(jù)知識(shí)服務(wù)的內(nèi)涵、典型特征及概念模型[J].情報(bào)資料工作,2013(2):18-22.
[4]WATTERS A.Strata Week:Harvard Library releases big da?ta for its books:Harvard offers big data for books,Cloudera’s new Hadoop distribution,Splunk goes public[EB/OL].[2013-10-09].http://radar.oreilly.com/2012/04/harvard-book-da?ta-cloudera-hadoop-splunk-ipo.html.
[5]鄧景康.大數(shù)據(jù)環(huán)境下清華大學(xué)圖書(shū)館的實(shí)踐[N].中國(guó)新聞出版報(bào),2013-08-29(005).
[6]Jim G.On eScience:transformed scientific method[C].Tony H,Stewart T,Kirstin T.The fourth needs paradigm:Dataintensive scientific discovery.Redmond,WA:Microsoft Re?search,2009:19-33.
伊雷男,1979年生。碩士,館員。研究方向:數(shù)據(jù)挖掘、學(xué)科服務(wù)。
王婷女,1976年生。碩士,副研究館員。研究方向:學(xué)科服務(wù)。
郭倩玲女,1971年生。博士,副研究館員。研究方向:科技查新、專(zhuān)利分析。
張建文男,1969年生。博士,教授。研究方向:圖書(shū)館管理。
G258.6
*本文系中央高校基本科研業(yè)務(wù)費(fèi)項(xiàng)目(ZZ1403);北京化工大學(xué)圖書(shū)館館長(zhǎng)基金(20141203)研究成果。
(2015-09-28;責(zé)編:張欣。)