周鳳飛 王佳佳
(天津工業(yè)大學圖書館 天津 300387)
隨著信息技術(shù)的發(fā)展,全球已進入信息爆炸時代,數(shù)據(jù)總量迅速膨脹,大數(shù)據(jù)時代應運而生。2011年5月麥肯錫公司在《大數(shù)據(jù):下一個創(chuàng)新、競爭和生產(chǎn)力的前沿》研究報告中首次提出大數(shù)據(jù)的概念[1]。自從大數(shù)據(jù)概念提出以來,國際上大數(shù)據(jù)的討論和政府行動趨勢強勁。美國2012年出臺《大數(shù)據(jù)研究和發(fā)展計劃》,將大數(shù)據(jù)上升為事關(guān)國家核心競爭力的國家戰(zhàn)略,這是繼“信息高速公路計劃”之后在信息科學領(lǐng)域的又一重大計劃。英國2013年出臺《英國數(shù)據(jù)能力發(fā)展戰(zhàn)略規(guī)劃》,投資1.89億英鎊,提高大數(shù)據(jù)的采集、分析能力,推動英國在 “數(shù)據(jù)革命”中搶得先機[2]。2016年3月18日,中華人民共和國國民經(jīng)濟和社會發(fā)展第十三個五年規(guī)劃綱要(簡稱“十三五”規(guī)劃(2016-2020年))發(fā)布,綱要中提出:“實施國家大數(shù)據(jù)戰(zhàn)略,推進數(shù)據(jù)資源開放共享”。由此可見,各個國家紛紛將大數(shù)據(jù)從以往的商業(yè)層面上升到了國家意志和國家戰(zhàn)略層面。
大數(shù)據(jù)時代的到來,促進了思維的變革、技術(shù)的變革和商業(yè)的變革。數(shù)據(jù)、技術(shù)與思維將三足鼎立。在此背景下,大數(shù)據(jù)技術(shù)、大數(shù)據(jù)思維逐漸滲入到圖書館的服務與管理創(chuàng)新中,特別對高校圖書館學科服務,影響作用日漸深入。面向問題、面向數(shù)字與模型、面向決策支持、面向數(shù)據(jù)范式的學科建設與科學研究都將越來越依賴于大數(shù)據(jù)的支撐;為教學科研提供服務也將越來越需要具有數(shù)據(jù)素養(yǎng)的圖書館專業(yè)學科館員。圖書館如何基于大數(shù)據(jù)思維、大數(shù)據(jù)理論、方法和技術(shù),開展更深層次的學科服務,已經(jīng)成為圖書館界面臨的重要決策問題。
在學術(shù)界,目前尚未對大數(shù)據(jù)的概念有統(tǒng)一的定義,大家比較認可關(guān)于大數(shù)據(jù)的定義從早期IBM公司提出的3V說法,逐漸發(fā)展到4V ,再到現(xiàn)在的 5V( 新增 Value) 。大數(shù)據(jù)的 5 個“V”,業(yè)界將其歸納為 Volume,Velocity,Variety,Veracity,Value,實際上也就是大數(shù)據(jù)包含的 5 個特征,即:巨大的數(shù)據(jù)量 (Volume)、快速的分析和處理速度 (Velocity)、多樣化的數(shù)據(jù)種類和數(shù)據(jù)來源 (Variety)、知識的真實性 (Veracity)和對商業(yè)領(lǐng)域巨大的價值(Value)[3]。如今大數(shù)據(jù)早已不再是簡單的數(shù)據(jù)大的事實了,而最重要的現(xiàn)實是對大數(shù)據(jù)進行分析,只有通過分析才能獲取其中智能的、深入的、有價值的信息。所以其核心理念就是以一種有效的方式來管理海量數(shù)據(jù)并從中提取價值。如何從海量數(shù)據(jù)中提取出有價值的數(shù)據(jù),則需要利用各種先進的大數(shù)據(jù)技術(shù)。大數(shù)據(jù)的核心技術(shù)主要有數(shù)據(jù)采集與預處理技術(shù)、數(shù)據(jù)存儲與管理技術(shù)、數(shù)據(jù)分析及挖掘技術(shù)、數(shù)據(jù)展現(xiàn)及應用技術(shù)。
《普通高等學校圖書館規(guī)程(2005版)》規(guī)定,“高等學校圖書館應積極拓展信息服務領(lǐng)域,提供數(shù)字信息服務,嵌入教學和科研過程,開展學科化服務,根據(jù)需求積極探索開展新服務”[4]。在大數(shù)據(jù)背景下,無論是科研單位、教學單位、還是圖書館等信息機構(gòu),都面臨著嚴峻的挑戰(zhàn)。教學、科研需要更加系統(tǒng)化、專業(yè)化、知識化的數(shù)據(jù)資源支撐,而圖書館則是提供這種支撐的后臺保障。面對不斷變化的信息環(huán)境,傳統(tǒng)的以文獻資源提供和檢索為主的被動式服務已經(jīng)遠不能滿足用戶的需求。學科服務逐漸朝著智慧化、協(xié)作化、綠色化、視覺化、泛在化和主動化的趨勢發(fā)展。而基于大數(shù)據(jù)的學科服務就是為適應學科服務這種多元化的發(fā)展趨勢而衍生的一種基于網(wǎng)絡的用以解決結(jié)構(gòu)化、半結(jié)構(gòu)化及非結(jié)構(gòu)化數(shù)據(jù)多維度處理、分析并提供有預測性知識的信息服務新模式,是嵌入式協(xié)作化學科服務模式的一種新發(fā)展。這種服務模式以用戶需求為中心,以先進技術(shù)為支撐,以學科知識資源為基礎,以促進學科知識創(chuàng)新為目標,是綜合應用數(shù)據(jù)挖掘、信息檢索等大數(shù)據(jù)技術(shù),對學科知識資源進行深入挖掘、分析與集成,為不同層次的用戶提供個性化智力服務的一種新形式。
數(shù)據(jù)素養(yǎng)簡單來說就是人們有效且正當?shù)匕l(fā)現(xiàn)、評估和使用信息及數(shù)據(jù)的一種意識和能力。主要包括數(shù)據(jù)意識、數(shù)據(jù)獲取能力、數(shù)據(jù)處理與分析能力、數(shù)據(jù)交流能力、數(shù)據(jù)評價能力及數(shù)據(jù)道德等幾個方面[5]。大數(shù)據(jù)環(huán)境下,教學、科研等項目對數(shù)據(jù)質(zhì)量的要求越來越高,高質(zhì)量的數(shù)據(jù)必須由高數(shù)據(jù)素養(yǎng)的人才提供。因此數(shù)據(jù)素養(yǎng)已經(jīng)成為館員及科研人員的必備素養(yǎng)之一,作為深入教學、科研項目的學科館員來說,數(shù)據(jù)素養(yǎng)尤為重要。新一代的學科館員已不僅是數(shù)據(jù)收集者,更是知識發(fā)現(xiàn)者。雖然圖書館對學科服務的重視程度逐漸增強,越來越多的圖書館已經(jīng)配備了具有專業(yè)知識背景,且檢索能力較強的學科館員,但是對數(shù)據(jù)進行科學的管理、分類、分析、挖掘的知識和技能較為匱乏,所掌握的方法和工具也十分有限 ,使用新型數(shù)字工具(如繪制思維導圖軟件、情報分析圖譜軟件及專利分析軟件)的能力較弱[6-7]。面對分散且雜亂的數(shù)據(jù)資源,如何將有價值的信息提取出來,并進行深度的挖掘分析,將結(jié)果以恰當?shù)男问秸宫F(xiàn)給用戶,是新時代的學科館員應該具備的技能。
隨著學科服務模式的改變,用戶需求的增多,大數(shù)據(jù)環(huán)境下的學科服務需要學科服務一站式平臺來支持。這里的學科服務平臺定義為:學科服務平臺是學科服務系統(tǒng)必不可少的一部分,是一個展現(xiàn)學科服務系統(tǒng)各組成部分、各類工具和資源的平臺,將學科館員、學科用戶和學科資源三者緊密結(jié)合在一起[8]。筆者通過訪問部分985高校的圖書館網(wǎng)站發(fā)現(xiàn),即使是科研實力強勁,學術(shù)資源豐富的一流大學,在學科服務一站式平臺建設方面仍然有所欠缺。主要問題是有的學校缺少學科服務一站式平臺,在有學科服務一站式平臺的情況下,則存在平臺的功能定位尚不清晰、重建設輕維護情況嚴重、部分圖書館重建設輕宣傳,用戶的知曉度和使用度不高的問題[9]。如何將深入教學科研的學科館員、海量數(shù)據(jù)、協(xié)同創(chuàng)新、產(chǎn)學研結(jié)合的研究需求以及數(shù)據(jù)庫、自建庫、免費學術(shù)資源庫及開放出版資源結(jié)合起來,提供功能完善的基于學科館員、學科用戶、學科資源的管理、檢索分析等一站式服務平臺已迫在眉睫。
以大數(shù)據(jù)為基礎的學科分析工具出現(xiàn)之前,大部分學校的學科服務項目包括:提供文獻信息服務,用戶培訓、學科資源建設、信息素養(yǎng)教育、查收查引等,服務范圍較窄、層次較淺,并沒有深入教學科研當中,而只停留在表面[10]。現(xiàn)在已有一些高校圖書館開始提供一些更深層次的服務。如2016年11月,同濟大學圖書館利用了SCI、SSCI、ESI和InCites數(shù)據(jù)庫相關(guān)統(tǒng)計數(shù)據(jù)對同濟大學2015-2016年進入ESI排名前1%的學科,以及未進入ESI學科排名前1%但接近程度超過50%的潛力學科進行分析,為同濟大學保持優(yōu)勢學科、發(fā)展?jié)摿W科提供了有力的數(shù)據(jù)支撐。武漢紡織大學圖書館于2014年,選取Web of scienceTM核心合集平臺的數(shù)據(jù),以SCIE和SSCI數(shù)據(jù)庫為文獻計量工具,通過分析總結(jié)出該校紡織科學與工程學科在全國的綜合地位,為學科發(fā)展提供數(shù)據(jù)定位,給領(lǐng)導制定決策做出參考[11]。如何深入教學科研之中,為學校的學科建設、科學研究提供有力的支撐與保障,是圖書館學科服務重要的發(fā)展方向。
美國大學與研究圖書館協(xié)會( Association of College and Research Libraries,ACRL) 《2015 年環(huán)境掃描》提出: “數(shù)據(jù)館員需要積極主動地參與信息素養(yǎng)對話,學習新的教學策略,并基于自身專業(yè)做出貢獻[12]。圖書館要積極組織安排學科館員在進行相關(guān)實踐的基礎上開展在職培訓,并實行考核制度??梢耘e辦有關(guān)的研討會,進行經(jīng)驗以及先進理念的交流。定期邀請相關(guān)的專家進行培訓,制定有利于提高數(shù)據(jù)素養(yǎng)的培養(yǎng)計劃。開展相關(guān)的數(shù)據(jù)技能大賽以增加大家的學習熱情等。
構(gòu)建具有強大的知識資源整合能力、海量知識分析能力、大數(shù)據(jù)挖掘能力和多維度知識可視化能力的一站式平臺,以研究型用戶需求環(huán)境和需求趨勢為導向,是一種以用戶為中心的提供解決問題決策的知識展示、交互和推送的新型服務模式。平臺的目標是為全校的用戶提供高效、高質(zhì)量的學科服務。將學科服務的三要素學科館員、用戶以及知識資源三者整合在一起,實現(xiàn)功能的最大化[13]。將各種專業(yè)的結(jié)構(gòu)化資源數(shù)據(jù)庫、非結(jié)構(gòu)化的網(wǎng)絡數(shù)據(jù)資源以及各種自建數(shù)據(jù)庫整合在一起,通過建立個性化、多樣化的學科知識服務體系,增強圖書館的信息服務能力??梢酝ㄟ^設置不同的導航模塊如:知識檢索、學科態(tài)勢分析、資源推薦、科研學術(shù)評價等,形成面向教學、面向科研的學科化服務體系,為不同類型的學科用戶提供個性化服務。學科服務一站式平臺要求界面友好、結(jié)構(gòu)層次清晰、內(nèi)容豐富、功能完善,具有綜合性、開放性、適用性、易用性。平臺的設計不能盲目追求功能多樣,而應以高校學科服務的實際能力,以及用戶的實際需求為準,遵循先進性、可靠性、開放性、服務性以及可擴展性的原則,致力于打造以用戶需求為中心、以知識資源為導向、以先進技術(shù)為支撐的一站式服務平臺。
充分利用大數(shù)據(jù)的:數(shù)據(jù)采集與預處理技術(shù)、數(shù)據(jù)存儲與管理技術(shù)、數(shù)據(jù)分析及挖掘技術(shù)、數(shù)據(jù)展現(xiàn)及應用技術(shù)等對互聯(lián)網(wǎng)中的各種類型的結(jié)構(gòu)化及非結(jié)構(gòu)化的海量數(shù)據(jù),進行采集、存儲、分析及展現(xiàn)。對于學科服務而言,利用這些關(guān)鍵技術(shù),結(jié)合數(shù)據(jù)分析工具,對學科進行預測性趨勢分析,為學校的學科建設以及科研提供更準確的數(shù)據(jù)支撐、更深層次的技術(shù)支持,是大數(shù)據(jù)背景下學科服務創(chuàng)新的必然發(fā)展之路。其中新興的幾個學科服務分析工具主要有EiDeep、InCites、SciVal。EiDeep是基于中國科研機構(gòu)的中外文科技文獻以及創(chuàng)新成果數(shù)據(jù)建立的科研創(chuàng)新能力評估與透視分析平臺。除了中文文獻它還可以提供EI、ESI、SCI、ISTP、Science、Nature、Cell、SSCI八類外文數(shù)據(jù)庫收錄的論文數(shù)據(jù)。利用Eideep平臺,可以量化的展示科研機構(gòu)創(chuàng)新能力的分布和發(fā)展趨勢、按照機構(gòu)組織體系,統(tǒng)計分析各級單位的科研績效、對比同類機構(gòu)間的能力差異,做到知己知彼、聚焦各行業(yè)領(lǐng)域中創(chuàng)新力較強機構(gòu),發(fā)現(xiàn)投資合作目標。InCites數(shù)據(jù)庫中集合了近30年來Web of Science核心合集七大索引數(shù)據(jù)庫的數(shù)據(jù),擁有多元化的指標和豐富的可視化效果,可以輔助科研管理人員更高效地制定戰(zhàn)略決策。利用InCites數(shù)據(jù)庫可以定位重點學科 、優(yōu)勢學科、發(fā)展?jié)摿W科,優(yōu)化學科布局、跟蹤和評估機構(gòu)的科研績效與同行機構(gòu)開展對標分析、明確機構(gòu)全球定位、分析本機構(gòu)的科研合作開展情況,識別高效的合作伙伴、挖掘機構(gòu)內(nèi)高影響力和高潛力的研究人員,吸引外部優(yōu)秀人才。SciVal分析工具可以幫助了解全球220個國家和4 600家機構(gòu)的研究成果,其中包含了17種評估指標,可以實時了解在全國及全球的科研地位及科研進展,與全球類似機構(gòu)比較,評估科研表現(xiàn),并了解本地和全球合作情況,建立合作伙伴關(guān)系,促進交流和發(fā)展。其中SciVal比InCites的數(shù)據(jù)收錄更為全面,尤其是收錄了EI,因此更適合于評價工科高校,但SciVal的學科分類體系與我國的學科體系有很大的差異。InCites數(shù)據(jù)庫包含了基于中國國務院學位委員會和教育部《學位授予和人才培養(yǎng)學科目錄(2011年)》的學科分類,但文獻數(shù)據(jù)收錄略顯不夠全面。所以兩者各有優(yōu)劣,應根據(jù)具體的需求做出最優(yōu)的選擇。
大數(shù)據(jù)環(huán)境下學科服務的核心就是技術(shù)與創(chuàng)新,而技術(shù)與創(chuàng)新的首要前提是思維的改變。環(huán)境在變,思維也在變,大數(shù)據(jù)環(huán)境就需要大數(shù)據(jù)思維。面對大數(shù)據(jù)時代帶來的挑戰(zhàn),把大數(shù)據(jù)的理念、方法、技術(shù)結(jié)合圖書館的實際情況,尋找適合圖書館發(fā)展的新服務、新方向是圖書館提高服務質(zhì)量的關(guān)鍵。
[1] 楊振力.大數(shù)據(jù)時代圖書館學科服務模式探析[J].圖書館學刊,2016,(6):73-75.
[2] 薛風平. 加快實施國家大數(shù)據(jù)戰(zhàn)略[ EB/OL] .[2017-05-02].http://wb.qdqss.cn/html/qdrb/20160109/qdr b131138.html.
[3] Bernard Marr. Big data: the 5Vs everyone must know [EB/OL].[2017-05-05]. http://www.linkedin.com/pulse/20140306073407-64875646-big-data-the-5-vs-everyone-must-know.
[4] 劉江紅, 趙桂榮. 大數(shù)據(jù)時代高校圖書館個性化學科服務創(chuàng)新探究——以黑龍江大學圖書館為例[J]. 農(nóng)業(yè)圖書情報學刊, 2016, 28(12):166-170.
[5] 隆茜.數(shù)據(jù)素養(yǎng)能力指標體系構(gòu)建及高校師生數(shù)據(jù)素養(yǎng)能力現(xiàn)狀調(diào)查與分析[J].圖書館,2015,(12):51-56.
[6] 郝媛玲, 沈婷婷, 高珊. 高校數(shù)據(jù)素養(yǎng)教育實踐的思考和建議——基于哈佛大學案例和我國圖書情報人員訪談的分析[J].圖書情報工作, 2015,(12):44-51.
[7] 周鳳飛, 王俊麗. 天津市高校圖書館學科館員數(shù)字能力現(xiàn)狀研究[J]. 圖書情報工作, 2015,(19):47-54.
[8] 蔚海燕, 衛(wèi)軍朝. 研究型圖書館學科服務的轉(zhuǎn)變:從學科館員到學科服務平臺[J]. 大學圖書館學報, 2013, 31(6):74-81.
[9] 李書寧. 985高校圖書館學科服務平臺建設情況調(diào)查與分析[J]. 圖書與情報, 2015,(4):71-76.
[10] 贠琳紅. 高校圖書館嵌入式學科服務與傳統(tǒng)信息服務的比較分析[J]. 農(nóng)業(yè)圖書情報學刊, 2014, 26(9):179-181.
[11] 閆文軒. 基于文獻計量學的高校圖書館學科服務創(chuàng)新探索——以武漢紡織大學圖書館為例[J]. 中國教育技術(shù)裝備, 2016,(2):79-80.
[12] Koltay T.Data literacy: in search of a name and identity[J].Journal of Documentation,2015,71(2):401-415.
[13] 劉祿峰.大數(shù)據(jù)環(huán)境下高校圖書館學科服務云平臺構(gòu)建研究[J]. 圖書館學刊, 2016,(3):99-101.