馬 婧
(伊春市圖書館,黑龍江 伊春 153000)
大數(shù)據(jù)技術(shù)系統(tǒng)包含了非常深刻的技術(shù)原理和操作邏輯。運用大數(shù)據(jù)技術(shù),可以對數(shù)據(jù)進行高效的數(shù)據(jù)集成、數(shù)據(jù)分析、基于大數(shù)據(jù)的現(xiàn)代運行機制。在高校信息化建設(shè)過程中,引入大數(shù)據(jù)系統(tǒng)將會帶來一系列的變革,不僅能解決某些技術(shù)問題,而且還能解決整個系統(tǒng)的架構(gòu)問題。要使大數(shù)據(jù)系統(tǒng)更加多元化,須切實落實大數(shù)據(jù)技術(shù)在高校中的應(yīng)用,從長遠角度考慮其建設(shè)。
大數(shù)據(jù)技術(shù)。在大數(shù)據(jù)技術(shù)的支持下,數(shù)字信息技術(shù)發(fā)展到今天,因為其底層邏輯復(fù)雜、實施方式多樣、應(yīng)用領(lǐng)域多種多樣,到目前為止,學術(shù)界還沒有一個統(tǒng)一的定義。本文通過對大數(shù)據(jù)技術(shù)和科研文獻的研究進行了回顧,提出了以海量信息資源為基礎(chǔ)的數(shù)據(jù)庫,并利用數(shù)字技術(shù)對各行業(yè)進行分析、清洗和挖掘,為各行業(yè)的發(fā)展提供定量依據(jù)。目前大數(shù)據(jù)技術(shù)的應(yīng)用,主要是利用大數(shù)據(jù)自身的非結(jié)構(gòu)數(shù)據(jù)的泛化特性,成為商業(yè)智能和數(shù)字化技術(shù)發(fā)展的開發(fā)和應(yīng)用價值基礎(chǔ),從而為工業(yè)數(shù)字化高質(zhì)量發(fā)展提供新的動能。知識寶庫?!爸悄軋D書館”這個概念最初是艾托拉(芬蘭)提出的。本文以重慶大學楊新涯院長為代表的“智慧圖書館”概念界定為:“智慧圖書館是指利用數(shù)字化、網(wǎng)絡(luò)化、大數(shù)據(jù)、人工智能等新技術(shù),對文獻元數(shù)據(jù)和運行數(shù)據(jù)進行有效的整合,從而提高圖書館的功能,構(gòu)建以互聯(lián)網(wǎng)為基礎(chǔ)的共享服務(wù)體系,實現(xiàn)精準化、個性化和智能化文獻管理和服務(wù)的新型圖書館。在此基礎(chǔ)上,結(jié)合現(xiàn)有的相關(guān)理論,對如何在大數(shù)據(jù)平臺框架下構(gòu)建智能圖書館的概念進行界定具有一定的指導(dǎo)意義和借鑒意義。在此基礎(chǔ)上,在智能圖書館的發(fā)展與建設(shè)中,必須具備感知能力、合作共享、決策智能、知識整合、人性化交互、精確化、個性化[1]。
智能圖書館的終極目的是為讀者提供信息,在實現(xiàn)智能圖書館的過程中,如何更好地滿足用戶的需求,是實現(xiàn)信息資源共享的重要途徑。首先,利用大數(shù)據(jù)技術(shù),可以將大學生的個人信息進行綜合,包括大學生喜歡的書籍、喜歡的作家、習慣的習慣等等,并根據(jù)學生的特點,制定出適合自己的個性化推薦方案;其次,大數(shù)據(jù)技術(shù)可以作為“第一道防線”,幫助大學生篩選出自己不喜歡的部分,從而迅速地將自己感興趣的部分與之相匹配。在此過程中,利用大數(shù)據(jù)技術(shù),既能滿足學生的閱讀需要,又能節(jié)省學生的選擇時間,為大學生科學地安排學校生活和養(yǎng)成良好的興趣。
大學引入了大數(shù)據(jù)技術(shù),使圖書館的建設(shè)工作效率得到很大的提升。首先,在智能圖書館的整體構(gòu)建中,運用大數(shù)據(jù)技術(shù)來改變傳統(tǒng)的工作模式,實現(xiàn)工作流程的審批、流程對接、內(nèi)容校對、方案修改等,提高了圖書館信息化建設(shè)的效率;其次,大數(shù)據(jù)技術(shù)往往與計算機、人工智能、物聯(lián)網(wǎng)等相關(guān)。必須積極地適應(yīng)各類技術(shù)的發(fā)展。在此過程中,有關(guān)部門將逐步提升信息化辦公水平,加速智慧圖書館的建設(shè),早日實現(xiàn)其目標。
通過對信息系統(tǒng)的整合,可以為整個智能圖書館的構(gòu)建提供支撐。一方面,應(yīng)用大數(shù)據(jù)技術(shù)體系構(gòu)建智慧圖書館,不只是簡單地進行技術(shù)的堆疊,更是各種技術(shù)的協(xié)同作用?;诖髷?shù)據(jù)技術(shù)的支持,高校智能圖書館的建設(shè)能夠逐步實現(xiàn)一個系統(tǒng)的建設(shè),并逐步實現(xiàn)規(guī)模平臺化。另一方面,通過對大數(shù)據(jù)技術(shù)體系的內(nèi)在邏輯的探討,能夠給員工提供多種激勵,不斷地優(yōu)化,最終形成符合學生、教師和學校需求的運行模型。這種運行方式不僅是一種“智慧化”的智能圖書館,更是一種合理的平臺體系,與高校圖書館的長遠發(fā)展有著密切的聯(lián)系。
目前,一些大學往往忽視了學生的現(xiàn)實需要,以追求“智慧化”的智能圖書館。首先,一些高校在建設(shè)智能圖書館時,把所有的注意力都放在了對技術(shù)問題的探索上,而沒有針對學生的實際需要,對服務(wù)對象進行開發(fā)。目前,我國高校普遍存在著知識產(chǎn)權(quán)不足、知識產(chǎn)權(quán)不足、缺乏實用價值等問題。其次,一些智能圖書館采用的是一種先進的技術(shù),但是學生在進入圖書館后卻不能很快掌握,要花大量的時間來熟悉操作過程,不能方便地查閱和使用,這就是高校智能圖書館與現(xiàn)實的差距。
目前,一些高校對智能圖書館的重視程度較高,但至今未見成效。造成智能圖書館建設(shè)進展緩慢的原因主要有以下幾個方面:一是部分高校還停留在傳統(tǒng)的觀念上,忽視了技術(shù)的發(fā)展和技術(shù)的運用。智能圖書館與傳統(tǒng)的圖書館有著本質(zhì)的區(qū)別,它是通過各種現(xiàn)代科技的綜合運用來實現(xiàn)的。由于缺少技術(shù)支持,高校圖書館的建設(shè)將面臨一系列的阻力,使其無法取得有效的發(fā)展。
二是一些大學在引進先進的教學設(shè)備、教學技術(shù)后,缺乏專業(yè)人員的實際操作與運用。針對這些問題,有的大學會進行技術(shù)培訓(xùn),但是技術(shù)培訓(xùn)要經(jīng)過一段時期的實踐,才能取得良好的效果。從整體上看,要提高圖書館的建設(shè)效益,必須從技術(shù)和人才兩個方面著手。
高校智能圖書館既要與多種技術(shù)系統(tǒng)相適應(yīng),又要構(gòu)建一個科學的平臺,而有的大學則把重點放在技術(shù)層面上,而忽視了系統(tǒng)的構(gòu)建。一方面,部分高校在技術(shù)上的簡單開發(fā)和技術(shù)的疊加,而忽視了各技術(shù)系統(tǒng)的相容性,從而造成了一些不實用、不合理的技術(shù)服務(wù),從而給讀者帶來了極大的不便;另一方面,一些大學在構(gòu)建智能圖書館的平臺體系結(jié)構(gòu)時,并沒有充分認識到安全防護的重要性。由于智能圖書館中各種網(wǎng)絡(luò)技術(shù)的存在,存在著網(wǎng)絡(luò)安全隱患,如果發(fā)生突發(fā)事件,將影響到整個系統(tǒng)的安全,嚴重的影響到智能圖書館的數(shù)據(jù),從而對高校的安全造成難以估量的影響。
綜觀國內(nèi)外有關(guān)實現(xiàn)高校智能圖書館技術(shù)發(fā)展和應(yīng)用的相關(guān)研究,不難看出,由于數(shù)據(jù)技術(shù)的集成和資源突破了時間和空間的局限,資源的整合還處在起步階段,如何突破時間和空間的局限,實現(xiàn)資源的有效整合,是當前亟待解決的技術(shù)難題。另外,由于資金、人力等多方面的制約,以及圖書館資源快速更新的特點,使其在技術(shù)上的高并發(fā)性、高兼容性等方面存在較大困難,而以大數(shù)據(jù)技術(shù)為基礎(chǔ)的高校智慧圖書館資源泛在性和延續(xù)性建設(shè)有待提高。因此,當前大學智能圖書館的建設(shè)無論是理念標準、功能實現(xiàn)、技術(shù)升級、資源整合、新老系統(tǒng)安全升級等方面都存在著巨大的困難,難以滿足用戶日益增長的現(xiàn)實需求,同時也難以實現(xiàn)技術(shù)與人文價值的有機融合。
高校智能圖書館要更好地適應(yīng)大學生的現(xiàn)實需要,必須抓住以下兩個方面:第一,高校在發(fā)展智能圖書館的技術(shù)時,既要追求高、精、尖,又要從學生的實際需要出發(fā)。其次,從大數(shù)據(jù)角度對高校智能圖書館進行了研究。并對所提供的技術(shù)服務(wù)的實用性做出了評價。通過對高校圖書館技術(shù)服務(wù)的分析,可以有效地反映高校圖書館的實際需要[2]。
高校要進一步推進智能圖書館的建設(shè),必須從以下幾個方面著手:第一,與傳統(tǒng)的圖書館不同,要積極轉(zhuǎn)變觀念,注重技術(shù)的發(fā)展與技術(shù)的運用。隨著計算機、人工智能、物聯(lián)網(wǎng)等技術(shù)的不斷發(fā)展,高校能夠充分利用大數(shù)據(jù)集成的作用,有效地整合各類技術(shù)參數(shù),探索不同技術(shù)系統(tǒng)的相容性,使不同技術(shù)系統(tǒng)的優(yōu)點最大化,從而促進圖書館的有序建設(shè)。二是要加快建設(shè)智能圖書館,既要嚴格控制技術(shù)引進,又要加強人才的管理。定期舉辦智慧圖書館建設(shè)技術(shù)培訓(xùn),建設(shè)智慧圖書館建設(shè)大數(shù)據(jù)專題培訓(xùn),加強員工使用信息化技術(shù),便于員工整合資源、整合方法、整合平臺。同時,高校還可以通過邀請科技領(lǐng)域的資深專家到學校來和教師們一起探討、交流,圍繞著數(shù)據(jù)集成的作用,不斷創(chuàng)新智慧圖書館的建設(shè)途徑,從而提升圖書館的工作效率。
根據(jù)大數(shù)據(jù)系統(tǒng)自身的內(nèi)在邏輯,大學可以對其進行進一步的優(yōu)化。一方面,大數(shù)據(jù)系統(tǒng)具有信息跟蹤的能力,能夠?qū)D書的查找、借閱、歸還等各個環(huán)節(jié)進行跟蹤。在此基礎(chǔ)上,高校能夠根據(jù)大學生的閱讀需要,設(shè)計出與之相適應(yīng)的運營邏輯。而在“安全防范”問題上,大學應(yīng)重視。利用大數(shù)據(jù)技術(shù)系統(tǒng),可以從源頭上追溯信息,并將其與大數(shù)據(jù)的技術(shù)邏輯相結(jié)合,設(shè)計出安全保護的操作邏輯,從而提高其防范風險的能力。在智能圖書館中,大數(shù)據(jù)系統(tǒng)就是一道安全屏障,它能有效地保障整個智能圖書館的平臺結(jié)構(gòu),使其正常運作。
通過Hadoop的層次結(jié)構(gòu),將該技術(shù)應(yīng)用到智能圖書館的大數(shù)據(jù)平臺上,既包括了圖書館的數(shù)據(jù),又包括了教學數(shù)據(jù)和讀者消費數(shù)據(jù)。大數(shù)據(jù)平臺具有海量的數(shù)據(jù)資源,可以根據(jù)大數(shù)據(jù)平臺進行數(shù)據(jù)的存儲、分析和應(yīng)用演示。在平臺搭建中,要按照層次分明的邏輯層次進行設(shè)計,以適應(yīng)各種業(yè)務(wù)的多元化需求。主要包括數(shù)據(jù)采集層、數(shù)據(jù)存儲層、數(shù)據(jù)服務(wù)層和數(shù)據(jù)應(yīng)用層四個層次。
數(shù)據(jù)采集層:數(shù)據(jù)收集層包括了數(shù)據(jù)系統(tǒng)和提取元數(shù)據(jù)。這些資料既包含了圖書館現(xiàn)有的各種資料,也包含了圖書館的資料。智慧圖書館是智慧校園的一個重要組成部分,因此,它不僅僅是一個獨立的系統(tǒng),它還必須與學生的教學數(shù)據(jù)、基礎(chǔ)數(shù)據(jù)、學生的消費數(shù)據(jù)等保持聯(lián)系。數(shù)據(jù)收集是指將學生的信息進行抽取、清洗、轉(zhuǎn)化、裝入,形成統(tǒng)一的格式,以便為數(shù)據(jù)存儲提供支持。
數(shù)據(jù)存儲層:在大數(shù)據(jù)平臺上,各種數(shù)據(jù)的存儲是一個非常重要的工作,所以在智能圖書館的大數(shù)據(jù)平臺中,數(shù)據(jù)存儲是一個非常關(guān)鍵的環(huán)節(jié)。平臺上的一切商業(yè)與展示都要求與資料儲存層合作。在智能圖書館大數(shù)據(jù)平臺上,通常都會使用傳統(tǒng)的關(guān)系數(shù)據(jù)庫和分布式的文檔系統(tǒng)來進行數(shù)據(jù)存儲。在學校的內(nèi)部,關(guān)聯(lián)數(shù)據(jù)主要用于整合現(xiàn)有商業(yè)系統(tǒng)的數(shù)據(jù),為各種類型的數(shù)據(jù)進行清理和轉(zhuǎn)換,同時對數(shù)據(jù)進行存儲,挖掘隱藏在數(shù)據(jù)后面的信息。在海量數(shù)據(jù)中,分布式文件系統(tǒng)是以數(shù)據(jù)為基礎(chǔ)的,它包括了結(jié)構(gòu)數(shù)據(jù)和非結(jié)構(gòu)數(shù)據(jù)。
數(shù)據(jù)服務(wù)層:在整個系統(tǒng)平臺中,服務(wù)層擔負著數(shù)據(jù)存儲器與應(yīng)用程序的連接,它可以通過定義相應(yīng)的界面來實現(xiàn)平臺上的各種業(yè)務(wù)的關(guān)聯(lián),從而為上層的應(yīng)用程序提供一個很好的訪問界面。數(shù)據(jù)分析是基于Hadoop的數(shù)據(jù)分析平臺,利用其強大的運算能力,根據(jù)企業(yè)的實際需求,實現(xiàn)數(shù)據(jù)的轉(zhuǎn)換、抽取、分析和挖掘。
數(shù)據(jù)應(yīng)用層面:數(shù)據(jù)分析,挖掘,業(yè)務(wù)集成。本層的特定應(yīng)用有:決策支持系統(tǒng),圖書館報告,個人閱讀報告,移動客戶端等。
要確保智能圖書館大數(shù)據(jù)平臺的順利建設(shè),推動數(shù)據(jù)分析與挖掘工作的有效開展,必須對數(shù)據(jù)進行統(tǒng)一的數(shù)據(jù)抽取、清洗和轉(zhuǎn)化。由于元數(shù)據(jù)來源于不同的自動化系統(tǒng),所以每個自動化系統(tǒng)的數(shù)據(jù)存儲結(jié)構(gòu)都是按照各自的業(yè)務(wù)要求來設(shè)計的,而且它們之間的邏輯關(guān)系比較復(fù)雜。因此,為了保證相關(guān)工作的順利進行,必須建立一個統(tǒng)一的數(shù)據(jù)規(guī)范,以便為以后的數(shù)據(jù)分析、挖掘工作奠定基礎(chǔ),保證工作的有效性。
針對海量的結(jié)構(gòu)化和非結(jié)構(gòu)性的數(shù)據(jù)存儲需要,在數(shù)據(jù)存儲體系中進行配置。同時,還必須確保相關(guān)的數(shù)據(jù)存儲和有效地訪問和利用。HDFS是一種很好的存儲方式,它的存儲能力很強,可以通過備份來保證數(shù)據(jù)的高可用性和系統(tǒng)的容錯性。HDFS是 Hadoop生態(tài)系統(tǒng)的一個關(guān)鍵部件,它可以有效地對 HDFS中存儲的數(shù)據(jù)進行有效的讀取。由于云存儲中包含了多個商業(yè)系統(tǒng)的數(shù)據(jù),所以要按照存儲目錄來劃分不同的服務(wù)類別和信息維度,以保證數(shù)據(jù)的規(guī)范化。
該技術(shù)的合理運用,將有助于實現(xiàn)校園網(wǎng)絡(luò)的內(nèi)部數(shù)據(jù)整合,并能針對不同的業(yè)務(wù)需要,選擇合適的抽取方式。從商業(yè)系統(tǒng)中提取出大數(shù)據(jù)平臺所需要的各種數(shù)據(jù),然后在中間層進行清洗、轉(zhuǎn)化和集成。然后將這些信息匯總到目標數(shù)據(jù)庫中,這個技術(shù)在收集數(shù)據(jù)的時候起到了至關(guān)重要的作用。
數(shù)據(jù)提取是建立智能圖書館大數(shù)據(jù)平臺數(shù)據(jù)采集的一個關(guān)鍵環(huán)節(jié),在此過程中,必須對數(shù)據(jù)類型、類型等進行全面的調(diào)研和研究。因為在第一次采集時,會涉及到大量的業(yè)務(wù)數(shù)據(jù),因此,在進行首次數(shù)據(jù)采集時,就是全量抽取。在以后的數(shù)據(jù)收集過程中,必須以此為依據(jù)進行增量提取。在工作中,要正確地選擇合適的提取頻率,但由于業(yè)務(wù)數(shù)據(jù)的特性各不相同,因此必須針對具體的情況設(shè)置適當?shù)奶崛☆l率。
以大數(shù)據(jù)為核心的智能圖書館的建設(shè),以人為中心。信息資源的多樣性、復(fù)雜性是圖書館建設(shè)的核心問題,利用大數(shù)據(jù)技術(shù)、通信技術(shù)、物聯(lián)網(wǎng)、云計算等先進的數(shù)字化技術(shù),是實現(xiàn)圖書館服務(wù)范圍覆蓋廣、質(zhì)量高的必然模式,也是滿足人們?nèi)找嬖鲩L的資源需求、人文關(guān)懷以及科研創(chuàng)新要求的重要方式。利用大數(shù)據(jù)智能圖書館的建設(shè),既能在技術(shù)上,又能在人文層面上達到“以人為本”的服務(wù)宗旨,充分體現(xiàn)出圖書館的社會價值。