羅 鏗
(嘉應學院,梅州514015)
從Roy Tennan等人提出的整合檢索到Anurag Acharya等開發(fā)的Google Scholar,特別是服務系統(tǒng)集成商和資源提供(數(shù)據(jù)庫)商的積極加入,資源發(fā)現(xiàn)系統(tǒng)得到了迅速發(fā)展,圖書館多平臺且無序的服務現(xiàn)狀得到改變。據(jù)2009年一項針對美國ARL(Association of Research Libraries)所屬的100所高校圖書館成員使用新一代資源發(fā)現(xiàn)系統(tǒng)情況的調(diào)查顯示,超過三分之一的高校成員館采用了新一代資源發(fā)現(xiàn)界面。另一項調(diào)查顯示,僅2010年引進Summon、Primo、Worldcat Local與 Encore 四大主要資源發(fā)現(xiàn)系統(tǒng)的圖書館就有1270家,累計安裝達2875家[1]。種種跡象表明,依托龐大的元數(shù)據(jù)集合,通過類似Google的簡單檢索框,采用統(tǒng)一的路徑,實現(xiàn)對圖書館各種資源的發(fā)現(xiàn)和獲取,資源發(fā)現(xiàn)系統(tǒng)已然成為下一代圖書館系統(tǒng)中的核心一環(huán)[2]。在此趨勢下,隨著下一代圖書館系統(tǒng)的研發(fā)、用戶界面的改進與升級、機構知識庫的建設等圖書館系統(tǒng)的更新與發(fā)展,必將沖擊圖書館傳統(tǒng)的信息交流和服務環(huán)境,給高校圖書館的信息服務帶來一種全新的理念與模式。
就類型而言,目前市場上資源發(fā)現(xiàn)系統(tǒng)的類型主要有以下幾種:國外的有 EBSCO Discovery Service(EDS)、ExLibris(PrimoDiscoveryand Delivery)、Serials Solutions Summon(web - scale discovery)、Innovative Interfaces Encore Discovery、OCLC WorldCat Local五種;國內(nèi)有 CALIS的 e讀(易讀)搜索、讀秀學術搜索、超星經(jīng)緯學術發(fā)現(xiàn)系統(tǒng)、指針搜索、百鏈、smartlib的 find plus、CNKI學術搜索、KDN知識發(fā)現(xiàn)網(wǎng)絡平臺等等[2]。從資源發(fā)現(xiàn)系統(tǒng)開發(fā)機構的性質(zhì)來看,資源發(fā)現(xiàn)系統(tǒng)的開發(fā)機構主要由數(shù)據(jù)庫生產(chǎn)商及圖書館集成系統(tǒng)開發(fā)商兩大類組成,這兩類開發(fā)機構要么擁有海量元數(shù)據(jù),要么擁有先進的搜索技術,其產(chǎn)品也各具特色。
從資源發(fā)現(xiàn)系統(tǒng)產(chǎn)品評估的商業(yè)角度來看,可以認為所有資源發(fā)現(xiàn)系統(tǒng)都具有四個共同的核心要素:元數(shù)據(jù)要素、架構與功能要素、檢索與界面要素、商務因素等。元數(shù)據(jù)要素方面主要涵括其規(guī)模(總量、收錄范圍)、質(zhì)量(薄/厚數(shù)據(jù)、規(guī)范)、對本館資源的覆蓋度、OA與免費資源的集成及更新速度等;架構與功能要素方面則由資源發(fā)現(xiàn)系統(tǒng)的部署模式、模塊與子系統(tǒng)、本館數(shù)據(jù)提交方式、與OPAC的融合度、與WOS的集成、可擴展性、中文支持、資源導航、移動界面以及其他特色功能組成;檢索與界面要素方面則考察其分面功能、高級檢索功能、相應時間、相關度排序、用戶界面等;商務因素方面主要由性價比、用戶情況、本地支持、定制開發(fā)及其與已有系統(tǒng)的兼容性組成。
以上四個核心要素是高校圖書館在引進、建設與開發(fā)資源發(fā)現(xiàn)系統(tǒng)時必須進行詳細比較分析的因素。通過對國內(nèi)“985”工程高校資源發(fā)現(xiàn)系統(tǒng)應用進行調(diào)查了解可知[2],就國內(nèi)高校而言,對所需的資源發(fā)現(xiàn)系統(tǒng)主要采取直接采購、聯(lián)合研發(fā)以及自建等三種方式進行建設。直接采購主要是直接選購成熟產(chǎn)品,如 EDS、Primo、Summon、超星經(jīng)緯發(fā)現(xiàn)和指針搜索等系統(tǒng)。它們技術先進,數(shù)據(jù)規(guī)模比較大,具有專業(yè)研發(fā)隊伍,對圖書館業(yè)務熟悉的系統(tǒng)。直接采購的好處是在資源發(fā)現(xiàn)系統(tǒng)投入應用的時間、技術支持、元數(shù)據(jù)制作、本地化應用等方面具有優(yōu)勢,如上海交通大學的思源探索和北京大學的未名學術搜索。聯(lián)合開發(fā)方式主要是與數(shù)據(jù)資源商或技術開發(fā)商聯(lián)合研發(fā),以提高圖書館的技術人員素質(zhì),在后期的系統(tǒng)維護,節(jié)約建設開發(fā)資金,培養(yǎng)、增強圖書館的技術力量等方面具有優(yōu)勢,如南京大學的“Fine+知識發(fā)現(xiàn)平臺”。自建方式有兩種,一種是采用開源軟件開發(fā)建設資源發(fā)現(xiàn)系統(tǒng),另一種是自己設計軟件進行資源整合開發(fā)。高校圖書館在資源發(fā)現(xiàn)系統(tǒng)的建設上采用自建方式,具有可靈活配置自己的需求,系統(tǒng)自主維護性高等優(yōu)勢,但由于高校圖書館本身不具備技術優(yōu)勢及海量數(shù)據(jù)儲備優(yōu)勢,采用自建方式開發(fā)資源發(fā)現(xiàn)系統(tǒng)容易面臨建設成本高,建設周期長,開發(fā)經(jīng)驗不足等缺點,因此一般的高校圖書館不采用自建方式進行資源發(fā)現(xiàn)系統(tǒng)的建設。從現(xiàn)階段看,在以上三種方式中,以直接采購方式建設資源發(fā)現(xiàn)系統(tǒng)成為國內(nèi)大部分高校圖書館的主要選擇。
資源發(fā)現(xiàn)系統(tǒng)的一般原理是系統(tǒng)提供商通過與出版社等內(nèi)容提供商的合作,對海量的、來自異構資源的元數(shù)據(jù)和部分對象數(shù)據(jù),采取分析、抽取等手段進行預收集(pre-h(huán)arvested),并將這些數(shù)據(jù)按映射轉換規(guī)則轉換為標準格式,納入到元數(shù)據(jù)標準體系中,形成一個預聚合的元數(shù)據(jù)聯(lián)合索引庫,在本地或者遠程中心平臺提供統(tǒng)一的搜索服務[3]。圖1為這一過程的示意圖。
圖1 資源發(fā)現(xiàn)系統(tǒng)工作原理[4]
資源發(fā)現(xiàn)系統(tǒng)的基本服務體系架構根據(jù)工作原理劃分為四層:數(shù)據(jù)資源層、資源組織層、知識發(fā)現(xiàn)層、應用服務層[5]。
數(shù)據(jù)資源層是整個發(fā)現(xiàn)系統(tǒng)中最基礎的層級,是整個資源發(fā)現(xiàn)系統(tǒng)服務的基礎。在這個層級中,通過各種方式完成對形式多樣、結構異同、數(shù)量龐大的元數(shù)據(jù)的數(shù)據(jù)集成工作,主要通過與出版商或內(nèi)容商簽訂商業(yè)協(xié)議的方式進行獲取收集。核心是集成數(shù)據(jù)的數(shù)量、質(zhì)量及對學術資源的覆蓋度。
資源組織層是對集成的海量數(shù)據(jù)進行規(guī)范化處理工作的層級。通過對收集的數(shù)據(jù)進行內(nèi)容比對、去重、合并及補充等完成對元數(shù)據(jù)的規(guī)范格式處理,確保元數(shù)據(jù)的品質(zhì),同時對規(guī)范化的元數(shù)據(jù)進行索引,實現(xiàn)對異構資源有序化的轉換。核心是元數(shù)據(jù)品質(zhì)的保證及不同屬性規(guī)范詞表的(關聯(lián))建立。
知識發(fā)現(xiàn)層是完成對多來源資源定向的數(shù)據(jù)分析、挖掘及管理的層級,利用分類、聚類、關聯(lián)分析及序列模式等數(shù)據(jù)挖掘方法,以問題的理解和定義、相關數(shù)據(jù)收集和提取、數(shù)據(jù)探索和清理、數(shù)據(jù)工程、算法選擇、運行數(shù)據(jù)挖掘算法、結果的評價等為步驟實現(xiàn)內(nèi)容知識的智能化發(fā)現(xiàn)和擴展。核心是識別過程,從數(shù)據(jù)庫中發(fā)現(xiàn)新的模式、知識和規(guī)律,進而預測規(guī)律,將新發(fā)現(xiàn)的知識整序后存放到知識庫中,建立數(shù)據(jù)庫與知識庫之間子類結構與知識素結點間的一一對應關系。
應用服務層是整個系統(tǒng)中的最上層級,是系統(tǒng)與用戶交互并實現(xiàn)服務的層級。在這個層級中,包括檢索結果展示、關聯(lián)知識獲取、平臺監(jiān)控與管理、應用服務接口等內(nèi)容。核心是提供豐富而有效的結果展示方式及用戶需求的深度分析(日志分析)。
通過以上四個層級的架構,資源發(fā)現(xiàn)系統(tǒng)完成對分布、異構、海量資源的集合、整序、分析和發(fā)現(xiàn)并有效提供的過程。其提供的完美狀態(tài)下的理想服務場景可以描述為用戶通過統(tǒng)一檢索入口,獲得當前用戶需求知識解決的全部資源展示,依靠其提供的各種資源共享的機制或云共享服務模式完成對非本地(擁有)資源的獲取,最終實現(xiàn)用戶知識需求的滿足及對知識發(fā)現(xiàn)的持續(xù)探索。
圖書館的信息服務是以信息資源為基礎,利用各種方法或技術手段對信息進行收集、整理、使用并提供相關信息產(chǎn)品和服務的一種活動[6]。以此概念來理解圖書館的信息服務,結合資源發(fā)現(xiàn)系統(tǒng)的原理及其服務架構,可以看出,資源發(fā)現(xiàn)系統(tǒng)本身就是圖書館信息服務方式的一種。從信息服務行為的角度看,以資源發(fā)現(xiàn)系統(tǒng)為服務主體的信息服務方式是一種無人工參與的一站式信息服務類型。在這個類型中,信息服務需求者即用戶對資源發(fā)現(xiàn)系統(tǒng)功能及應用的感知變得尤為重要,在用戶利用資源發(fā)現(xiàn)系統(tǒng)實現(xiàn)個性化服務、全方位信息及深層次信息獲取直至知識發(fā)現(xiàn)的過程中,圖書館提供的提高用戶對服務系統(tǒng)功能有效感知度的培訓及宣傳將成為新信息服務模式中的首要環(huán)節(jié)。
近年來,“圖書館需要營銷”這一觀點被圖書館界廣泛接受,在實際應用中,營銷的確是圖書館提升服務效益和資源效益的一種必要手段,因此,結合資源發(fā)現(xiàn)系統(tǒng)中提供的相關數(shù)據(jù)分析并采用營銷方式提供培訓及宣傳將是圖書館提高用戶有效感知度的主要信息服務方式。根據(jù)用戶數(shù)據(jù)的搜集完成用戶信息行為特點分析,如以用戶信息習慣及網(wǎng)絡依賴度作為分析因素,在此基礎上制定包括宣傳力度、渠道方式、活動類型、合作和參與及體驗反饋在內(nèi)的系統(tǒng)服務推廣策略,從而讓資源發(fā)現(xiàn)系統(tǒng)可以成功地定位于服務大眾用戶的范疇,成為信息搜索利用的首選。
資源發(fā)現(xiàn)系統(tǒng)提供的一站式信息服務方式在很大程度上取代了圖書館傳統(tǒng)信息服務的基礎服務內(nèi)容,如原文傳遞、參考咨詢、館際互借等,在資源(實體資源和電子資源)全面獲取的層面上甚至比傳統(tǒng)模式下人工參與提供的資源服務更方便、快捷。因此,圖書館新信息服務內(nèi)容重心將逐漸轉移到數(shù)據(jù)服務,依靠資源發(fā)現(xiàn)系統(tǒng)的數(shù)據(jù)資源層及資源組織層,提供基于關聯(lián)數(shù)據(jù)的應用服務,實現(xiàn)由傳統(tǒng)信息服務向知識集成服務的轉變。
4.2.1 關聯(lián)數(shù)據(jù)的發(fā)布
關聯(lián)數(shù)據(jù)的發(fā)布指采用RDF(Resource Description Framework,資源描述框架)和 HTTP(超文本傳輸協(xié)議)技術在Web上發(fā)布結構化信息。關聯(lián)數(shù)據(jù)是新一代語義互聯(lián)網(wǎng)的基礎,其應用前景非常廣泛。無論是SKOS通過搭建知識組織系統(tǒng)(如分類表、詞表)到關聯(lián)數(shù)據(jù)之間的橋梁以實現(xiàn)全面關聯(lián)數(shù)字化,還是OCLC利用SRU服務為VIAF(虛擬國際規(guī)范文檔)項目提供關聯(lián)數(shù)據(jù)等,都表明了圖書館界已開展關聯(lián)數(shù)據(jù)的發(fā)布及應用,從而推動關聯(lián)數(shù)據(jù)的實用化。圖書館的規(guī)范記錄、MARC數(shù)據(jù)、主題標目等資源都可以發(fā)布為關聯(lián)數(shù)據(jù)。通過將圖書館資源發(fā)布為關聯(lián)數(shù)據(jù)的應用,為本地數(shù)據(jù)建立外部關聯(lián),使得圖書館的資源和外部世界可以相互連接起來,這不僅可以增強和擴展圖書館的發(fā)現(xiàn)平臺,凸顯圖書館在現(xiàn)代學術交流環(huán)境下作為創(chuàng)建者和出版者的作用,在吸引用戶方面,還可以通過將圖書館的特色數(shù)據(jù)發(fā)布成關聯(lián)數(shù)據(jù),增加用戶回到圖書館的途徑。
4.2.2 多數(shù)據(jù)混搭的應用服務
提供多層次的知識關聯(lián)集成服務是多種類型數(shù)據(jù)混搭的應用服務之一。從用戶的角度看,資源發(fā)現(xiàn)系統(tǒng)中,關聯(lián)數(shù)據(jù)通過對多個分布式異構數(shù)據(jù)源進行整合的關聯(lián)訪問,將來自非同一數(shù)據(jù)源的同一對象進行整合,以統(tǒng)一視圖提供給用戶關于該對象的所有信息,從而使用戶發(fā)現(xiàn)和共享網(wǎng)絡中不同類型的數(shù)據(jù)、信息、知識成為可能,這使得用戶所面對的數(shù)據(jù)和信息呈指數(shù)級增長。而關聯(lián)數(shù)據(jù)通過在數(shù)據(jù)層建立鏈接機制,其數(shù)據(jù)的結構信息得到很好的描述,以URI(Uniform Resource Identifier,通用資源標示符)確保系統(tǒng)能夠自動鏈接各種數(shù)據(jù),為信息聚合的智能化和自動化提供了基礎。充分利用關聯(lián)數(shù)據(jù)源中的關聯(lián)關系,實現(xiàn)有序組織、集成和關聯(lián)知識單元,進行知識內(nèi)容的關聯(lián)及深層次的展示。如在一些大學圖書館的實際應用中,應用關聯(lián)數(shù)據(jù)實現(xiàn)包括人員、機構單位、研究成果、會議資源、科研項目等在內(nèi)的具有關聯(lián)屬性的知識內(nèi)容整合和集成,為用戶提供多層次的知識關聯(lián)集成服務。
其次,多數(shù)據(jù)混搭應用服務還可以應用于手機、IPAD等移動終端,實現(xiàn)不同領域和場景中的移動服務。關聯(lián)數(shù)據(jù)以其語義獨立的知識單元描述和發(fā)布規(guī)范,為普適的、無所不在的移動服務帶來了可重用、可參考、普遍聯(lián)系的資源基礎。如DBpedia Mobile在移動環(huán)境中的應用,DBpedia實現(xiàn)了Wikipedia的關聯(lián)數(shù)據(jù)化,描述了其中218萬多個實體,其中包含了近30萬條的地理位置。DBpedia Mobile充分利用這些位置數(shù)據(jù),通過GPS信號,結合DBpedia與其他LOD數(shù)據(jù)集的關聯(lián),自動發(fā)現(xiàn)當前位置附近的相關內(nèi)容,并通過瀏覽器提供地圖化的界面[7]。在圖書館的應用服務中,通過圖書館區(qū)域內(nèi)地理實體的導航和相關信息的實時獲取,使得圖書館提供移動參考咨詢服務成為可能。
資源發(fā)現(xiàn)系統(tǒng)在高校圖書館的快速普及應用說明了其價值與競爭力。對于圖書館新信息服務模式而言,采取主動措施,通過有效的用戶培訓及品牌宣傳,使大部分用戶選擇圖書館作為首要信息來源之一,繼而依靠有效培訓獲得信息素質(zhì)能力,通過以資源發(fā)現(xiàn)系統(tǒng)為核心的服務系統(tǒng)解決實現(xiàn)用戶的自服務模式,而圖書館則從傳統(tǒng)信息服務模式轉向以數(shù)據(jù)服務為核心的知識服務,提供信息資源深度整合及信息產(chǎn)品產(chǎn)出模式的個性化服務。
[1]鄭麗君.資源發(fā)現(xiàn)服務:圖書館服務與研究的新視角[J].圖書與情報,2013,(3):132 -134.
[2]胡 瑋.“985工程”高校圖書館資源發(fā)現(xiàn)系統(tǒng)現(xiàn)狀分析和思考[J].圖書館學研究.2013,(16):43-48.
[3]聶 華.發(fā)現(xiàn)服務——通向深度整合與便捷獲取的路徑[C].2011高校圖書館發(fā)展論壇暨數(shù)字圖書館前沿問題高級研討班.成都,2011.
[4]朱本軍.基于聯(lián)合索引的下一代圖書館學術資源搜索研究[C].2010年教育部高校圖工委信息技術應用年會.上海,2010.
[5]楊 會等.網(wǎng)絡級知識發(fā)現(xiàn)服務的功能分析及問題探討[J]情報雜志,2013,(11):149-153.
[6]張樹華等.數(shù)字時代的圖書館信息服務[M].北京:北京圖書館出版社,2005.1-9.
[7]沈志宏,張曉林.關聯(lián)數(shù)據(jù)及其應用現(xiàn)狀綜述[J].現(xiàn)代圖書情報技術,2010.10:1-9.