陳麗紅
摘 要:數(shù)據(jù)庫產(chǎn)品是按照特定專業(yè)或?qū)W科,匯集海量條目數(shù)據(jù),為個人用戶或者機構(gòu)用戶提供知識服務的數(shù)字內(nèi)容產(chǎn)品。本文從數(shù)據(jù)庫產(chǎn)品在出版物中獨特的市場地位和對出版社的重要性出發(fā),通過對數(shù)據(jù)庫產(chǎn)品開發(fā)難點和重點的分析,提出出版企業(yè)開發(fā)數(shù)據(jù)庫產(chǎn)品的基本思路,為出版企業(yè)發(fā)展信息服務業(yè)提供可行性參考。
關(guān)鍵詞:數(shù)據(jù)庫;出版;信息服務
中圖分類號:G230 文獻標識碼:A 文章編號:2096-5079 (2020) 05-00-02
數(shù)字出版是人類文化的數(shù)字化傳承,它是建立在計算機、通訊、網(wǎng)絡、流媒體、存儲、顯示等高新技術(shù)基礎上發(fā)展起來的新興出版產(chǎn)業(yè)。數(shù)據(jù)庫產(chǎn)品,是指按照特定專業(yè)或?qū)W科,匯集海量條目數(shù)據(jù),為個人用戶或者機構(gòu)用戶提供知識服務的數(shù)字內(nèi)容產(chǎn)品。
目前,在國外,數(shù)據(jù)庫出版已經(jīng)發(fā)展成為一種比較成熟的產(chǎn)業(yè)。國際上大型出版集團都開發(fā)了自己的出版型數(shù)據(jù)庫,其中有些數(shù)據(jù)庫已經(jīng)發(fā)展成為財源滾滾的利潤來源,有著深遠的影響力。如里德·愛思唯爾旗下的lexisnexis數(shù)據(jù)庫,湯姆森學習出版集團旗下的thomsongale等[1]。在國內(nèi),數(shù)據(jù)庫出版勢頭正猛。目前市場知名度高、影響力大的數(shù)據(jù)庫產(chǎn)品有清華同方的中國知網(wǎng)、北京萬方的萬方數(shù)據(jù)庫、社會科學文獻出版社的皮書數(shù)據(jù)庫等。
一、數(shù)據(jù)庫產(chǎn)品的重要性
(一)對于讀者和用戶
在所有不同形態(tài)的出版物中,數(shù)據(jù)庫產(chǎn)品有其獨特的市場地位,在滿足讀者和用戶需求上,有以下突出的比較優(yōu)勢。
(1) 海量資源供給。數(shù)據(jù)庫產(chǎn)品以條目數(shù)據(jù)為產(chǎn)品構(gòu)成基本單元,以海量資源聚集為主要表現(xiàn)形態(tài),信息容量是普通電子書、期刊、報紙等出版物的指數(shù)倍。
(2) 高速資源獲取。數(shù)據(jù)庫把內(nèi)容資源有序地組織在一起,并以強大的查詢檢索功能為技術(shù)支撐。在需要快速獲取相關(guān)內(nèi)容的應用場景中,尋找相關(guān)資源、核實真?zhèn)?、查找背景資料等,數(shù)據(jù)庫產(chǎn)品具有其他出版物不可比擬的優(yōu)勢。讀者或用戶可以在幾秒鐘內(nèi)獲取與某個主題相關(guān)的豐富的信息資源,在很短時間內(nèi)完成資料搜集。
(3) 零時差信息更新。數(shù)據(jù)庫產(chǎn)品,特別是在線類的數(shù)據(jù)庫產(chǎn)品,數(shù)字內(nèi)容一經(jīng)發(fā)布,即刻到達使用者,無印刷、轉(zhuǎn)碼、包裝、分銷等過程,讀者可零時差獲取最新資源,不受時空限制。
(二)對于出版企業(yè)
近年來,為引導、扶持出版企業(yè)轉(zhuǎn)型升級,推動出版企業(yè)融合發(fā)展,國家新聞出版主管部門相繼發(fā)布了《關(guān)于加快我國數(shù)字出版產(chǎn)業(yè)發(fā)展的若干意見》《數(shù)字出版“十二五”時期發(fā)展規(guī)劃》《關(guān)于加強數(shù)字出版內(nèi)容投送平臺建設和管理的指導意見》等一系列文件,出臺了數(shù)字化轉(zhuǎn)型升級項目、文化產(chǎn)業(yè)發(fā)展專項資金、國有資本金等一系列扶持政策,給予出版企業(yè)在政策上以引導,資金上以支持。
出版企業(yè)進行數(shù)據(jù)庫產(chǎn)品開發(fā),既符合國家經(jīng)濟政策、文化產(chǎn)業(yè)政策導向,也符合自身發(fā)展需要。經(jīng)驗表明,一個出版社發(fā)展到一定規(guī)模,肯定能開發(fā)自己的數(shù)據(jù)庫??梢赃@么說,在當今數(shù)字化時代和信息時代,判斷一個出版社是不是大社強社,就看它能不能進行數(shù)據(jù)庫出版。
二、數(shù)據(jù)庫出版的重點和難點
(一)資源采集
數(shù)據(jù)庫產(chǎn)品以海量資源聚集為特點,因此前期的內(nèi)容資源采集、加工、整理、歸類、審核等工作需投入大量的人力物力。只有擁有足夠的內(nèi)容資源,才能支撐一個數(shù)據(jù)庫產(chǎn)品的形成。如中國知網(wǎng)的中國學術(shù)期刊網(wǎng)絡出版總庫,收錄7900余種期刊,文獻量達4000萬余篇?!昂A俊笔菙?shù)據(jù)庫產(chǎn)品區(qū)別于其他出版物的主要標識之一。
(二)技術(shù)實現(xiàn)
對數(shù)量巨大、來源分散、格式多樣的數(shù)據(jù)進行采集、存儲和關(guān)聯(lián)分析,將海量信息有序化、條理化、智能化地呈現(xiàn)給讀者和用戶,技術(shù)力量是關(guān)鍵。數(shù)據(jù)庫構(gòu)架設計、人機交互界面設計,涉及數(shù)據(jù)存儲、知識標引、語義分析、云計算、模型建構(gòu)等多項信息網(wǎng)絡、計算機技術(shù)。技術(shù)的落后或者先進,直接影響數(shù)據(jù)庫產(chǎn)品的質(zhì)量、用戶的體驗、銷售成績,進而影響整個產(chǎn)品的生命力。出版企業(yè)一向擅長內(nèi)容的生產(chǎn),技術(shù)人才卻儲備不足。最初開發(fā)的數(shù)據(jù)庫產(chǎn)品,多數(shù)都是將技術(shù)外包。而數(shù)據(jù)庫產(chǎn)品的開發(fā)和運維是一個長期、持續(xù)性的過程,技術(shù)合作公司無法做到即時響應、持久響應,出版企業(yè)會面臨技術(shù)中斷的風險[2]。
(三)資金支持
數(shù)據(jù)庫建設是一個長期、持久的過程,需要持續(xù)性的大投資。在市場未形成以及數(shù)據(jù)庫未達到一定規(guī)模時,相當長時期是只有投放沒有產(chǎn)出。資金問題,實際上是許多出版單位在進行數(shù)據(jù)庫出版過程中遇到的最大的問題。為推進文化科技創(chuàng)新和文化傳播體系建設,新聞出版主管部門通過多項政策助力重點企業(yè)重點項目的開發(fā)建設。例如人民交通出版社的《車學堂》項目,中國法制出版社的《“一帶一路”投資與貿(mào)易法律服務平臺》,人民法院出版社的《中國法律應用數(shù)字網(wǎng)絡服務平臺》。但是,數(shù)據(jù)庫運營更多的投入來自企業(yè)自有資金和項目的后期收益。
(四)運營維護
數(shù)據(jù)庫的運營維護包括系統(tǒng)管理、內(nèi)容資源更新、市場推廣、用戶服務、需求開發(fā)等等。數(shù)據(jù)庫的內(nèi)容資源需要每日、每周、每月或?qū)崟r更新。在產(chǎn)業(yè)整合、市場競爭激烈的環(huán)境下,要保持數(shù)據(jù)庫產(chǎn)品的競爭優(yōu)勢,一方面需要內(nèi)容資源的全、專、精、準,另一方面需要及時更新技術(shù)實現(xiàn)手段,將內(nèi)容、分析工具和信息服務深度整合。運營維護對單體出版社來說是個巨大挑戰(zhàn)。
三、數(shù)據(jù)庫產(chǎn)品出版思路
(一)立項:以專帶全,破解資金困境
由于數(shù)據(jù)庫產(chǎn)品的前期投入非常大,數(shù)據(jù)庫的開發(fā)規(guī)模和策略顯得極其重要。在進行項目論證、產(chǎn)品設計時,我們需要通過對市場環(huán)境分析、行業(yè)分析、競品分析、現(xiàn)有資源分析等一系列策略分析的組合,從內(nèi)容資源入手、從用戶需求入手,對細分市場進行正確定位,以專帶全,把資金分配到最需要的地方。通過占領(lǐng)細分市場,以服務特定用戶群體為宗旨,形成內(nèi)容豐富、體系健全、邏輯嚴密、規(guī)模龐大的知識數(shù)據(jù)庫,將專業(yè)優(yōu)勢轉(zhuǎn)化為相應的競爭優(yōu)勢,進而不斷擴大數(shù)據(jù)庫出版規(guī)模,從而提高企業(yè)的整體經(jīng)營和競爭實力。
(二)內(nèi)容:持續(xù)積累,實行集約化管理
出版企業(yè)要開發(fā)數(shù)據(jù)庫產(chǎn)品,需要對內(nèi)容資源進行持續(xù)積累,并進行集約化管理。出版企業(yè)的內(nèi)容資源采集,第一來源是存量資源的轉(zhuǎn)換。專業(yè)出版社往往服務于特定行業(yè),在長期經(jīng)營發(fā)展過程中,已經(jīng)積累了專業(yè)的、權(quán)威的、數(shù)量龐大的數(shù)據(jù)資源。出版社需對既存的知識資源進行數(shù)字化、碎片化,將文字、音頻、視頻、圖像、數(shù)據(jù)等素材進行結(jié)構(gòu)化管理,完成數(shù)據(jù)庫最重要的原始數(shù)據(jù)積累。第二來源是在產(chǎn)品數(shù)據(jù)資源的獲取。通過與在產(chǎn)品的同步化生產(chǎn)流程,將內(nèi)容資源進行篩選、審查、標引、入庫等處理實現(xiàn)條目數(shù)據(jù)的擴充。另外,出版企業(yè)也可以通過資源置換、資源合作等多種方式來實現(xiàn)資源擴充。如果內(nèi)容數(shù)據(jù)庫建設得足夠好,不僅可以為出版企業(yè)內(nèi)部共享信息提供便利,也可以為專題出版、知識服務打下基礎。
(三)技術(shù):注重人才結(jié)構(gòu)布局,實現(xiàn)由出版商向知識服務供應商轉(zhuǎn)變
數(shù)據(jù)庫知識服務有三種不同服務模式:基礎的信息資源呈現(xiàn)服務,中級的可實現(xiàn)局部交互功能的信息整合服務和高級的自適應式定制和精準化服務。服務層級越高,對內(nèi)容的專業(yè)性、技術(shù)支持要求也就越高。數(shù)據(jù)庫構(gòu)架設計、人機交互界面設計,除需借助語言學、認知科學、美學、心理學等理論和方法,更重要是依托計算機技術(shù)和通信技術(shù)。推動融合發(fā)展,實現(xiàn)新常態(tài)下的數(shù)字庫出版平穩(wěn)發(fā)展,最重要的莫過于對技術(shù)型人才、復合型人才的引進、培養(yǎng)和使用。在人才結(jié)構(gòu)上,出版企業(yè)要有自身的布局和培養(yǎng)計劃,要抓住發(fā)展機遇,在培養(yǎng)中發(fā)展,在發(fā)展中壯大,一步步實現(xiàn)由出版商向網(wǎng)絡信息服務供應商的轉(zhuǎn)變。
(四)運營:精準投放,以應用為導向不斷完善產(chǎn)品功能
產(chǎn)品滿足基礎需求,服務滿足高端需求。數(shù)據(jù)庫產(chǎn)品的運營工作要貫徹投放精準化、服務標準化、維護日常化的要求。數(shù)據(jù)庫產(chǎn)品的運營人員肩負雙重責任。一方面需要不斷開拓數(shù)據(jù)庫產(chǎn)品市場,提高產(chǎn)品市場占有率和知名度,另一方面做好用戶需求的獲取、評估、管理,以應用為導向,不斷完善產(chǎn)品功能,營造比同類產(chǎn)品、可替代品更強大的優(yōu)勢,最大限度地贏得消費者的認同。
四、結(jié)語
數(shù)據(jù)庫在大規(guī)模整合知識信息資源、提高資源的綜合利用價值、為全社會提供數(shù)字資源、實現(xiàn)資源共享等方面有著不可估量的貢獻。數(shù)據(jù)庫出版,既符合國家經(jīng)濟政策、文化產(chǎn)業(yè)政策導向,也符合出版企業(yè)自身發(fā)展需要。我們必須重視數(shù)據(jù)庫的開發(fā)與研究,實現(xiàn)產(chǎn)業(yè)化運作,為全社會提供更高效、更豐富的知識信息資源。
參考文獻:
[1]蓋兆泉.數(shù)據(jù)庫出版:離我們有多遠?[N].新出版日報,2010-3.
[2]張新新.變革時代的數(shù)字出版[M].知識產(chǎn)權(quán)出版社,2016(1).