趙宏源
隨著融合出版的深入,有效整合出版資源以提升利用效率的重要性日益突出,成為出版單位轉(zhuǎn)型發(fā)展的基礎(chǔ)。一般意義上的出版資源,是指出版活動(dòng)中構(gòu)成出版物內(nèi)容的信息以及出版活動(dòng)全流程中所產(chǎn)生與需要的全部信息,在經(jīng)過加工處理有序化后大量積累起來的有用信息的集合。它具有三個(gè)主要特征。一是稀缺性,具有可開發(fā)的經(jīng)濟(jì)價(jià)值,用途可以自主選擇;二是社會(huì)性,出版資源來自社會(huì)活動(dòng),資源的開發(fā)利用具有社會(huì)性;三是靜態(tài)與動(dòng)態(tài)的統(tǒng)一性,在一定時(shí)空范圍內(nèi)相對(duì)穩(wěn)定,但在一定時(shí)空跨度內(nèi)的存在形態(tài)或者體系又會(huì)改變。[1]
根據(jù)融合出版的發(fā)展,需要整合的出版資源包括三個(gè)方面:一是數(shù)據(jù),涵蓋生產(chǎn)、經(jīng)營與網(wǎng)絡(luò)數(shù)據(jù),旨在反映出版產(chǎn)品的成本、收益與社會(huì)反響等;二是生產(chǎn)或者加工的內(nèi)容資源,包括圖書排版文檔、電子書文檔以及相關(guān)的音視頻資源等;三是社會(huì)內(nèi)容資源,包括圖書、自媒體內(nèi)容以及媒體報(bào)道等,以分析判斷專業(yè)領(lǐng)域的發(fā)展趨勢(shì),輔助選題策劃。經(jīng)過多年努力,我國融合出版有了很大發(fā)展,這種形勢(shì)倒逼出版單位須加強(qiáng)對(duì)出版資源的整合力度,以提升資源利用效率,提高選題質(zhì)量。但是總體上看,出版單位的出版資源整合仍然存在比較大的問題,主要表現(xiàn)在三個(gè)方面。
出版資源采集是出版資源整合中最基礎(chǔ)的環(huán)節(jié),是進(jìn)行內(nèi)容深度開發(fā)、滿足用戶場(chǎng)景化需求,實(shí)現(xiàn)融合出版的根本。資源采集工作貫穿出版流程的每一個(gè)環(huán)節(jié),選題確定的同時(shí)即產(chǎn)生出版資源,進(jìn)入銷售階段后,經(jīng)營數(shù)據(jù)和各種網(wǎng)絡(luò)數(shù)據(jù)不斷產(chǎn)生、更新,出版資源的規(guī)模隨之?dāng)U大。
在實(shí)踐中,出版流程各個(gè)環(huán)節(jié)的操作部門根據(jù)本部門需求采集制作資源,例如印制部門從出版物印制角度采集書名、書號(hào)、印張、封面與正文用紙、裝幀、開本以及相關(guān)費(fèi)用等,發(fā)行部門從銷售角度采集客戶名稱、價(jià)格、折扣、銷量以及物流信息等,數(shù)字出版部門從數(shù)字化角度采集PDF 文檔、ePub 文檔以及音頻文件等。由于不同部門工作相關(guān)性很強(qiáng),因此必然存在大量相同資源,例如印制部門和數(shù)字出版部門所需的PDF 文檔、總編辦公室和印制部門共同需要的CIP 數(shù)據(jù)等。每個(gè)部門在采集過程中如果涉及其他部門資源,要么到其他部門復(fù)制,要么自行采集,均存在重復(fù)勞動(dòng),造成人力物力的浪費(fèi)。
溝通成本包括可以計(jì)入成本核算的直接成本、信息溝通過程中投入的時(shí)間成本,以及因投入溝通而不能投入其他經(jīng)營活動(dòng)所產(chǎn)生的機(jī)會(huì)成本。影響溝通成本的主要因素有組織、決策的時(shí)效性,信息編碼、傳遞以及反饋的質(zhì)量等。[2]內(nèi)部溝通成本是影響企業(yè)管理活動(dòng)的規(guī)范與效率的重要因素之一。
根據(jù)所屬主體的不同,出版資源可以分為出版單位的內(nèi)部資源和外部資源,其中內(nèi)部資源包括生產(chǎn)、經(jīng)營數(shù)據(jù)和內(nèi)容資源等。在出版單位,這些內(nèi)部資源分別由總編辦公室、印制部門、市場(chǎng)部門、發(fā)行部門、編輯部門以及數(shù)字出版部門等不同部門存儲(chǔ),某個(gè)部門在使用其他部門數(shù)據(jù)時(shí),需要去溝通。例如,發(fā)行部門需要圖書樣張和封面,只能求助于印制部門或編輯部門,無法實(shí)現(xiàn)在圖書排版完成的同時(shí)自動(dòng)生成,并與其他市場(chǎng)所需數(shù)據(jù)整合成為數(shù)據(jù)包,更無法通過系統(tǒng)對(duì)接,直接幫助電商平臺(tái)錄入新書數(shù)據(jù)。
出版資源的管理包括資源的識(shí)別、獲取、維持、保護(hù)、使用和評(píng)價(jià)等過程。融合出版平臺(tái)以用戶的知識(shí)輸入效率和效果的提升為宗旨,必然要求對(duì)內(nèi)容進(jìn)行深度開發(fā),增強(qiáng)內(nèi)容的權(quán)威性、真實(shí)性、全面性和客觀性,以引導(dǎo)理性閱讀,促進(jìn)深度閱讀。
目前出版單位在資源管理上仍然主要采用手工操作模式,圖書排版完成后,出版單位將排版文檔備份,或者刻錄光盤或者存儲(chǔ)于移動(dòng)硬盤。這種模式的資源管理效率有限,存在兩個(gè)弊端。一是如果文檔損壞很難及時(shí)發(fā)現(xiàn)?,F(xiàn)有的電子存儲(chǔ)設(shè)備受環(huán)境影響較大,容易損壞,且不易發(fā)現(xiàn)。由于多數(shù)圖書重印率較低,重印間隔時(shí)間較長,因存儲(chǔ)設(shè)備損壞導(dǎo)致備份文檔損壞往往較難及時(shí)發(fā)現(xiàn)。二是備份文檔的準(zhǔn)確性無法保證。圖書進(jìn)入付印階段以后,仍有可能修改,比如對(duì)于付印樣上個(gè)別字詞的小改動(dòng),編輯往往委托印刷廠直接替換修改頁面,因此保留在出版單位的文檔常常還存在錯(cuò)誤。這兩種情況都可能導(dǎo)致資源質(zhì)量無法保證,影響今后新型出版業(yè)務(wù)的開展。
鑒于當(dāng)前出版資源整合中存在的諸多問題,上海世紀(jì)出版集團(tuán)(簡(jiǎn)稱“世紀(jì)集團(tuán)”)在2022 年年初開展出版資源整合項(xiàng)目的試點(diǎn)工作,以“一次采集、多種生成、多次利用”為整合原則,具體實(shí)施由下屬上海數(shù)字世紀(jì)網(wǎng)絡(luò)有限公司(簡(jiǎn)稱“世紀(jì)網(wǎng)絡(luò)公司”)牽頭,下屬出版單位分工合作,密切配合。試點(diǎn)期間,以上??茖W(xué)技術(shù)出版社作為試點(diǎn)對(duì)象,對(duì)出版資源流轉(zhuǎn)過程中各個(gè)環(huán)節(jié)的流程進(jìn)行優(yōu)化,規(guī)范完善各類數(shù)據(jù)。在此基礎(chǔ)上,世紀(jì)集團(tuán)以滿足融合出版的各種業(yè)務(wù)需求為目標(biāo),擴(kuò)大出版資源采集對(duì)象,涵蓋所有類型的數(shù)據(jù)和文檔;實(shí)現(xiàn)出版資源的有效組織,通過多樣化的標(biāo)引建立資源之間的關(guān)聯(lián)關(guān)系;發(fā)展出版資源的多種利用方式,例如數(shù)據(jù)接口同步、資源下載、定制瀏覽等。
在上海科學(xué)技術(shù)出版社試驗(yàn)成功的基礎(chǔ)上,試點(diǎn)對(duì)象擴(kuò)大到上海譯文出版社和上海音樂出版社。這三家出版單位的情況基本可以代表世紀(jì)集團(tuán)下屬出版單位資源整合的類型:上??茖W(xué)技術(shù)出版社部署了獨(dú)立的方正云舒書報(bào)刊制作平臺(tái)(簡(jiǎn)稱“云舒平臺(tái)”),可以滿足項(xiàng)目實(shí)施前期對(duì)圖書內(nèi)容資源的需求,但沒有使用企業(yè)資源規(guī)劃(enterprise resource planning,英文縮寫ERP)管理系統(tǒng),無法滿足項(xiàng)目實(shí)施前期對(duì)數(shù)據(jù)資源的共享需求;上海譯文出版社有獨(dú)立部署的ERP 管理系統(tǒng),但沒有獨(dú)立的云舒平臺(tái);上海音樂出版社則兩者都沒有,需要借助世紀(jì)集團(tuán)的云舒平臺(tái)和方正智匯知識(shí)服務(wù)系統(tǒng)(簡(jiǎn)稱“智匯系統(tǒng)”)。
考慮到有一些管理系統(tǒng)軟件,世紀(jì)集團(tuán)下屬出版單位已經(jīng)使用多年,項(xiàng)目實(shí)施圍繞智匯系統(tǒng)展開部署,兼顧云舒平臺(tái)、ERP 管理系統(tǒng)、復(fù)旦天翼信息管理系統(tǒng)及其他管理系統(tǒng)和軟件,以減少整合過程中可能存在的阻力,加快出版資源整合速度。該項(xiàng)目的實(shí)施,既包括下屬出版單位現(xiàn)有系統(tǒng)數(shù)據(jù)的同步與操作流程的優(yōu)化,又包括資源規(guī)范、資源組織以及資源利用等的創(chuàng)新。通過世紀(jì)網(wǎng)絡(luò)公司與世紀(jì)集團(tuán)三家下屬出版單位反復(fù)試驗(yàn),形成了較完整的項(xiàng)目實(shí)施方案,為2023年集團(tuán)出版資源全面整合奠定了扎實(shí)基礎(chǔ)。
根據(jù)世紀(jì)集團(tuán)下屬出版單位已有出版資源的管理方式,整合的資源分為數(shù)據(jù)和文檔兩類,前者分散存儲(chǔ)在ERP 管理系統(tǒng)與復(fù)旦天翼信息管理系統(tǒng),后者大部分存儲(chǔ)于移動(dòng)硬盤,少量存儲(chǔ)于各種資源管理系統(tǒng)或云舒平臺(tái)?;谠摤F(xiàn)狀,世紀(jì)集團(tuán)將整個(gè)項(xiàng)目實(shí)施過程分為資源采集、規(guī)范建立、流程優(yōu)化與資源組織四個(gè)環(huán)節(jié),以融合出版的平臺(tái)化發(fā)展趨勢(shì)為導(dǎo)向,[3]構(gòu)建完整的出版資源利用與管理體系。
數(shù)據(jù)和文檔的劃分以出版資源的結(jié)構(gòu)化為標(biāo)準(zhǔn)。前者以數(shù)字形式表現(xiàn),是能夠進(jìn)行數(shù)學(xué)運(yùn)算的數(shù)值,即狹義數(shù)據(jù)。后者指用于記錄、表達(dá)和傳遞信息的載體,包括文本、圖像以及音視頻等多種形式。出版資源中的數(shù)據(jù)主要包括元數(shù)據(jù)、生產(chǎn)數(shù)據(jù)和經(jīng)營數(shù)據(jù)三類。元數(shù)據(jù)主要用于對(duì)圖書唯一標(biāo)識(shí),描述圖書的主要特征;生產(chǎn)數(shù)據(jù)發(fā)生在印制領(lǐng)域,反映生產(chǎn)環(huán)節(jié)的成本、規(guī)格和材料等;經(jīng)營數(shù)據(jù)發(fā)生在銷售領(lǐng)域,反映出版單位經(jīng)營績效。出版資源中的文檔包括所有與圖書內(nèi)容相關(guān)的文件,例如不同格式的電子文檔、應(yīng)用程序、音視頻等。
根據(jù)出版資源的上述分類,世紀(jì)集團(tuán)最終確定資源整合的范圍涵蓋整個(gè)出版流程(包括紙質(zhì)圖書出版和數(shù)字出版)中產(chǎn)生的所有數(shù)據(jù)和文檔。經(jīng)過對(duì)世紀(jì)集團(tuán)下屬出版單位和電商平臺(tái)的調(diào)研,元數(shù)據(jù)確定為40 個(gè)元素,包括CIP 數(shù)據(jù)、書刊輔文和文獻(xiàn)標(biāo)引等,涵蓋圖書的實(shí)物、內(nèi)容和版權(quán)的所有信息特征;生產(chǎn)數(shù)據(jù)確定為20 個(gè)元素,包括實(shí)物生產(chǎn)的物料、規(guī)格、成本以及電子書加工費(fèi)用等,基本覆蓋生產(chǎn)環(huán)節(jié)的所有流程;經(jīng)營數(shù)據(jù)確定為30 個(gè)元素,包括發(fā)貨冊(cè)數(shù)、發(fā)行折扣、退貨冊(cè)數(shù)以及回款金額等,基本覆蓋紙質(zhì)圖書和電子書的所有流通過程。
根據(jù)出版資源的產(chǎn)生過程,采用兩種采集方式,一種為人工錄入(上傳),一種為數(shù)據(jù)接口。人工錄入主要針對(duì)初始數(shù)據(jù)(例如圖書元數(shù)據(jù)),由數(shù)據(jù)產(chǎn)生的部門直接在智匯系統(tǒng)錄入。數(shù)據(jù)接口針對(duì)跨平臺(tái)或者跨系統(tǒng)的數(shù)據(jù),實(shí)現(xiàn)不同平臺(tái)或者系統(tǒng)數(shù)據(jù)的同步更新。集團(tuán)根據(jù)下屬出版單位現(xiàn)有工具軟件的實(shí)際使用情況,設(shè)計(jì)開發(fā)數(shù)據(jù)接口,不同平臺(tái)或系統(tǒng)間的數(shù)據(jù)交換采用“國際標(biāo)準(zhǔn)書號(hào)(International Standard Book Number ,英文簡(jiǎn)稱ISBN)+印次”作為傳輸字段,通過這個(gè)唯一的字段值確保數(shù)據(jù)的成功同步。數(shù)據(jù)接口有智匯系統(tǒng)與云舒平臺(tái)之間的傳輸接口,以實(shí)現(xiàn)部分圖書元數(shù)據(jù)與PDF 文檔的傳輸,以及智匯系統(tǒng)與ERP 管理系統(tǒng)或者復(fù)旦天翼信息管理系統(tǒng)的傳輸接口,以同步生產(chǎn)、經(jīng)營數(shù)據(jù)。
規(guī)范是出版資源整合中最重要的問題,也是出版資源多次開發(fā)利用的前提和基礎(chǔ)。出版資源的規(guī)范化有助于提高資源一致性和完整性,節(jié)約存儲(chǔ)空間,提高檢索效率。[4]因此在項(xiàng)目的實(shí)施過程中,世紀(jì)集團(tuán)建立并完善了元數(shù)據(jù)規(guī)范、圖書輔文規(guī)范、文檔規(guī)范以及標(biāo)引規(guī)范等。
(1)完善元數(shù)據(jù)規(guī)范,準(zhǔn)確描述圖書特征
元數(shù)據(jù)指對(duì)信息資源進(jìn)行描述、解釋或使信息資源更易于被檢索、利用及管理的結(jié)構(gòu)化信息,通過它可以準(zhǔn)確唯一地指向元數(shù)據(jù)所描述的作品或者對(duì)象。[5]162完整的元數(shù)據(jù)信息能夠唯一標(biāo)識(shí)圖書,方便查詢,促進(jìn)數(shù)據(jù)交換與處理,提高資源管理開發(fā)效率,也便于資源的長期保存。[5]163-165在項(xiàng)目實(shí)施過程中,世紀(jì)集團(tuán)一方面對(duì)下屬出版單位現(xiàn)有元數(shù)據(jù)元素進(jìn)行大力擴(kuò)充,增加出版單位子部門、讀者對(duì)象、漢語詞表主題詞、普通關(guān)鍵詞、學(xué)科關(guān)鍵詞、上架建議以及CIP 核字號(hào)等元數(shù)據(jù),以便更準(zhǔn)確地描述圖書特征。另一方面對(duì)于部分沒有應(yīng)用價(jià)值的元數(shù)據(jù)元素進(jìn)行優(yōu)化,例如取消圖書種次號(hào),既提高了ISBN 自動(dòng)驗(yàn)證的準(zhǔn)確性,又便于跨平臺(tái)的數(shù)據(jù)傳輸。
(2)調(diào)整圖書輔文規(guī)范,服務(wù)更多場(chǎng)景
圖書輔文指圖書正文的輔助文字,其功能在于指導(dǎo)購買和閱讀,方便圖書檢索等,[6]包括目錄、序跋、凡例、注釋、附錄、作者介紹、內(nèi)容簡(jiǎn)介、參考文獻(xiàn)、后記、索引以及編輯推薦語等。按照?qǐng)D書輔文的主要功能,可以將其分為識(shí)別性、介紹性、說明性、檢索性以及參考性輔文等。[7]出版單位通常將圖書輔文信息與元數(shù)據(jù)合并處理,這種做法的好處是能夠提高采集效率,但是利用場(chǎng)景僅限于圖書介紹,無法發(fā)揮更大作用。隨著融合出版的發(fā)展,圖書輔文的作用進(jìn)一步增強(qiáng),例如通過知識(shí)關(guān)聯(lián)可建立更加完善的圖書導(dǎo)航與推薦系統(tǒng),為讀者提供更多的圖書內(nèi)容比較以輔助購買決策等。世紀(jì)集團(tuán)采取了根據(jù)圖書輔文的類型分別確定規(guī)范。識(shí)別性輔文(例如書名、作者、書號(hào)、定價(jià)等)多數(shù)已經(jīng)包含在元數(shù)據(jù)中,參考性輔文中的注釋一般與正文排版在一起,這些圖書輔文無需處理。其他類型的圖書輔文均按照其種類采集,例如“圖書前言”“編寫說明”“后記”等。
(3)確立文檔規(guī)范,方便多次加工
圖書電子文檔的類型主要有PDF、XML和ePub 等,其中PDF 文檔又分為高精度和低精度兩種,高精度PDF 文檔用途以印刷和內(nèi)容深加工為主,低精度PDF 文檔用途以電子書加工和試讀樣張抽取為主。XML 文檔利用XML 標(biāo)識(shí)語言描述電子書內(nèi)容。ePub 文檔主要以XML 文檔為內(nèi)核,能夠根據(jù)閱讀終端設(shè)備自適應(yīng)排版和呈現(xiàn)數(shù)字內(nèi)容。融合出版產(chǎn)品的應(yīng)用場(chǎng)景豐富,每個(gè)圖書文檔都可能根據(jù)不同的應(yīng)用場(chǎng)景重新加工,例如結(jié)構(gòu)化處理、多媒體加工或者內(nèi)容重組等。由于XML格式文檔要求與ePub 格式文檔基本相同,因此項(xiàng)目實(shí)施過程中的文檔規(guī)范主要針對(duì)ePub格式和PDF 格式文檔制定,適應(yīng)不同場(chǎng)景的文檔再加工以這兩種格式文檔為基礎(chǔ)。ePub格式文檔綜合差錯(cuò)率符合圖書質(zhì)量標(biāo)準(zhǔn),目錄鏈接跳轉(zhuǎn)正確,圖表符合排版規(guī)范,腳注、篇后注和書后注等鏈接跳轉(zhuǎn)準(zhǔn)確等;PDF 文檔要求部件完整、支持檢索與復(fù)制、書簽準(zhǔn)確跳轉(zhuǎn)等。
(4)建立內(nèi)容標(biāo)引規(guī)范,打造個(gè)性化知識(shí)體系
標(biāo)引是分類和關(guān)聯(lián)的基礎(chǔ),[8]目的在于揭示內(nèi)容特征,集中同類內(nèi)容,區(qū)分不同內(nèi)容,為相關(guān)內(nèi)容建立聯(lián)系。[9]世紀(jì)集團(tuán)將標(biāo)引分為元數(shù)據(jù)標(biāo)引、知識(shí)標(biāo)引和版權(quán)信息標(biāo)引。其中元數(shù)據(jù)標(biāo)引在元數(shù)據(jù)錄入過程中自動(dòng)生成,規(guī)范與元數(shù)據(jù)錄入規(guī)范一致。知識(shí)標(biāo)引分為主題詞標(biāo)引、關(guān)鍵詞標(biāo)引和知識(shí)元標(biāo)引,主題詞標(biāo)引著眼于檢索,關(guān)鍵詞標(biāo)引側(cè)重表達(dá)文獻(xiàn)主題,知識(shí)元標(biāo)引系對(duì)主題詞進(jìn)行管理。版權(quán)信息標(biāo)引可反映作品的版權(quán)信息,包括權(quán)利人、許可方式、權(quán)利項(xiàng)、授權(quán)地區(qū)以及語種等。根據(jù)知識(shí)標(biāo)引和版權(quán)信息標(biāo)引的特征,擬定相應(yīng)的規(guī)范。知識(shí)標(biāo)引規(guī)范要求主題詞準(zhǔn)確表達(dá)概念含義,能被人們普遍接受;關(guān)鍵詞遵從《學(xué)術(shù)出版規(guī)范 關(guān)鍵詞編寫規(guī)則》(CY/T 173—2019),能夠準(zhǔn)確并充分揭示主題內(nèi)容,避免遺漏重要的可檢索內(nèi)容;知識(shí)元分類準(zhǔn)確,能夠反映所屬類別的特征和屬性。版權(quán)信息標(biāo)引要求服從融合出版需要,以便作品的多元化利用。
流程優(yōu)化的目的在于簡(jiǎn)化部門之間的溝通,消除冗余環(huán)節(jié);提高工作質(zhì)量,確保規(guī)范的準(zhǔn)確執(zhí)行;降低時(shí)間與人力成本,提高出版單位整體運(yùn)營效率。世紀(jì)集團(tuán)結(jié)合下屬出版單位原有流程與智匯系統(tǒng)操作規(guī)范,建立并完善了數(shù)據(jù)采集流程、文檔采集流程以及資源管理流程等,確保出版資源整合科學(xué)、高效、合理。
(1)數(shù)據(jù)采集流程
數(shù)據(jù)采集流程涵蓋圖書信息從產(chǎn)生到完成的每一個(gè)環(huán)節(jié),是項(xiàng)目實(shí)施過程中最復(fù)雜、參與角色最多的流程,所以流程設(shè)計(jì)中一方面要堅(jiān)持全局優(yōu)化、減少審批的原則,另一方面要堅(jiān)持流程節(jié)點(diǎn)之間的制約和監(jiān)督,確保數(shù)據(jù)的準(zhǔn)確與安全。在實(shí)際操作過程中,還要盡可能減少人工干預(yù)。整個(gè)數(shù)據(jù)采集流程包括采集、審核和發(fā)布三個(gè)節(jié)點(diǎn)。數(shù)據(jù)采集前置至出版單位的編輯部門,即編輯直接在智匯系統(tǒng)根據(jù)元數(shù)據(jù)和圖書輔文規(guī)范完成。數(shù)據(jù)審核和發(fā)布由世紀(jì)網(wǎng)絡(luò)公司完成,堅(jiān)持“日落法則”(當(dāng)日事當(dāng)日完成),[10]確保當(dāng)日產(chǎn)生的數(shù)據(jù)當(dāng)日完成審核和發(fā)布。數(shù)據(jù)采集流程優(yōu)化后,數(shù)據(jù)采集效率大幅度提升,推動(dòng)營銷活動(dòng)前置,產(chǎn)品尚未入庫就可開始相關(guān)的營銷活動(dòng),有利于實(shí)現(xiàn)產(chǎn)品上市與銷售推廣的最佳組合,提高占據(jù)市場(chǎng)的效率。[11]
(2)文檔采集流程
文檔采集流程從付印清樣完成后開始。此時(shí)書稿已經(jīng)完成三審三校,內(nèi)容出錯(cuò)可能性較低,修改次數(shù)和范圍有限,因此文檔采集流程設(shè)計(jì)的重點(diǎn)在于一要確保付印文檔屬于最終稿,二要確保適應(yīng)不同場(chǎng)景需求的文檔,例如ePub 文檔、封面或者XML 文檔等,應(yīng)收盡收?;诖耍陧?xiàng)目實(shí)施過程中,文檔采集流程設(shè)計(jì)三個(gè)環(huán)節(jié),即上傳、同步和再加工。上傳由排版公司與世紀(jì)網(wǎng)絡(luò)公司承擔(dān):排版公司在制作高精度PDF 文檔的同時(shí),制作書簽,之后將其與自動(dòng)生成的低精度PDF 文檔、四封文件(即封面、書脊、勒口與封底)上傳至云舒平臺(tái)(供印刷使用);世紀(jì)網(wǎng)絡(luò)公司負(fù)責(zé)適應(yīng)不同場(chǎng)景需求的文檔的上傳。同步通過云舒平臺(tái)與智匯系統(tǒng)之間的數(shù)據(jù)接口自動(dòng)實(shí)現(xiàn)。再加工由世紀(jì)網(wǎng)絡(luò)公司直接操作或者委托外包公司完成。
(3)資源管理流程
資源管理流程分為權(quán)限管理和使用審核兩部分。權(quán)限管理圍繞角色展開,角色根據(jù)系統(tǒng)工作流程中的環(huán)節(jié)設(shè)置,每個(gè)角色設(shè)置定制化的權(quán)限,根據(jù)職能分工分配給不同用戶,一個(gè)用戶可以分配一個(gè)角色,也可以分配多個(gè)角色。通過角色定制,限制了用戶對(duì)系統(tǒng)的使用范圍,確保了系統(tǒng)使用和管理的安全性。權(quán)限包括平臺(tái)級(jí)和應(yīng)用級(jí)權(quán)限。前者針對(duì)角色權(quán)限配置,后者針對(duì)具體操作配置。使用審核根據(jù)權(quán)限制約原則和職能分工設(shè)置,不同角色各司其職,彼此制約,保證資源采集的規(guī)范性、準(zhǔn)確性和資源利用的安全性。例如,采集角色和審核角色分離,采集階段有誤,審核角色馬上可以糾正;下載角色和審批角色分置,超范圍文檔(如高精度PDF)下載,審批角色可以及時(shí)阻止。
出版資源的組織在某種程度上也可以看作一種知識(shí)關(guān)聯(lián)。圍繞圖書內(nèi)容,將不同的圖書形態(tài)(文本、音頻以及視頻等)、周邊內(nèi)容(新聞、評(píng)論、自媒體內(nèi)容以及考試資源等)以及其他有知識(shí)關(guān)聯(lián)的圖書按照一定規(guī)則組織,形成比較完整的知識(shí)體系,實(shí)現(xiàn)一書一檔,即由一本書可以找到所有與其相關(guān)的資源。這樣既有利于出版資源的有效管理,也便于開發(fā)增值服務(wù),提高知識(shí)轉(zhuǎn)化效率。[12]實(shí)施過程采用兩種管理方式,一是分類,二是關(guān)聯(lián)設(shè)置。
根據(jù)世紀(jì)集團(tuán)現(xiàn)有出版資源,采取多種分類方式。①按照表現(xiàn)形式分類,例如圖書、期刊、自媒體、其他等;②按照內(nèi)容主題分類,例如中圖法分類、論著分類、知識(shí)點(diǎn)分類等;③按照所屬部門分類,例如國際編輯部、哲學(xué)社科編輯部等;④按照內(nèi)容形式分類,例如文本、音頻、視頻、圖片、多媒體等;⑤按照關(guān)鍵詞分類,例如知識(shí)關(guān)聯(lián)、融合出版、工藝技法等;⑥按照資源格式分類,例如word、txt、XML、PDF、ePub 等。多種分類方式可從不同維度呈現(xiàn)資源的屬性。
關(guān)聯(lián)設(shè)置采取手動(dòng)關(guān)聯(lián)和自動(dòng)關(guān)聯(lián)兩種方法。手動(dòng)關(guān)聯(lián)可以在資源采集過程中操作,也可以在資源發(fā)布后操作,還可以由不同角色操作。這樣既有助于資源的增加與更新,隨時(shí)發(fā)現(xiàn)隨時(shí)采集,也可以通過不同視角發(fā)現(xiàn)更多有價(jià)值的資源。自動(dòng)關(guān)聯(lián)通過知識(shí)標(biāo)引的匹配實(shí)現(xiàn),例如對(duì)比關(guān)鍵詞和主題詞在不同作品中出現(xiàn)的次數(shù),判斷它們之間可能存在的關(guān)聯(lián)關(guān)系與關(guān)聯(lián)強(qiáng)度。[13]關(guān)聯(lián)設(shè)置一方面有利于通過關(guān)聯(lián)的定位與導(dǎo)航作用,提高出版物推薦的精準(zhǔn)程度,另一方面有利于編輯從中發(fā)現(xiàn)新的選題。
囿于世紀(jì)集團(tuán)自身?xiàng)l件和現(xiàn)有資源,此次出版資源整合方案主要針對(duì)內(nèi)部現(xiàn)有圖書資源,作用局限于營銷支持、決策參考和融合出版的部分功能,還存在社會(huì)資源整合不足、結(jié)構(gòu)化加工欠缺等問題,未能完全滿足融合出版的需求。
從融合出版發(fā)展的趨勢(shì)來看,社會(huì)資源的整合和圖書碎片化內(nèi)容的處理一樣具有極大的應(yīng)用價(jià)值。圖書相關(guān)的社會(huì)資源包括各種新聞資訊、自媒體作品、圖書評(píng)論、選題資源、旅游文化資源、歷史文化資源以及現(xiàn)實(shí)的社會(huì)文化資源。通過大數(shù)據(jù)技術(shù)對(duì)這些資源的分析,能夠?yàn)槿诤铣霭娴陌l(fā)展提供更大助力。一是有助于判斷社會(huì)關(guān)注的熱點(diǎn)、專業(yè)領(lǐng)域的發(fā)展趨勢(shì)和先進(jìn)成果,及時(shí)發(fā)現(xiàn)新的選題線索,搶占市場(chǎng)先機(jī);二是有助于判斷出版物的市場(chǎng)潛力,降低經(jīng)營風(fēng)險(xiǎn);三是發(fā)現(xiàn)營銷過程中的社會(huì)反饋,例如產(chǎn)品問題、內(nèi)容爭(zhēng)議或者作品侵權(quán)等。世紀(jì)集團(tuán)此次出版資源整合未納入社會(huì)資源,今后有必要對(duì)社會(huì)資源進(jìn)行結(jié)構(gòu)化處理,與現(xiàn)有出版資源建立多種知識(shí)關(guān)聯(lián)關(guān)系。
所謂結(jié)構(gòu)化加工指利用技術(shù)手段揭示和描述內(nèi)容資源的體例結(jié)構(gòu)和屬性。圖書的結(jié)構(gòu)化加工簡(jiǎn)單理解就是拆分篇章節(jié),提取不同層級(jí)的屬性元數(shù)據(jù),揭示內(nèi)容的結(jié)構(gòu)和組織方式。[14]結(jié)構(gòu)化加工后的數(shù)據(jù)能夠支持各種場(chǎng)景下的內(nèi)容應(yīng)用服務(wù),有助于提高來自搜索引擎的訪問量,有助于數(shù)字內(nèi)容的多元化發(fā)布,還有助于通過內(nèi)容重組策劃新的選題。世紀(jì)集團(tuán)此次出版資源整合未涉足結(jié)構(gòu)化處理,未來可以考慮對(duì)圖書內(nèi)容進(jìn)行結(jié)構(gòu)化處理,在豐富智匯系統(tǒng)標(biāo)引工具的基礎(chǔ)上,通過知識(shí)關(guān)聯(lián)的構(gòu)建形成完整的知識(shí)體系。
資源采集效率低、內(nèi)部溝通成本高以及資源質(zhì)量難以保證等,是出版單位進(jìn)行出版資源整合存在的普遍問題。世紀(jì)集團(tuán)針對(duì)這幾個(gè)問題,結(jié)合下屬出版單位各類管理軟件系統(tǒng)使用現(xiàn)狀,圍繞智匯系統(tǒng)展開部署,改造原有流程,構(gòu)建了完整的出版資源利用與管理體系。這個(gè)體系既保證了資源的質(zhì)量,又提高了資源的利用效率,對(duì)國內(nèi)同行開展出版資源整合工作具有一定的參考價(jià)值。未來,世紀(jì)集團(tuán)將進(jìn)一步整合社會(huì)資源,對(duì)圖書內(nèi)容進(jìn)行結(jié)構(gòu)化處理,更好地滿足融合出版的需求。