【摘要】CNONIX 標準的建立,旨在為我國出版產業(yè)鏈上的出版商、發(fā)行商、數(shù)據(jù)集成商等各類機構提供標準的圖書信息交換格式,實現(xiàn)產業(yè)鏈上圖書信息的互聯(lián)互通,既可通過加速產品信息的流動,促進圖書產品的流通效率,又可通過產品信息一次制作、多方應用的方式,降低行業(yè)信息的應用成本,提高行業(yè)各機構的信息系統(tǒng)應用效率。文章以上海新華傳媒為例,探索CNONIX在新聞出版發(fā)行行業(yè)的應用。
【關鍵詞】CNONIX國家標準;服務平臺;上海新華傳媒
【作者單位】李列群,上海新華傳媒連鎖有限公司。
一、CNONIX(中國出版物在線信息交換)介紹
Online Information Exchange 的縮寫ONIX(在線信息交換),是一種以元數(shù)據(jù)描述圖書產品信息的數(shù)據(jù)交換協(xié)議。包括ONIX for Books(圖書在線信息交換)、ONIX for serials (連續(xù)出版物在線信息交換)、ONIX for Publications Licenses(出版許可在線信息交換)、Licensing Terms & Rights Information(許可條款和版權信息)等多項協(xié)議。該協(xié)議是1999年由美國出版者協(xié)會(AAP)提出并開發(fā)的一份產品信息交換協(xié)議,旨在讓各個出版者能以一致的格式發(fā)送豐富的產品元數(shù)據(jù)給零售商,特別是開展網上零售業(yè)務的電商。該協(xié)議主要解決圖書產品信息的在線交換問題。
在該協(xié)議中,圖書是個廣義的概念,包括單行本的圖書、電子出版物、系列書、套書等。該標準由四個部分組成:ONIX代碼表、ONIX概述和數(shù)據(jù)元素目錄、ONIX產品信息記錄格式、ONIX XML信息交換規(guī)則。它提供了圖書產品全面、準確、網絡化、數(shù)字化、動態(tài)描述、維護和交換規(guī)范信息,能使圖書產品信息和供應信息整合在一個平臺,滿足書業(yè)對信息共享和供應鏈管理的需求。
2014年,經中國國家標準化管理委員會頒布的《中國出版物在線信息交換(CNONIX)》國家標準采用了ONIX for Books的元數(shù)據(jù)描述體系和結構。CNONIX標準基于XML語言進行描述。CNONIX 標準的建立,旨在為我國出版產業(yè)鏈上的出版商、發(fā)行商、數(shù)據(jù)集成商等各類機構提供標準的圖書信息交換格式,實現(xiàn)產業(yè)鏈上圖書信息的互聯(lián)互通,既可通過加速產品信息的流動,促進圖書產品的流通效率,又可通過產品信息一次制作、多方應用的方式,降低行業(yè)信息的應用成本,提高行業(yè)各機構的信息系統(tǒng)應用效率。
2014年,國家新聞出版廣電總局同財政部一起將CNONIX國家標準應用示范工作納入文化產業(yè)發(fā)展資金的扶持范圍,通過項目資金的支持,帶動行業(yè)各單位積極實施CNONIX國家標準。目前,已有12家示范單位的13個CNONIX應用項目獲得財政支持,7家單位的CNONIX項目被納入國家新聞出版廣電總局的改革發(fā)展項目庫,22家出版單位、發(fā)行單位、圖書館、研究機構等成為應用示范單位。
二、CNONIX在新聞出版發(fā)行行業(yè)中的應用
上海新華傳媒作為22家示范單位的一員,正努力探索CNONIX在新聞出版發(fā)行行業(yè)的應用。
之前,由于圖書產品信息的標準不統(tǒng)一,上海新華傳媒實施的ERP圖書書目信息數(shù)據(jù)來源分散、格式多樣,有來自B2B出版社提供的書目信息,有ERP補錄的數(shù)據(jù),有館配的圖書征訂信息,有大學教材的征訂信息,有MARK/CALIS數(shù)據(jù)等,形成了各種信息相互獨立的系統(tǒng)孤島。在數(shù)據(jù)規(guī)范化上,由于各種原因,ERP的產品重復信息達到了幾萬條,不完整和不規(guī)范的數(shù)據(jù)充斥在標準的數(shù)據(jù)中,成為信息系統(tǒng)的負擔甚至是垃圾。同時,上海新華傳媒的一城書集等線上業(yè)務也在逐步發(fā)展,需要標準化并符合網上銷售特點的產品信息。因此,圖書產品信息的標準化和規(guī)范化已成為上海新華傳媒圖書業(yè)務整體發(fā)展的技術關鍵。上海新華傳媒在CNONIX標準實施中充分考慮CNONIX國家標準的落地,在貫徹CNONIX國標的企業(yè)信息系統(tǒng)建設中,計劃在以下幾方面嘗試具體應用。
1.構建企業(yè)的CNONIX云服務平臺
總體建設框圖如(圖1):
企業(yè)CNONIX云服務平臺是企業(yè)內的服務平臺,行業(yè)CNONIX數(shù)據(jù)服務平臺上接原新聞出版總署信息中心的出版發(fā)行信息公共服務平臺,共享和下載使用行業(yè)的CNONIX元數(shù)據(jù)內容;下接企業(yè)和各個業(yè)務信息系統(tǒng),是企業(yè)連接和共享行業(yè)CNONIX元數(shù)據(jù)內容的通道和橋梁。同時,平臺提供錄入、采集、整理、加工基于CNONIX標準圖書產品信息的元數(shù)據(jù)內容工具,為圖書出版發(fā)行行業(yè)建立符合CNONIX標準的圖書書目信息服務。
無論是在戶內環(huán)境下,還是在“云”里,我們認為,一個應用平臺應包含以下三個部分。
一個基礎:幾乎所有應用平臺都會用到一些在機器上運行的平臺軟件。它們的各種支撐功能(如標準的庫與存儲,以及基本操作系統(tǒng)等)均屬此部分。
一組基礎設施服務:在現(xiàn)代分布式環(huán)境中,應用平臺經常要用到由其他計算機提供的基本服務。比如遠程存儲服務、集成服務及身份管理服務等。
一套應用服務:隨著越來越多的應用平臺面向服務化,這些平臺提供的功能可為新應用所使用。盡管這些新應用主要是為最終用戶提供服務的,但這同時也令它們成為應用平臺的一部分。
云平臺是由搭載了云平臺服務器端軟件的云服務器、搭載了云平臺客戶端軟件的云電腦以及網絡組件所構成的,用于提高低配置或老舊計算機的綜合性能,使其達到現(xiàn)有流行速度的效果。
彈性虛擬計算:根據(jù)企業(yè)不斷變化的組織架構、管控模式和業(yè)務需求,云平臺能為企業(yè)云應用服務快速提供動態(tài)、靈活、彈性、虛 擬、共享和高效的計算資源服務。
智能監(jiān)控運維:云平臺能實現(xiàn)對計算資源、存儲資源、網絡資源、云應用服務7×24小時全時區(qū)、多地域、全方位、立體式、智能化的IT運維監(jiān)控,保障IT系統(tǒng)安全、穩(wěn)定、可靠運行。
云服務平臺中數(shù)據(jù)服務包括錄入、采集、整理、加工基于CNONIX標準的圖書產品信息元數(shù)據(jù)內容工具。而系統(tǒng)具有以下功能。
(1)具有CNONIX數(shù)據(jù)的錄入加工功能
(2)具有CNONIX數(shù)據(jù)的校對功能和有效性檢查功能
(3)具有數(shù)據(jù)向CNONIX的轉檔功能
(4)具有數(shù)據(jù)安全性保護和備份功能
(5)具有多級用戶管理功能
上海新華傳媒在CNONIX云平臺的建設上,采用了目前先進的高性能和高可用構架的數(shù)據(jù)分析系統(tǒng),運用Hadoop分布式數(shù)據(jù)庫、Spark集群計算環(huán)境和Nginx輕量級的Web服務器/反向代理服務器。此外,其還使用zabbix實現(xiàn)了對系統(tǒng)和網絡的有效監(jiān)控。
2.CNONIX標準數(shù)據(jù)采集、加工、轉換、交換、驗證的目標
書目CNONIX標準數(shù)據(jù)采集系統(tǒng)的建設目標是建立一套架構合理、功能齊全、運行穩(wěn)定的CNONIX標準數(shù)據(jù)加工系統(tǒng)。該系統(tǒng)除了應具備ERP原新書目補錄功能,還需要與企業(yè)內的ERP、WMS、Mark/Calis數(shù)據(jù),企業(yè)外的圖書供應商、圖書館等進行全面的無縫對接,滿足實時高效、安全穩(wěn)定的要求。系統(tǒng)需具備良好的可擴展性,同時能根據(jù)公司現(xiàn)有ERP系統(tǒng)的現(xiàn)實情況和對內對外的各種數(shù)據(jù)源整體制訂相應的流程。
書目數(shù)據(jù)的CNONIX數(shù)據(jù)轉換設計目標是實現(xiàn)書目數(shù)據(jù)按照中國出版物在線信息交換圖書產品信息格式規(guī)范(GB/T 30330-2013)的要求,實現(xiàn)標準CNONIX格式數(shù)據(jù)的輸出。數(shù)據(jù)交換的要求為建立相應的數(shù)據(jù)接口,高效安全地和上下游進行CNONIX標準數(shù)據(jù)的交換。數(shù)據(jù)驗證的要求為采集、加工、轉換、交換的數(shù)據(jù)符合國家CNONIX實驗室的驗證要求,并通過驗證。
3.探索拓展符合CNONIX標準的“數(shù)字出版物業(yè)務數(shù)據(jù)系統(tǒng)”建設
(1)搭建符合CNONIX標準的數(shù)字出版物數(shù)據(jù)庫。上海新華傳媒以已有的數(shù)字出版物中心書庫為基礎,結合CNONIX格式文件,增加數(shù)字圖書新的元數(shù)據(jù)字段,擴充原有中心書庫數(shù)據(jù)的圖書記錄信息。主要數(shù)字圖書相關的擴充信息包括:數(shù)字產品技術保護;數(shù)字產品使用限制;數(shù)字產品使用類型(預覽、印制、復制/粘貼、共享、文本朗讀、借出);數(shù)字產品使用狀態(tài);數(shù)字產品使用限度(復合元素)(無限許可、有限許可、禁止使用);數(shù)字產品數(shù)量;數(shù)字產品使用單位(份數(shù)、字符數(shù)、單詞數(shù)、頁數(shù)、百分比、設備量、并發(fā)用戶、不同時間段的內容百分比、天數(shù)、次數(shù))等。其他一些非數(shù)字圖書相關的元數(shù)據(jù)將同時建立,以便我們未來可以根據(jù)數(shù)字書號直接查詢到對應紙質書籍相關的圖書信息。此模塊搭建完成后,出版社可直接在平臺中按照CNONIX標準填入數(shù)字圖書相關信息數(shù)據(jù)。
(2)調整現(xiàn)有系統(tǒng)及流程,以滿足新標準數(shù)據(jù)的錄入和轉出。為了滿足符合CNONIX數(shù)據(jù)格式標準的需求,公司原有的轉檔流程以及相關系統(tǒng)將升級改造。對于一些數(shù)字產品需要輸入的字段,我們將開發(fā)新的輸入程式以供轉檔人員在轉檔環(huán)節(jié)增加錄入。如未來CNONIX的云服務平臺搭建完成后,一些圖書的基本信息(如作者、書名、簡介等)不再需要通過掃描電子書后獲取,而是直接由接口訪問CNONIX云服務平臺,根據(jù)數(shù)字圖書的唯一編號獲取可訪問信息后下載使用,如此,不僅減少了掃描過程中數(shù)據(jù)的錯誤率,而且極大地提升了轉檔效率。
對企業(yè)已有的數(shù)字圖書銷售數(shù)據(jù)以及各閱讀器所采集的用戶閱讀行為數(shù)據(jù),我們也將開發(fā)新系統(tǒng),將數(shù)據(jù)整合后導入本地CNONIX數(shù)據(jù)庫,再由上傳接口上傳到企業(yè)CNONIX云服務平臺,達到和紙質書結合分析統(tǒng)計的目的。
在CNONIX標準下,我們計劃搭建企業(yè)內的數(shù)據(jù)服務云平臺的數(shù)據(jù)接口,從而實現(xiàn)數(shù)字圖書的完整數(shù)據(jù)統(tǒng)計目標。接口部分將采用Microsoft .NET框架建立跨平臺的Web Service服務,將數(shù)據(jù)格式轉成標準的XML格式加密傳遞。平臺接口搭建完成后,只需將標準的格式化數(shù)據(jù)提供給企業(yè)內部的數(shù)據(jù)服務云平臺即可,例如ISBN編號、圖書定價等。
4.CNONIX將應用在圖書行業(yè)數(shù)據(jù)分析系統(tǒng)中
統(tǒng)一、標準的元數(shù)據(jù)有利于出版發(fā)行行業(yè)的大數(shù)據(jù)分析。CNONIX標準的推廣應用,給出版發(fā)行行業(yè)一個良好的契機來推動本行業(yè)的大數(shù)據(jù)發(fā)展。上海新華傳媒的云服務平臺將利用大數(shù)據(jù)技術定期提供包含出版數(shù)據(jù)、流通(零售)數(shù)據(jù)、數(shù)字圖書館閱讀數(shù)據(jù)的分析和研究。為出版發(fā)行的大數(shù)據(jù)分析開發(fā)出更加智能化的行業(yè)大數(shù)據(jù)平臺,實時提供包括購買行為分析平臺、閱讀行為分析平臺、預測模型建立等,成為專業(yè)型大數(shù)據(jù)庫。通過大數(shù)據(jù)分析,我們可以為行業(yè)和政府管理部門定期提供以下報告。
(1)圖書市場監(jiān)測報告
(2)圖書監(jiān)測銷量排行
(3)書店采購指南
(4)出版社/集團報告
(5)區(qū)域市場分析報告
(6)數(shù)字圖書閱讀分析報告
(7)圖書館讀者行為分析報告
通過以上報告,我們可以對行業(yè)進行大數(shù)據(jù)分析,包括出版的大數(shù)據(jù)、發(fā)行的大數(shù)據(jù)、零售的大數(shù)據(jù)等。
出版的大數(shù)據(jù),意味著出版已經不再是靠經驗和直覺,而是需要大量的數(shù)據(jù)支持。圖書在出版階段,包括策劃、編輯、營銷的各個過程中都需要相關云端數(shù)據(jù)的支持。企業(yè)利用已有的信息平臺,已匯集了300萬種圖書出版數(shù)據(jù),和自2004以來的25個省、自治區(qū)、直轄市1500多家大中型書店的零售數(shù)據(jù),以及數(shù)字圖書的大量圖書館借閱原始數(shù)據(jù)。這個云平臺可以為出版社提供海量的信息,包括誰在看書、看什么書、年齡構成、特定圖書的歷史銷售、地區(qū)銷售差別、定價策略等。CNONIX標準的應用,使圖書出版數(shù)據(jù)、流通數(shù)據(jù)、借閱數(shù)據(jù)三個云數(shù)據(jù)庫標準統(tǒng)一、信息關聯(lián)更加方便。圖書數(shù)據(jù)CNONIX標準化將為出版大數(shù)據(jù)分析提供更加詳細的信息,例如參與者信息不僅包含作者信息,還會有前言、插圖、封面設計等各類相關內容。出版營銷也可以從粗放式轉向數(shù)字時代的精準營銷,做到有的放矢。
發(fā)行的大數(shù)據(jù),意味著發(fā)行工作已經不能簡單地依靠傳統(tǒng)經驗,而是“謀定而后動”,即分析相關圖書的歷史銷售數(shù)據(jù),圖書發(fā)行的數(shù)量、時機都將是科學的決策。交易中心云數(shù)據(jù)平臺提供的實時信息反饋,會及時修正發(fā)行策略,提供具體信息,包括及時增印、調整庫存、區(qū)域調整等,幫助發(fā)行真正做到“隨機應變”。
隨著圖書零售O2O模式的建立、圖書閱讀O2O模式的建立,交易中心采集的這些數(shù)據(jù)將更加及時、詳細。用戶的購書行為,包括什么時間、地點、出于什么目的而購買、同時買了什么、持續(xù)的購買行為等將建立更加詳細的購買行為數(shù)據(jù)。用戶的閱讀行為,包括什么時間,在哪兒,看了哪本書的哪一頁,甚至每一頁的停留時間等信息,我們都可通過大數(shù)據(jù)技術精準獲取。
我們的中心核心數(shù)據(jù)庫和分析系統(tǒng)的CNONIX也將擴容系統(tǒng),為出版發(fā)行的大數(shù)據(jù)分析開發(fā)出更加智能化的行業(yè)大數(shù)據(jù)平臺,包括購買行為分析平臺、閱讀行為分析平臺、預測模型建立等。通過系統(tǒng)集成,我們集合服務器、網絡、存儲硬件,使用商用數(shù)據(jù)庫軟件、系統(tǒng)中間件和自主開發(fā)的行業(yè)數(shù)據(jù)管理軟件,為行業(yè)提供高效有用的信息。
上海新華傳媒的CNONIX國家標準實施的整體目標是建成新華傳媒CNONIX云服務平臺數(shù)據(jù)中心和滬版圖書CNONIX標準書目的加工服務平臺。此外,我們還希望公司的圖書產品及相關信息的數(shù)據(jù)中心及服務平臺,通過數(shù)據(jù)清洗等技術手段,成為上海地區(qū)的CNONIX數(shù)據(jù)應用中心。