王勤
如何采用信息技術(shù)來提高工作效率、細化成書工藝指標、提升編輯質(zhì)量、縮短出版周期,是出版業(yè)普遍關(guān)心的問題?,F(xiàn)代大型工具書的編輯出版,特別是知識型的百科全書更是如此?!吨袊蟀倏迫珪?第二版)在編輯工作后期,特別是成書編輯階段所面臨的問題更多。如:全書體例的規(guī)范和統(tǒng)一、面對海量數(shù)據(jù)的情況下如何利用數(shù)字技術(shù)發(fā)現(xiàn)問題和解決問題、成書過程中專項檢查的工藝化過程控制、資料的全面核實、協(xié)同異步工作機制的建立、基于數(shù)據(jù)庫的底層環(huán)境建設(shè)等關(guān)鍵問題。
中國大百科全書出版社的領(lǐng)導層和決策層在全書編纂階段就率先認識到這一點,很早就啟動了具有自主知識產(chǎn)權(quán)的大型工具書數(shù)字編輯平臺的自主研發(fā)工作,并在《中國大百科全書》(第二版)的編輯出版工作中取得了以下幾項突破性成果。
一、提高工藝流程的并發(fā)率,利用信息技術(shù)提高工作效率
百科全書的成書過程環(huán)環(huán)相扣,步步關(guān)聯(lián)。如按編輯流程線性展開,一則工期長;二則在流程中,文稿和交換頻繁,文件流轉(zhuǎn)過程中發(fā)生的技術(shù)性故障和人為故障率大大提高。因此,如何利用信息管理技術(shù)和現(xiàn)代工藝學,在現(xiàn)有人力物力的條件下,科學管理,理性調(diào)度,最大限度有效提高工作效率,是百科全書成書過程中首先要解決的問題。
在系統(tǒng)設(shè)計中,首先按百科全書的傳統(tǒng)成書工藝細化了成書工藝的線性流程,并根據(jù)這個基本流程,以提高并發(fā)率,交叉率開始進行流程的優(yōu)化處理,從而使得整個編輯工藝流程的設(shè)計從原來傳統(tǒng)的時間線性操作變成最大可能的時間并發(fā)和工藝并發(fā),從而大大提高了工序的并發(fā)率,極大地提升了工作效率。
二、細化成書工藝指標,實現(xiàn)質(zhì)量控制
在努力提高成書工藝流程的并發(fā)率和有效性的同時,如何按照精細化管理目標的理念,細化工藝指標,是保障成書整體質(zhì)量的關(guān)鍵問題之一。項目組在編輯平臺的設(shè)計過程中,首創(chuàng)了基于工業(yè)化生產(chǎn)流程控制,精細化工藝管理的大型工具書成書編輯理念,在系統(tǒng)設(shè)計中首先考慮成書編輯過程如何按辭書出版工藝學原理,并利用系統(tǒng)工程設(shè)計思想及總署的圖書質(zhì)量保障體系,將百科編輯成書體例的每一項任務(wù),分解成最小的可單一執(zhí)行單元并使之具有可操作性。
百科全書成書體例的認真貫徹在執(zhí)行過程中存在的另一個問題,一是體系的描述過于原則;二是并非所有編輯人員都能深刻領(lǐng)會體例制定精神的實質(zhì);三是體例所應對的具體問題千差萬別;四需要統(tǒng)一和解決的問題成千上萬;五是不同的人員、不同的學科背景,不同的編輯業(yè)務(wù)經(jīng)歷,對同一體例要求的理解和認識的差異性也很大。如何統(tǒng)一編輯人員的認識,規(guī)范所有編輯人員的工作行為及工作準則,如何將各項工作分解并將工藝指標細化,如何使全體工作人員在統(tǒng)一的規(guī)范和統(tǒng)一的程序中完成成書編輯任務(wù),是實現(xiàn)工業(yè)化工藝流程設(shè)計后課題組面臨的又一個重要課題。項目組在認真研究的基礎(chǔ)上,提出了任務(wù)分解,指標細化的系統(tǒng)設(shè)計思路,并將其成功應用于系統(tǒng)的研發(fā)過程中。
在工藝設(shè)計中,最為重要的是體例中的規(guī)范指標的細化和描述,為此,整體工作分為兩個方面,一是將任務(wù)明確、指標細化、說明具體化;二是通過修改留痕和檢查校驗系統(tǒng),確保改動的有效性和可追溯性。
三、海量數(shù)據(jù)處理,優(yōu)化編輯過程
百科全書的編輯加工總量,在出版物中高居首位。以《中國大百科全書》(第二版)為例,全書成書條目總數(shù)為5.9610萬條,總索引量為26.6593萬條、總參見數(shù)為16.2688萬條、總圖數(shù)3.1573萬幅、總表數(shù)854,參考書目2683本。全書總句數(shù)114萬。在線修改10次。
僅以文字內(nèi)容的資料核查為例說明工作量,對于全書的成書質(zhì)量來說,要求做到的是內(nèi)容的自恰。然而要做到自恰二字,就意味著要對每一句的每一個表意要素進行對比核實,全書所有的資料不能出現(xiàn)不統(tǒng)一或互為矛盾的地方。
全書成書條目總數(shù)為5.9610萬條,共計114萬句,按句子成份分為定義、定性敘述、詞源、生平、經(jīng)歷、沿革、事件、成果、評價、著作等。每一句都是由若干個表意元素組成。如果僅按每句5個基本表意要素統(tǒng)計,一次編輯需要核實的表意要素總量就高達570萬,全書成書期間在線修改10次,核實確認總量高達5700萬(中間過程的實際工作量要按此增加20%)。對傳統(tǒng)出版來說,這是一個天文數(shù)字,如果不依靠信息技術(shù)和計算機,僅僅依靠人力,是不可能完成這項工作的。
為此,我們創(chuàng)造了句型編輯法,即在系統(tǒng)中,將全書的條目按句入庫,并通過自主研發(fā)的基于語義的句式系統(tǒng),對全書所有的句子,依其句型進行語義分析,并將其基本表意要素提取出來,進行比對核正了解數(shù)字化和網(wǎng)絡(luò)時代的特點。我們要捕捉到它的特征。
第二,要遵循它的規(guī)律,日報每天更新一次,月刊每月更新一次,網(wǎng)絡(luò)現(xiàn)在完全不是這樣的,網(wǎng)絡(luò)社區(qū)凝聚了很大的力量。我們經(jīng)常說網(wǎng)上的東西是一堆垃圾,但我要問大家,如果網(wǎng)上的東西都是垃圾,大家上網(wǎng)干什么?
網(wǎng)上一定有很多不是垃圾的東西。舉一個簡單的例子,比如博客,特別是名人博客,誰會把垃圾往上擱呢?一定不是垃圾。再說專業(yè)網(wǎng)站,是垃圾嗎?網(wǎng)上的一些工具書,是垃圾嗎?我們現(xiàn)在想查一個詞,或者一個概念,很容易在網(wǎng)上查到。
我覺得現(xiàn)在年輕一代,像我小孩那一代根本不使用紙質(zhì)詞典,去年我們研究所搞了一個電子紙測評,今年準備搞第二次,電子紙這個領(lǐng)域如果進入到出版界將是什么概念?特別是電子課件等等,它的影響是非常深刻的。所以要尊重數(shù)字化本身的規(guī)律,而不是用傳統(tǒng)平面媒體的思維方式經(jīng)營數(shù)字化時代、互聯(lián)網(wǎng)時代的媒體。
第三點建議,我個人認為也不一定正確就像今天會議主題一樣,要從資本層面去解決問題。為什么這樣說呢?盡管金融危機到來了,大家一聽投資就有點腦袋大,但技術(shù)與資本是永恒的話題。目前,傳媒業(yè)還是條塊分割,以我為中心做事,做期刊就做期刊,做投資就做投資,做技術(shù)就做技術(shù),做廣播就做廣播。美國人怎么做呢?美國有亞馬遜,我國有當當,亞馬遜不光賣實體書,還賣電子書,還做Kindle。當當呢?我們做閱讀器是技術(shù)提供商來做,硬件商來做,跟內(nèi)容完全脫離,企業(yè)和企業(yè)之間沒有任何戰(zhàn)略上的、資本上的融合。我認為更重要的是在資本層面上合作。所以說今天是一個合作共贏時代,簡單的合作是項目合作,委托開發(fā)等等,但我覺得合作應該更深層次一點,就是要進入資本層面。
另一方面,現(xiàn)在正進行文化體制改革、出版體制改革,出版體制改革應該說邁的步伐還是很快的,改革的目的就是要轉(zhuǎn)企改制,把能進入市場的出版單位改成純粹的企業(yè)。我想說的是:改革前,傳媒業(yè)的領(lǐng)導可能是官員,有行政級別和頭銜。但改革以后,你既然已經(jīng)是企業(yè)了,我覺得你就應該少一點官員身份,多一點商人身份。這一點很重要,因為只有你是商人了,你才會想到怎么去經(jīng)營,才會從戰(zhàn)略角度、資本角度思考問題,數(shù)字化說到底是一個企業(yè)戰(zhàn)略問題。
我想借這次年會的機會,希望傳統(tǒng)的平面媒體跟資本的力量能夠聯(lián)起手來,能夠打造出中國數(shù)字媒體的航空母艦,或者探索一種成功模式。我覺得這個是我們現(xiàn)在非常非常需要的。
(本文根據(jù)作者在09,中國傳媒投資年會上的演講整理)