在幾次會(huì)議中, 大家都提到由于數(shù)字出版物的文本格式的不統(tǒng)一,導(dǎo)致讀者在閱讀不同公司的數(shù)字出版物的時(shí)候,要購買支持不同出版物格式的閱讀器或下載不同的閱讀器軟件,這給讀者造成了很大不便,同時(shí)也阻礙了我國(guó)數(shù)字出版的健康發(fā)展。為此,筆者專門對(duì)這一問題進(jìn)行了調(diào)研,并對(duì)調(diào)研情況進(jìn)行了初步的分析。
我國(guó)數(shù)字出版物格式標(biāo)準(zhǔn)現(xiàn)狀
目前,國(guó)際上使用最廣泛的數(shù)字出版物的格式是Adobe公司的PDF格式,專用閱讀工具是Adobe Acrobat Reader軟件。在我國(guó),除了使用PDF格式外,還有一些比較常用的數(shù)字出版格式,如方正阿帕比公司的CEB電子圖書格式、清華同方公司的CAJ電子期刊格式、超星公司的PDG電子書格式、書生公司的SEP格式、華康公司的WDL電子書格式等。
目前我國(guó)市場(chǎng)上存在的多種數(shù)字出版的文本格式彼此各不兼容。顯然,格式的多樣影響了數(shù)字出版的發(fā)展,從而使人們過分依賴于閱讀器。而無論是何種出版,其主要任務(wù)是提供內(nèi)容,而非開發(fā)閱讀器,后者充其量只是數(shù)字出版的一項(xiàng)附屬內(nèi)容。統(tǒng)一數(shù)字出版的文本格式亦即標(biāo)準(zhǔn)問題逐漸提上了日程。
格式標(biāo)準(zhǔn)化過程中存在的問題
當(dāng)前,實(shí)力雄厚的大公司擔(dān)心數(shù)字出版物格式標(biāo)準(zhǔn)的制定,會(huì)影響其市場(chǎng)地位,而沒有研發(fā)數(shù)字出版物格式技術(shù)的公司,如萬方數(shù)據(jù)公司等卻歡迎數(shù)字出版物格式的統(tǒng)一。其中最主要原因是實(shí)力雄厚的大公司依靠自己的技術(shù)優(yōu)勢(shì)研發(fā)了自己的一套數(shù)字出版物格式,并以此作為占領(lǐng)市場(chǎng)的手段之一。方正阿帕比公司科研人員認(rèn)為CEB電子書格式是他們花費(fèi)大量心血研發(fā)的具有知識(shí)產(chǎn)權(quán)的成果,不愿意開放其技術(shù)。依靠排版技術(shù)優(yōu)勢(shì),方正阿帕比公司在與出版社合作出版電子書方面占有較大的市場(chǎng)。該格式的主要特點(diǎn)是高保真性,相對(duì)于其他電子書格式,CEB電子書格式確實(shí)在顯示效果等方面具有一定的優(yōu)勢(shì)。
清華同方公司也存在這樣的問題,他們認(rèn)為電子書的格式一旦重新建立一套新的標(biāo)準(zhǔn),將意味著不僅他們?cè)诔霭嫖锔袷窖邪l(fā)方面和維護(hù)方面的投資將付之東流,而且將面臨新的投資。目前該公司在此方面的投資每年大概需要100~200萬元, 以10年累計(jì)已投資1000~2000萬元人民幣。而且目前中國(guó)市場(chǎng)幾大技術(shù)提供商分割市場(chǎng)的格局有可能被打破,他們的地位將受到挑戰(zhàn)。他們認(rèn)為這將影響具有技術(shù)優(yōu)勢(shì)企業(yè)的創(chuàng)新精神。
此外,版權(quán)問題也是影響電子書格式統(tǒng)一的因素之一,這些企業(yè)擔(dān)心一旦數(shù)字出版物格式統(tǒng)一了,他們的版權(quán)將得不到相應(yīng)的保護(hù)。由此可見,數(shù)字出版物格式標(biāo)準(zhǔn)制定的關(guān)鍵的問題在于如何協(xié)調(diào)各公司的利益。
國(guó)外數(shù)字出版物格式標(biāo)準(zhǔn)化之路
在國(guó)外,也存在由于數(shù)字出版物格式不同,用戶需要使用不同閱讀器或下載不同閱讀器軟件的問題。那么國(guó)外是怎樣解決這個(gè)問題的呢?
在歐美國(guó)家,電子書的發(fā)展正在逐步走向規(guī)范化。在電子書統(tǒng)一標(biāo)準(zhǔn)方面,雖然目前尚沒有能夠形成統(tǒng)一的格式,但OEB的建立為格式統(tǒng)一提供了可能。該標(biāo)準(zhǔn)是一個(gè)開放的、公共的、基于XML的數(shù)字出版內(nèi)容格式規(guī)范。目的是給內(nèi)容提供商(如出版商和作者等)和技術(shù)提供商提供最簡(jiǎn)單和最通用的指南,以便數(shù)字內(nèi)容通過多種閱讀系統(tǒng)能真實(shí)、準(zhǔn)確和方便地表達(dá)出來。目前該標(biāo)準(zhǔn)已經(jīng)得到了一些軟件公司如索尼公司、Adobe公司以及閱讀設(shè)備廠商的支持。雖然該標(biāo)準(zhǔn)目的是要統(tǒng)一數(shù)字出版物的文件格式,讓作者、出版商所生成的數(shù)字出版物文檔在所有的數(shù)字出版物閱讀器上都可以正確顯示,但目前該標(biāo)準(zhǔn)還是寬泛的數(shù)字出版物格式的規(guī)范,還沒有實(shí)現(xiàn)對(duì)數(shù)字出版物格式進(jìn)行真正的統(tǒng)一。
在韓國(guó),使用最廣泛的電子書格式是Adobe公司的PDF格式以及Adobe Acrobat 閱讀器。但考慮該格式一經(jīng)制作就不能修改,且該格式是Adobe公司的獨(dú)家格式,不容易擴(kuò)展,所以韓國(guó)將基于XML的EBKS(即KSX6100)的電子書格式定為國(guó)家標(biāo)準(zhǔn),主要是考慮其兼容性、公開性、應(yīng)用性以及可擴(kuò)展性,此外該格式還可以對(duì)文件進(jìn)行結(jié)構(gòu)調(diào)整, 具有獨(dú)立的平臺(tái)。該韓國(guó)國(guó)家標(biāo)準(zhǔn)也是一個(gè)寬泛的電子書格式規(guī)范,還不能達(dá)到完全統(tǒng)一電子書格式和閱讀器的問題。
在我國(guó),電子書的格式標(biāo)準(zhǔn)問題引起了出版機(jī)構(gòu)、圖書館、數(shù)字出版技術(shù)提供商、信息產(chǎn)業(yè)部和新聞出版總署等機(jī)構(gòu)的廣泛關(guān)注。2007年以書生公司牽頭的行業(yè)標(biāo)準(zhǔn)項(xiàng)目——非結(jié)構(gòu)化操作標(biāo)記語言第一部分:文檔操作接口規(guī)范正式在信息產(chǎn)業(yè)部立項(xiàng),目前該標(biāo)準(zhǔn)已經(jīng)完成報(bào)批稿。該項(xiàng)目通過各技術(shù)提供商按照該文檔操作結(jié)構(gòu)標(biāo)準(zhǔn),在各自的閱讀軟件上建立一個(gè)開放接口,讀者便可以實(shí)現(xiàn)對(duì)不同格式的數(shù)字出版物的閱讀。