■鄒 強 袁 慶 康 林 盛曉陽 王永武
1)上海交通大學醫(yī)學院附屬新華醫(yī)院,上海市兒科醫(yī)學研究所 《臨床兒科雜志》編輯部,上海市控江路1665號 200092,E-mail:zooqiang@126.com
2)《中華健康管理學雜志》編輯部,北京東四西大街42號 100710,E-mail:yuanqing@cma.org.cn
3)《外科研究與新技術(shù)》編輯部,上海市普陀區(qū)新村路389號 200065,E-mail:wangyongwu993@sohu.com
2011年10月,第63屆法蘭克福書展上國際數(shù)字出版論壇(International Digital Publishing Forum,IDPF)發(fā)布了全新的數(shù)字出版技術(shù)——ePub3。這一被視為出版變革的重要技術(shù),是否能再次改變整個出版行業(yè),對生物醫(yī)學期刊出版有何影響,是生物醫(yī)學期刊出版人關(guān)心的問題。
法國阿歇特出版集團(Hachette Livre)是該標準的堅定支持者,其數(shù)字出版部主任Luc Adrain則參與了該標準的起草和編輯等工作。該集團的電子出版物也全面支持這一新的電子書標準。在2013年4月倫敦書展上,麥克米倫(Macmillan)旗下的MPS有限公司與英格拉姆內(nèi)容集團(Ingram Content Group)下屬公司VitalSource Technologies就采用ePub3格式標準達成了協(xié)議。同時,該格式得到了多家著名互聯(lián)網(wǎng)公司的支持,如開放平臺的堅定支持者——Google、排版軟件巨頭——Adobe等。擁有300多家會員單位的美國出版商協(xié)會(The Association of American Publishers)也宣布支持 ePub3[1]。
但ePub3沒有獲得所有網(wǎng)絡閱讀器生產(chǎn)商如亞馬遜、KOBO和索尼等公司的支持,在 iOS和Android系統(tǒng)上它們的應用軟件沒有支持該標準。在IDPF的成員內(nèi)也未找到微軟的身影[2]。而現(xiàn)有的技術(shù)CSS3與HTML5是ePub3的潛在替代者,因為該類型電子出版物同樣也可以在 PC、MAC、Android和iOS上任何一種瀏覽器上進行閱讀,而不需要采用專門數(shù)字閱讀應用軟件。目前,ePub3的大部分功能都沒有得到主流閱讀軟件的支持。
在生物醫(yī)學領(lǐng)域,2012年12月11日,BioMed Central(BMC)通過其官方博客宣布,在今后的論文將增加對ePub格式的支持,并附上了一篇以ePub3格式呈現(xiàn)的論文截圖[3]。作為生物醫(yī)學信息的領(lǐng)導者,美國國立醫(yī)學圖書館(National Library of Medicine,NLM)下屬的生物技術(shù)信息中心(National Center for Biotechnology,NCBI)其開發(fā)的開放獲取期刊平臺PubMed Central(PMC)發(fā)布了基于全新的HTML5和 CSS3技術(shù)的PubReader—— PMC全新的呈現(xiàn)樣式[4]。 同時也推出了 ePub(beta),目前為ePub的測試版,以期通過HTML5與ePub互補,完善對數(shù)字出版各類主流格式的支持。在2013年的期刊文檔標簽套件(The Journal Article Tag Suite,JATS)大會上,Dean[5]介紹了如何將 NLM DTD自動轉(zhuǎn)換為ePub3,相信NLM很快將在其PMC開放獲取平臺上正式推出基于ePub3格式的全文免費論文。
一個ePub3文件其實是一個壓縮文檔(通過解壓縮工具打開),包含了一本書的所有內(nèi)容:元數(shù)據(jù)、文字、圖片、各種媒體素材等[6]。也可以簡單地把ePub3理解成一個封裝好的、打好包的網(wǎng)站。這樣既可以滿足讀者在線閱讀的要求,又能滿足讀者下載收藏的需求[7]。
ePub3規(guī)范定義了一套建立XHTML內(nèi)容文件。ePub3 元數(shù)據(jù)是 XML,ePub3 內(nèi)容是 XHTML[8]。ePub3規(guī)范所定義的XHTML文件類型符合W3C的HTML5規(guī)范。XHTML文件類型皆繼承所有來自HTML 5的語義、結(jié)構(gòu)和處理行為。也就是說ePub3兼容HTML5。此外,ePub3規(guī)范為W3C HTML5文件類型定義了一組擴展,讓程序員可以將這些擴展納入XHTML內(nèi)容文件之中[8]。
在HTML4.0時代,如果想要在網(wǎng)頁中嵌入音頻、視頻文件,必須使用第三方插件,比如 Flash Player。其代碼復雜,且與瀏覽器等兼容性等問題,一直是廣為詬病的問題[9]。ePub3引入 Trigger元件(符合HTML 5標記)將音頻、視頻內(nèi)容可以嵌入到電子書文件中,包含了所有觸發(fā)該事件時所要執(zhí)行的動作(允許值:show|hide|play|pause|resume|mute|unmute等)。生物醫(yī)學期刊,如外科等涉及到具體手術(shù)操作等技術(shù),特別是三維立體的介入技術(shù)、內(nèi)鏡技術(shù)等,傳統(tǒng)的圖文已很難對此做出清楚描述,更無法有效的呈現(xiàn)。此時引入動態(tài)視頻和解說,將內(nèi)容很好的呈現(xiàn)給讀者,可以讓讀者充分領(lǐng)會作者的意圖。
在ePub3中增加了對數(shù)學置標語言(mathematicalmarkup language, MathML)的支持,一種基于XML,描述數(shù)學符號,捕捉其結(jié)構(gòu)和內(nèi)容的語言[5]。在生物醫(yī)學期刊中經(jīng)常會遇到各種數(shù)學公式,在進行期刊的數(shù)字化過程中,對數(shù)學公式的處理往往是將其轉(zhuǎn)換為圖片格式,處理繁瑣且損失了其原始的矢量特性。增加了對該語言的支持ePub3可以像處理文本一樣處理數(shù)學公式,使數(shù)字化出版更便捷。
ePub3同時支持OpenType和Web開放字體格式(web open font format,WOFF),以滿足傳統(tǒng)印刷版排版和網(wǎng)頁排版。對于生物醫(yī)學期刊來說,加入全文數(shù)據(jù)庫,提高文獻的被引次數(shù),是其編輯出版最重要的工作之一。期刊的出版,既要保證印刷版的按時出版,又要保證期刊全文電子版內(nèi)容的及時上線。同時對OpenType和WOFF的支持,將免去二次排版,減少重復勞動。
傳統(tǒng)的點陣圖可以很好的適應傳統(tǒng)紙質(zhì)出版的需求,然而在高分辨率觸摸屏時代,亟需一種更好的閱讀體驗的圖像格式??缮炜s矢量圖形(scalable vector graphic,SVG)作為一種矢量圖像圖形網(wǎng)絡標準發(fā)布推出后,受到了空間位置信息領(lǐng)域的關(guān)注[10],其提供了目前網(wǎng)絡流行的GIF和JPEG格式無法具備的優(yōu)勢:1)可以任意放大圖形顯示,但絕不會以犧牲圖像質(zhì)量為代價;2)可在SVG圖像中保留可編輯和可搜尋的狀態(tài);3)比JPEG和GIF格式的文件要小很多,因而有下載優(yōu)勢。對于生物醫(yī)學期刊中的DNA模型、蛋白質(zhì)組、藥物的分子結(jié)構(gòu)等,已經(jīng)很難用點陣圖來描述了,SVG這一矢量運算的圖形可以很好地解決這一問題。Etherington等[11]詳細描述了SVG這一開發(fā)的標準,在生物信息領(lǐng)域,應用前景廣闊。
元數(shù)據(jù)為描述數(shù)據(jù)的數(shù)據(jù)(data about data),主要是描述數(shù)據(jù)屬性(property)的信息,用來支持如指示存儲位置、歷史數(shù)據(jù)、資源查找、文件記錄等功能。ePub3中元數(shù)據(jù)主要用于對文獻的標識,以便館藏的需要。有了對元數(shù)據(jù)的支持,生物醫(yī)學期刊所發(fā)布的文獻,在數(shù)據(jù)庫中可以更好地被利用。
ePub3與HTML4.0、PDF均是目前互聯(lián)網(wǎng)出版物比較流行的格式,其技術(shù)的比較見表1。
通過將JavaScript嵌入到ePub3電子書中,將支持起像桌面互聯(lián)網(wǎng)那樣的廣告生態(tài)系統(tǒng),理論上說,可以在任何時間利用電子書中的某個空間嵌入廣告。而對于生物醫(yī)學期刊來說,是否符合國家工商總局《藥品廣告審查發(fā)布標準》呢?而這樣的互聯(lián)網(wǎng)廣告是否對傳統(tǒng)印刷期刊廣告造成沖擊呢?
ePub3將在瀏覽器、本地應用程序中呈現(xiàn),并且可以推廣到不同尺寸的屏幕上??梢詫崿F(xiàn)“一份內(nèi)容,多次發(fā)布”。隨著平板電腦和智能手機普及率的不斷提高,讀者將期待更豐富的功能。其對于生物醫(yī)學文獻內(nèi)容的呈現(xiàn)是否能為讀者帶來創(chuàng)新性的改變?
表1 ePub3與HTM L4.0、PDF技術(shù)的比較
作為全球最大的生物醫(yī)學期刊開放獲取平臺之一的PMC,正積極為ePub3的出版工作流程努力著[5,12]。 美國生物技術(shù)信息中心(National Center for Biotechnology,NCBI)于 2012年 8月發(fā)布了JATS——一組集XML元素、期刊文獻標記屬性、三種DTDs的標準[13],并成為美國國家標準(NISO Z39.96-2012)。有了這一標準,可以很好的為生物醫(yī)學期刊的數(shù)字化服務,從HTML4到HTML5、從PDF到ePub。而國內(nèi)的生物醫(yī)學期刊如何緊追期刊數(shù)字化出版的步伐,應盡快完成基于結(jié)構(gòu)化排版的生產(chǎn)流程再造[14]。目前上海醫(yī)學期刊數(shù)字化平臺正在加緊建設(shè),這一平臺可以讓各成員期刊以開放獲?。∣A)宗旨,基于XML排版,繼而提供多種數(shù)字化出版。然而目前尚缺乏一套與我國國情相適應的XML標準。
雖然ePub3“一份內(nèi)容,多次發(fā)布”的特性得到了出版商的歡迎,但是,作為出版界的新技術(shù),對于許多開發(fā)者來說還不是一個常規(guī)的技能,人才存在一定短缺。如果建立一個開發(fā)團隊,對于我國生物醫(yī)學期刊編輯部來說,是很難實現(xiàn)的;而對此進行產(chǎn)品外包,其費用又是想當昂貴的。如果真如Dean[5]所說,將來可以實現(xiàn)將 JATS自動化轉(zhuǎn)化為ePub3,這將帶領(lǐng)生物醫(yī)學期刊的數(shù)字化出版又向前邁出了一大步。
ePub3是一種新興的數(shù)字化出版標準,在生物醫(yī)學領(lǐng)域,也有多家機構(gòu)紛紛加入嘗試。在這新的發(fā)展契機中,我國的生物醫(yī)學期刊應盡快建立和(或)引入一套符合中國國情的JATS,并以此標準為基礎(chǔ)開發(fā)出多種數(shù)字化出版的文獻類型,以適應數(shù)字化出版發(fā)展潮流。
1 The Association of American Publishers.EPUB 3 Implementation Project White Paper Now Online[EB/OL].[2013-11-20].http://publishers.org/press/117/
2 International Digital Publishing Forum.ePub3 Overview[EB/OL].[2013-04-28 ].http://www.idpf.org/epub/30/spec/epub30-overview.html
3 BioMed Central blog.BioMed Central now publishes in ePUB format[EB/OL].http://blogs.biomedcentral.com/bmcblog/2012/12/11/biomed-central-now-publishes-in-epub-format/
4 National Center for Biotechnology Information.New in PMC[EB/OL].[2013-04-28].http://www.ncbi.nlm.nih.gov/pmc/about/new-in-pmc/day26
5 Dean M.The Challenges and Benefits of Automating NLM-to-ePub3 File Conversion [M/OL].[2013-11-20].http://www.ncbi.nlm.nih.gov/books/NBK159966/
6 施勇勤.ePub3格式對我國電子書標準制定的啟示.國際交流,2012,(2):78-83
7 Idan O.EPUB3 vs.HTML5 [EB/OL].[2013-08-02].http://www.heliconbooks.com/article/epub3vshtml5
8 International Digital Publishing Forum.EPUB Content Documents 3.0 [EB/OL].[2013-04-28].http://www.idpf.org/epub/30/spec/epub30-contentdocs.html
9 劉華星,楊庚.HTML5— —下一代Web開發(fā)標準研究.計算機技術(shù)與發(fā)展,2011, 21(8):54-62
10 陳春芳,李巖.基于SVG的空間定位模型.計算機工程,2009,35(24): 268-273
11 Etherington GJ, Maclean D.SVGenes: a library for rendering genomic features in scalable vector graphic format.Bioinformatics,2013, 29(15):1890-1892
12 Kelly L.JATS to EPUB: Unraveling the Mystery[M/OL].[2013-08-02].http://www.ncbi.nlm.nih.gov/books/NBK47314/
13 JATS.Main Page[EB/OL].[2013-04-28].http://webservices.itcs.umich.edu/mediawiki/jats/index.php/Main_Page
14 劉冰,游蘇寧.我國科技期刊應盡快實現(xiàn)基于結(jié)構(gòu)化排版的生產(chǎn)流程再造.編輯學報,2010,22(3):262-266