秦雅萌?商建輝
【摘要】利用XML技術升級編輯出版手段,是科技期刊增強出版內容附加值,構建數(shù)字出版生態(tài)的重要支撐。文章以2020年度中國科技期刊卓越行動計劃高起點新刊為研究對象,重點對其XML出版實踐進行描述性分析。研究結果表明,樣本刊物通過構建一站式智能化的XML編輯出版平臺,利用XML技術打造細粒度、高增值的刊文內容,充分對接主流權威數(shù)據(jù)庫,有效滿足了用戶異質需求,為增強我國科技期刊數(shù)字出版?zhèn)鞑チ?、聲譽力與影響力帶來重要的借鑒啟示。
【關? 鍵? 詞】科技期刊;XML;編輯出版
【作者單位】秦雅萌,河北大學新聞傳播學院;商建輝,河北大學新聞傳播學院。
【中圖分類號】G230.7 【文獻標識碼】A 【DOI】10.16491/j.cnki.cn45-1216/g2.2021.05.018
隨著智能信息技術在數(shù)字出版行業(yè)中的廣泛普及,我國科技期刊的數(shù)字出版質量得到跨越式提升。一方面,科技期刊利用可促進在線約稿、投稿、組稿等出版流程節(jié)點有效銜接的數(shù)字出版技術,為一體化數(shù)字出版奠定硬件基礎。另一方面,科技期刊高度關注數(shù)字出版內容可讀性,持續(xù)增強刊文的顆粒度與感染力。但讀者對科技期刊出版內容、出版方式與出版渠道的要求日益增長,傳統(tǒng)的數(shù)字出版手段很難保證科技期刊內容傳播的實效性與針對性。XML技術作為當今處理分布式結構信息的有效工具,將其應用于科技期刊數(shù)字出版領域,有助于同步實現(xiàn)數(shù)據(jù)規(guī)整性處理與多渠道分發(fā),推動數(shù)字學術資源的泛在共享[1]。鑒于此,目前全球高水平科技期刊均開始全面推行基于XML技術的數(shù)字出版:如Nature、Science、Cell已經擁有十分成熟的XML出版管理系統(tǒng),這些系統(tǒng)可對科技文獻進行包括采編、處理與發(fā)布在內的全鏈條管理,并利用XML技術為讀者提供數(shù)據(jù)關聯(lián)分析與文本深度挖掘等增值服務。我國科技期刊的XML出版亦取得長足發(fā)展:入選中國科技期刊卓越行動計劃的刊物不僅開通了基于XML的智能編輯業(yè)務,而且為用戶提供視聽資源、文獻鏈接與知識關聯(lián)等增值服務,此舉極大拓展了科技期刊數(shù)字出版的功能邊界。文章分析了2020年度中國科技期刊卓越行動計劃高起點新刊XML出版的實踐經驗,提出有助于我國高水平科技期刊XML出版可持續(xù)發(fā)展的策略啟示。
一、研究對象與數(shù)據(jù)來源
中國科技期刊卓越行動計劃由國家新聞出版署會同中國科協(xié)等部門合作發(fā)起,目標是創(chuàng)建我國科技期刊可持續(xù)發(fā)展支持體系,是目前我國實施力度最大、投入資金最多、覆蓋范圍最廣的科技期刊支持項目。其中,高起點新刊項目希望通過支持創(chuàng)辦一批聚焦新興交叉學科的國際英文新刊,增強我國科技期刊的國際學術影響力與全球創(chuàng)新策源力[2]。2020年7月11日, 中國科技期刊卓越行動計劃辦公室正式發(fā)布2020年度中國科技期刊卓越行動計劃高起點新刊項目入選刊物名單,從項目規(guī)劃可行性、基礎辦刊條件、國際化辦刊條件三個方面遴選了30本刊物作為資助對象[3]。中國科學評價研究中心發(fā)布的《中國學術期刊評價研究報告》(第六版)指出,2020年度中國科技期刊卓越行動計劃高起點新刊充分發(fā)揮XML出版技術的價值紅利,構建了集采編、結構化校排與網(wǎng)絡發(fā)布等功能于一體的數(shù)字出版運營體系[4]。
本文以2020年度中國科技期刊卓越行動計劃高起點新刊為研究對象,采用網(wǎng)絡調研與文獻調研方法針對樣本期刊XML出版技術、內容、流程進行實證分析。首先,文章通過網(wǎng)絡調研手段深入考察樣本刊物XML出版的工作流程與核心功能,對此類數(shù)據(jù)進行分類處理。其次,采用文獻調研方法進一步萃取樣本期刊XML出版的隱性數(shù)據(jù),為后文的策略分析提供參考依據(jù)。
二、樣本期刊XML出版的實踐策略分析
1.創(chuàng)建全流程一體化的XML編輯出版平臺
第一,依托成熟的XML一體化內容生產管理云平臺同步推進編校工作。如《中國機械工程學報:增材制造前沿》利用中國知網(wǎng)研發(fā)的騰云全流程數(shù)字出版平臺增強內容運營管理績效。一方面,借助該平臺的數(shù)據(jù)資源智能管理、信息可視化加工、多主體協(xié)作編輯等功能單元,對刊文內容進行高精度歸類分析,并實現(xiàn)基于內容結構與內容屬性的數(shù)據(jù)標準化存儲,形成各類XML文檔結構化定義出版素材庫。另一方面,憑借XML自動化加工與主題標引功能,促進數(shù)字出版內容與形式的有機統(tǒng)一。如開展基于XML的文獻元數(shù)據(jù)提取工作,協(xié)同推進數(shù)字出版內容的XML文檔轉換與規(guī)整化處理。
第二,構建面向出版流程優(yōu)化的智能編輯系統(tǒng)。如《廢棄物處置與可持續(xù)能源》高度重視XML出版內容的一站式運營,依托XML技術開發(fā)了內容定制化加工服務系統(tǒng),開展數(shù)字內容全生命周期管理。一是通過網(wǎng)絡資源采集、電子文件轉換、元數(shù)據(jù)標引等智能校排工具對刊文內容進行自動化加工標引,生成體現(xiàn)知識內在語義關系的XML格式文檔。二是基于XML格式內容,實現(xiàn)自動標準校對,包括知識體系管理、結構化標引、智能分類標引、標引對象管理等。三是打造模塊化的文檔編輯引擎,采用“流文件”形式發(fā)布傳統(tǒng)的版式資源,支持多終端、多形態(tài)的數(shù)字閱讀方式。
2.依托XML技術為用戶精準推送高增值內容
第一,利用XML技術對數(shù)據(jù)層、信息層與知識層中的數(shù)據(jù)進行語義關聯(lián)組織,以形象化揭示刊文內容的相關信息。如《數(shù)學與統(tǒng)計通訊》利用頁面知識語義關聯(lián)方式拓展XML出版內容邊界,讓用戶通過“智能推薦”“自動關聯(lián)”“訂閱推送”“行為日志”等功能模塊,獲取更多與XML出版內容高度相關的基礎數(shù)據(jù)信息。《能源材料前沿》憑借XML技術高效挖掘刊文內容的知識元數(shù)據(jù),據(jù)此組建出版機構知識庫,不僅允許讀者開源檢索數(shù)據(jù)庫中的高價值信息,而且極大地促進了各類型科學數(shù)據(jù)的關聯(lián)推薦。
第二,利用XML嵌入式技術讓用戶及時了解刊文內容的學術影響力?!秶铱茖W進展》的做法較具代表性。其不僅在XML頁面中添加了“關聯(lián)發(fā)現(xiàn)”“統(tǒng)計分析”“采訪決策支持”等用戶行為分析與期刊傳播力分析的功能單元,為用戶智能推送期刊影響因子、收錄分區(qū)情況、開放特征、機構成果等大數(shù)據(jù)分析報告,而且讓用戶下載無版權爭議的數(shù)字資源。為增強XML出版的穿透力,《國家科學進展》在微信公眾號開辟“問答式社交服務”專欄,利用XML自然語言處理技術,讓用戶自定義數(shù)據(jù)檢索條件,公眾號后臺會結合用戶過往的檢索行為向其定制化推送增值信息。
第三,對學術論文中的實證結果、推演流程進行視聽化表達。一是基于XML技術豐富視聽文本。《CAAI人工智能匯刊》利用XML數(shù)據(jù)流查詢處理技術對刊物官方網(wǎng)站中的視頻資源進行全媒體發(fā)布,在對其進行增值化深加工基礎上,實現(xiàn)期刊不同傳播介質的資源共享。二是策劃模塊化、層次化的視聽內容?!渡锇踩蜕锇脖ks志》借助XML分面搜索推薦技術提供分層分類的視聽數(shù)據(jù)推送服務。如為生物學科專業(yè)研究人員推送研究熱點與研究前沿的主題短視頻,為普通學生與其他社會受眾推送常識性科普視聽文章,顯著增強視聽內容的權威性與貼近性。
3.通過共享權威數(shù)據(jù)庫增強XML出版生產力
第一,與主流數(shù)據(jù)庫建立共享關系,提升XML出版內容的供給能力。一方面,深度對接業(yè)內權威的數(shù)據(jù)倉儲平臺,實現(xiàn)與國際主流學術出版平臺的數(shù)據(jù)實時交換。當前,樣本期刊均與愛思唯爾Ei工程索引數(shù)據(jù)庫、Springer電子期刊數(shù)據(jù)庫、IEEE/IET Electronic Library等數(shù)據(jù)庫服務商締結了深度合作關系,確保讀者能夠實時獲取最新、最權威的科學數(shù)據(jù)。如《生態(tài)過程》基于XML技術建立了面向讀者免費服務的合作模式:與尚唯科技報告資源服務系統(tǒng)簽訂了合作完成XML全文的框架協(xié)議,讀者將鼠標懸停在對象引用標識符上便可自動獲取與之適配的外延鏈接數(shù)據(jù)。另一方面,依托權威數(shù)據(jù)庫擴大XML出版的覆蓋面。如《植物表型組學》在獲得SAGE Journal平臺的XML出版權后,IOS Press Journals期刊數(shù)據(jù)庫立刻對其近十年的刊文進行XML網(wǎng)頁發(fā)布,科睿唯安僅用7天便完成了對XML文章的元數(shù)據(jù)提取工作。
第二,吸納優(yōu)質用戶成為XML出版策劃主體。一是依據(jù)投稿與在線評論質量對用戶進行評級,凡被認定為優(yōu)質用戶的讀者,將會定期獲得科技期刊主動推送的同一研究領域內的前沿文獻、刊文數(shù)據(jù)被引情況等個性化信息。如《新興污染物》創(chuàng)建了包含積分管理、群組管理、訂閱管理等功能的用戶社區(qū)服務生態(tài)圈,讓活躍在評論區(qū)的優(yōu)質用戶成為XML出版的主要顧問。二是為增強XML出版的時效性,樣本期刊均提供基于XML的預印本服務,采用XML超鏈接手段第一時間刊發(fā)綜述論文,顯著激發(fā)讀者參與XML出版的內生動力。
三、我國科技期刊XML出版的發(fā)展路徑
1.打造基于XML技術的智能化編輯出版系統(tǒng)
第一,構建基于XML的數(shù)字化加工標引系統(tǒng)。一方面,從互聯(lián)網(wǎng)上系統(tǒng)化采集公開出版的數(shù)字學術資源,經過智能數(shù)據(jù)處理、存儲、發(fā)布,并結合讀者個性化需求進行聚類存檔,形成兼具專業(yè)性與權威性的學術資源池。如利用基于XML的WEB數(shù)據(jù)挖掘技術對國內外網(wǎng)絡學術站點最新發(fā)布的數(shù)據(jù)進行針對性抓取,在對采集的信息進行過濾、信息去噪和結構化內容提取的基礎上,對其進行自動聚類與關聯(lián)整合,從而發(fā)現(xiàn)熱點學術情報。另一方面,構建元數(shù)據(jù)標引模塊。即發(fā)揮XML技術的知識結構化標引、內容碎片化標引等特色優(yōu)勢,對刊文內容進行基于元數(shù)據(jù)的多維度標引,據(jù)此為讀者推送具有差異化知識元本體的超文本。如對多來源、多語種的網(wǎng)絡數(shù)據(jù)資源進行知識框架自動分析與文本知識元分析,而后從主體部分(存儲論文正文關鍵信息的元數(shù)據(jù))、后置部分(存儲術語表等輔助信息)、浮動部分(存儲文章的同行評議意見與次級論文等元數(shù)據(jù))三個方面規(guī)劃不同應用場景下的知識庫標簽集,為XML出版奠定數(shù)據(jù)支撐。
第二,促進XML出版服務模塊間的深度交互。一是構建協(xié)同編撰平臺,對XML出版呈現(xiàn)形式與內容進行動態(tài)組合。如利用基于XML的工作流程管理、編輯工具集成等功能插件,讓科技期刊編校人員和讀者協(xié)同開展刊文內容的XML轉換、XML注釋等校排工作,提高XML出版的集成化管理水平。二是創(chuàng)建全媒體資源管理平臺,促進期刊學術資源檢索瀏覽、資源庫管理與資源云服務的無縫對接。如借助基于XML的自然語言檢索引擎對非結構化數(shù)據(jù)、NXD數(shù)據(jù)、關系型數(shù)據(jù)進行跨媒體數(shù)據(jù)挖掘分析,構建涵蓋元數(shù)據(jù)文件、多階索引文件與數(shù)字對象文件的全媒體分布式資源系統(tǒng),實現(xiàn)科技期刊全媒體資源基礎管理、收集管理和遷入遷出管理的有機協(xié)同。另外,科技期刊還應加快建立XML出版數(shù)據(jù)標準,基于統(tǒng)一的文檔格式打通XML出版數(shù)據(jù)資源流動的阻滯點,促進XML出版內容的高質量共享。
2.利用XML技術提供定制化、個性化出版服務
第一,借助XML技術豐富科技期刊數(shù)字出版內容。一是做細XML出版知識導航服務。即借助基于XML主題地圖的知識導航技術的細粒度呈現(xiàn)刊文內容。如利用XML自動版面分析技術精細化拆分數(shù)字出版導航目錄,通過思維導圖向讀者呈現(xiàn)XML出版內容中基礎信息的關聯(lián)關系。二是做精社交化知識問答服務。社交化知識問答服務是科技期刊用戶增值服務的重要構成,以簡潔明確的XML標記語言回答用戶咨詢,形成個性化的知識服務社交網(wǎng)絡,有助于提升用戶的依賴感和忠誠度。如利用XML Servlet技術構建全場景知識問答系統(tǒng),通過問題深度分析、答案生成與排序對用戶意圖進行命名實體識別,確保科技期刊快速鎖定用戶目標信息。三是做強專題知識庫運營服務。專題知識庫運營服務是根據(jù)學科與主題將文本知識元進行關聯(lián)整合,進而為用戶提供專業(yè)性知識集成產品的服務??萍计诳瘧肵ML文本熱點分析技術與文本聚焦技術創(chuàng)建可滿足讀者差異化資源需求的專題知識庫,以提升用戶對XML出版服務的價值感知[5]。
第二,提供XML出版資源情境化推薦服務??萍计诳疿ML出版是情境化、多維度、立體化的知識傳播行為,其實踐主旨是在用戶與期刊之間形成常態(tài)化情境適配的交互關系,進而實現(xiàn)信息資源的靶向投放。因此,借助XML資源推薦技術為用戶提供與其使用情境、需求畫像相契合的目標數(shù)據(jù),能夠大大增強用戶的感知體驗。如《中華放射醫(yī)學與防護》創(chuàng)建具有廣視域、全覆蓋特征的資源推薦系統(tǒng),借助XML嵌入式技術將移動圖書館、數(shù)字圖書館等數(shù)字學術平臺嵌入科技期刊網(wǎng)站,通過構建用戶標簽體系提高XML出版資源推薦的情境化、定制化水平。
3.常態(tài)化對接優(yōu)質用戶與權威學術數(shù)據(jù)庫
第一,放開學術數(shù)據(jù)庫的訪問接口,通過數(shù)據(jù)庫跨媒介動態(tài)鏈接組建開放式學術資源門戶。一是開發(fā)支持科學數(shù)據(jù)跨庫鏈接的功能接口,確??萍计诳軌驘o障礙共享主流數(shù)據(jù)庫中的優(yōu)質資源。如創(chuàng)建以數(shù)據(jù)交換接口、元數(shù)據(jù)管理接口、API集成接口為核心的學術數(shù)據(jù)庫訪問接口體系,與數(shù)據(jù)庫服務商簽訂旨在實現(xiàn)科學數(shù)據(jù)開放存取的接口協(xié)議,在科技期刊與數(shù)據(jù)庫間營造科學數(shù)據(jù)共建共享的生動態(tài)勢。二是為規(guī)避跨庫檢索過程中的版權侵權風險,科技期刊應與數(shù)據(jù)庫締結XML出版資源安全共享協(xié)議,在獲取數(shù)據(jù)庫服務商資源鏈接權限許可的前提下,使用戶能夠合法合規(guī)地跨庫調用XML出版資源[6]。
第二,提供人性化的數(shù)據(jù)共享服務。一方面,科技期刊可建立用戶知識貢獻激勵機制,引導用戶深度參與XML出版全周期。如堅守以用戶生成內容為核心的讀者培育理念,基于用戶網(wǎng)絡評論的轉發(fā)量與采納量等數(shù)據(jù)對讀者進行分級管理,并依托XML DOM節(jié)點樹技術量化分析用戶聲譽的波動情況,為擁有高聲譽等級的讀者匹配更大的數(shù)據(jù)共享權限。另一方面,科技期刊可應用“內容+平臺+數(shù)據(jù)”的運營模式,促進用戶、XML出版渠道和論文作者深度融合。如利用基于XML的知識表示技術全方位呈現(xiàn)學術論文的創(chuàng)新點,系統(tǒng)整合用戶學術成果中的信息流與知識流,推動科技期刊從知識傳遞者向學術貢獻者轉變;通過XML文件可視化方式對刊文內容中的知識元、知識條目等進行體系化關聯(lián),進而形成“用戶貢獻—知識挖掘—共享增值—用戶成長”的良性循環(huán)。
|參考文獻|
[1]周小玲,侯春梅,黃愛華,等. 我國百強中文科技期刊XML/HTML出版現(xiàn)狀調研與分析[J]. 中國科技期刊研究,2019 (1):40-45.
[2] 高雅麗. 七部門聯(lián)合實施中國科技期刊卓越行動計劃[N]. 中國科學報,2019-09-23.
[3]關于對2020年度中國科技期刊卓越行動計劃高起點新刊項目擬入選項目進行公示的通知[EB/OL]. (2020-07-
09)[2021-01-16]. http://news. sciencenet. cn/htmlnews/2020/
7/442636. shtm.
[4]RCCSE《中國學術期刊評價研究報告》(第六版)新鮮出爐[EB/OL]. (2020-10-26)[2021-01-20]. http://www. eshukan. com/displaynews. aspx?nid=888.
[5]趙少飛,陳輝. 基于XML一體化生產管理云平臺的科技期刊出版流程優(yōu)化實踐[J]. 編輯學報,2018 (6):627-631.
[6]周驥. 學術期刊的移動出版:現(xiàn)狀、問題和策略[J]. 傳媒,2020(1):31-34.