記者︱張競艷
從2003 年成立古籍資源部,到2018 年推出古籍整理與數(shù)字化綜合服務(wù)平臺——籍合網(wǎng),再到2022 年推出“3D 超寫實數(shù)字人蘇東坡”,中華書局經(jīng)過不懈探索,逐步奠定了其在古籍數(shù)字出版行業(yè)的領(lǐng)先地位。
“起舞弄清影,何似在人間?!闭缣K東坡在《水調(diào)歌頭?明月幾時有》中所寫的那樣,這位大才子對世俗人間充滿了無限深情。“我們想,對人間予以深情的東坡、被人們深愛的東坡,也一定愿意重返人間?!睘榇耍腥A書局古聯(lián)公司聯(lián)合元宇宙生態(tài)鏈企業(yè)北京諦聽視界文化科技有限公司,基于古籍文獻和數(shù)字技術(shù)進行了為期一年的認真研發(fā),歷經(jīng)幾十次研討打磨及版本迭代,最終將全國首位“3D 超寫實數(shù)字人蘇東坡”送到了大家的面前。中華書局110 周年局慶大會之際,“數(shù)字人蘇東坡”得到了讀者的熱情反饋。
如何推動中華優(yōu)秀傳統(tǒng)文化創(chuàng)造性轉(zhuǎn)化、創(chuàng)新性發(fā)展?把握好數(shù)字化機遇,做好古籍數(shù)字化工作,無疑是讓中華優(yōu)秀傳統(tǒng)文化展現(xiàn)出新時代風采的重要手段。從2003 年成立古籍資源部、2015 年改組為古聯(lián)(北京)數(shù)字傳媒科技有限公司(簡稱古聯(lián)公司),到2018 年古聯(lián)公司推出古籍整理與數(shù)字化綜合服務(wù)平臺——籍合網(wǎng),這些年中華書局經(jīng)過不懈探索,逐步奠定了其在古籍數(shù)字出版行業(yè)的領(lǐng)先地位。在中華書局執(zhí)行董事周絢隆看來:“中華書局過去10 年最大的突破就是古籍數(shù)字化。我們成立了古聯(lián)(北京)數(shù)字傳媒科技有限公司,打造了包括中華經(jīng)典古籍庫在內(nèi)的多個專業(yè)數(shù)據(jù)庫,現(xiàn)在處于全國前列水平,在業(yè)內(nèi)非常有影響力;還研發(fā)了古籍文字識別、自動標點等專利技術(shù),搭建了古籍整理與數(shù)字化綜合平臺‘籍合網(wǎng)’,這些已經(jīng)成為中華書局重要的品牌支撐?!?/p>
近日,國家新聞出版署發(fā)布通知,公布了2022 年度出版融合發(fā)展工程入選名單。中華書局“籍合網(wǎng)”入選“2022 年度數(shù)字出版優(yōu)質(zhì)平臺遴選推薦計劃”。
早在2003 年,中華書局就成立了古籍資源部,著手布局古籍數(shù)字化工作。2012 年起,中華書局決定將數(shù)字化內(nèi)容做成數(shù)據(jù)庫。2014 年,中華書局首款數(shù)據(jù)庫產(chǎn)品——“中華經(jīng)典古籍庫”問世,該庫匯集了中華書局歷年出版的整理本古籍資源內(nèi)容,是國內(nèi)首個大型整理本古籍全文數(shù)據(jù)庫?!爸腥A經(jīng)典古籍庫”目前共上線9期資源,資源總量超20 億字,匯聚了鳳凰出版社、巴蜀書社、齊魯書社等20 多家出版機構(gòu)的優(yōu)質(zhì)古籍整理本資源,數(shù)據(jù)準確,內(nèi)容權(quán)威,得到了學界的一致好評。
2015 年8 月,中華書局將古籍資源部改組為古聯(lián)公司。此后的三年時間里,古聯(lián)公司研發(fā)了在線古籍整理與發(fā)布系統(tǒng),開啟了全新的線上資源生產(chǎn)和出版模式。2018 年,古聯(lián)公司整合現(xiàn)有數(shù)字產(chǎn)品,推出“籍合網(wǎng)”。隨后在線眾包平臺、古籍整理培訓平臺、古籍智能整理平臺等創(chuàng)新產(chǎn)品與模式不斷發(fā)展成形。近幾年,古聯(lián)公司發(fā)展迅速,在古籍數(shù)字化專業(yè)服務(wù)上,逐步形成了數(shù)據(jù)庫建設(shè)、在線編校、技術(shù)服務(wù)、人才培養(yǎng)、校企合作的產(chǎn)業(yè)服務(wù)矩陣。
“籍合網(wǎng)”在成立之初,就得到古籍辦的大力支持,目標是建成國家級古籍整理與數(shù)字化綜合服務(wù)平臺。平臺將專業(yè)內(nèi)容和智能技術(shù)相結(jié)合,聚合了以古籍整理為核心,以知識服務(wù)為脈絡(luò)的各類數(shù)字化產(chǎn)品。旗下專題數(shù)據(jù)庫主題多樣,資源體量達40 億字,涵蓋古籍文獻、學術(shù)研究、文化藝術(shù)等各種類型,全面滿足當下多元化、專業(yè)化的用戶需求。
除了“中華經(jīng)典古籍庫”,以知識服務(wù)為主旨的條目型數(shù)據(jù)庫——“中華古籍書目庫”“歷代進士登科數(shù)據(jù)庫”“歷代石刻專目總目數(shù)據(jù)庫”等,發(fā)揮結(jié)構(gòu)化數(shù)據(jù)優(yōu)勢,為用戶提供完備、準確、實用的信息服務(wù);以各類型石刻文獻為主體的石刻數(shù)據(jù)庫——“中華石刻數(shù)據(jù)庫”及系列子庫,與整理者通力合作,打造集歷史資料與學術(shù)研究成果于一身的石刻專題數(shù)據(jù)庫;專業(yè)文化藝術(shù)類數(shù)據(jù)庫——“中華書法數(shù)據(jù)庫”“中華木版年畫數(shù)據(jù)庫”等,全面收錄歷代書法作品及木版年畫資源,圖像清晰,并輔以文字著錄,能夠為相關(guān)研習者提供有價值的研究資料。
此外,“籍合網(wǎng)”還與學者合作,打造了包括“殷墟甲骨文數(shù)據(jù)庫”“現(xiàn)代漢譯文學編年考錄數(shù)據(jù)庫”等在內(nèi)的多款專題性數(shù)據(jù)庫產(chǎn)品,以數(shù)字出版形式發(fā)揮學術(shù)成果優(yōu)勢,彌補紙質(zhì)出版的不足。
迄今為止,“籍合網(wǎng)”平臺已擁有國內(nèi)機構(gòu)用戶100余家、海外用戶40 余家、個人注冊用戶22 萬人。
字符類型多樣、字際關(guān)系復雜、終端需求不同、生僻字繁多是古籍數(shù)字化工作時時面對的問題,主動開展字符集整理與規(guī)范工作,是解決古籍排版、數(shù)據(jù)庫字符呈現(xiàn)、智能處理工具研發(fā)等系列問題的必要措施。為此,在古籍資源建設(shè)的同時,古聯(lián)公司專門開發(fā)了“中華書局宋體字庫”及“梵文悉曇體字庫”“甲骨文摹寫字庫”等專門字體,收錄超過15 萬字符,用于解決古籍中各類楷書生僻字及甲骨文、金文、小篆、梵文等特殊字符的在線檢索和顯示問題。
為了更好地保證古籍數(shù)字化的質(zhì)量,古聯(lián)公司制定了《數(shù)據(jù)加工流程總規(guī)范》《XML 數(shù)據(jù)整理工作規(guī)范》《元數(shù)據(jù)規(guī)范》《圖像采集規(guī)范》《文字采集規(guī)范》等26 種數(shù)據(jù)加工及技術(shù)開發(fā)標準,規(guī)范業(yè)務(wù)生產(chǎn)流程。2020 年10 月,古聯(lián)公司“古籍數(shù)字化標準體系的建設(shè)與應(yīng)用”榮獲中國質(zhì)量協(xié)會頒發(fā)的質(zhì)量技術(shù)獎二等獎。
這些標準已經(jīng)成為多家出版社古籍數(shù)字化出版的應(yīng)用標準,為后續(xù)國家古籍數(shù)字化工程的開展提供了支持。
古聯(lián)公司擁有專業(yè)的古籍數(shù)字化技術(shù)與研發(fā)能力,設(shè)立了專門的技術(shù)部門和大數(shù)據(jù)中心,研究古籍整理、編輯、出版的自動化問題。
為改善傳統(tǒng)古籍整理工作大量消耗人力、時間成本等問題,古聯(lián)公司以古籍整理和古籍數(shù)字化的基礎(chǔ)工作為線索,研發(fā)了數(shù)款古籍智能在線整理工具。目前已經(jīng)投入使用的技術(shù)包括:面向古籍整理和專業(yè)出版的自動標點、繁簡轉(zhuǎn)換、命名實體識別、引文核對及融合多技術(shù)于一體的文達編校系統(tǒng);應(yīng)用于古籍數(shù)字化生產(chǎn)的古籍OCR、在線XML 編輯器、元數(shù)據(jù)著錄編輯器等。結(jié)合“籍合網(wǎng)”數(shù)據(jù)庫使用場景,平臺還提供了包括字符查詢、紀年換算、字庫、輸入法一系列輔助研究的專業(yè)工具,向用戶免費開放。
為解決古籍數(shù)據(jù)編校工作量大、專業(yè)化程度高的問題,古聯(lián)公司建立了專門的古籍整理眾包平臺及“i 編纂”小程序。自2018 年上線服務(wù)以來,積累了近5000 人的在線古籍編校隊伍,發(fā)布任務(wù)42976 個,處理14.84 億字,為多個大型古籍整理出版項目、地方文庫編纂項目提供編校力量支持,極大地加速了項目進展。
古聯(lián)公司總經(jīng)理洪濤表示:“這些技術(shù)工具與眾包平臺相結(jié)合,在古籍數(shù)字化整理和編輯過程中爆發(fā)出巨大能量,極大地提高了古籍工作效率?!?/p>
古聯(lián)公司2022 年加快了發(fā)展的步伐,通過一系列新的嘗試,大力推進出版融合發(fā)展,促進古籍內(nèi)容普及傳播。
2022 年1 月,古聯(lián)公司推出了專業(yè)的古籍整理培訓平臺——籍合學院提供視頻資源庫、在線學習及教學、題庫、考試、項目管理、認證等多場景功能。籍合學院的建立初衷,一是希望將籍合網(wǎng)的古籍數(shù)字化整理的工作機制與培訓業(yè)務(wù)深度整合,解決線上整理的人才培養(yǎng)問題。二是為高校提供線上課程資源,輔助教學,同時發(fā)力職業(yè)教育,響應(yīng)業(yè)界呼聲,為古籍編輯提供繼續(xù)教育服務(wù)。目前籍合學院累計策劃課程已超過300 課時,課程數(shù)量超過60 門,已上線100 余課時,參與洽談合作的教師有上百位,均為古籍整理及出版界成績卓著的學者、編輯。同時,籍合學院還發(fā)布了兩期中華書局古籍整理訓練營,得到了眾多古籍整理愛好者的積極響應(yīng),報名學員遍及高校教師、學生、職業(yè)編輯等各行各業(yè)。
此外,古聯(lián)公司打造的中華優(yōu)秀傳統(tǒng)文化經(jīng)典音頻——中華書局經(jīng)典之聲,目前已逐步在喜馬拉雅上線,為讀者增添了一個學習古代經(jīng)典的新渠道。而通過數(shù)字科技實現(xiàn)千年歸來的“3D 超寫實數(shù)字人蘇東坡”,未來將會逐步參與到數(shù)字出版創(chuàng)新、文化普及教育、城市文化宣傳、數(shù)字形象代言、數(shù)字文旅賦能、數(shù)字虛擬演藝、沉浸場景構(gòu)建乃至國際傳播等全新場景中去。
“路漫漫其修遠兮”,如何讓古籍活起來,如何讓中華優(yōu)秀傳統(tǒng)文化傳下去?古聯(lián)公司正在融合創(chuàng)新之路上奮力書寫新篇章?!?/p>