邢明旭
中文在線將與CBDB項目組共同打造中國古籍數(shù)據(jù)的數(shù)字人文資源平臺,重構古文獻研究服務新脈絡。
不少重要時刻的誕生都緣自不經(jīng)意的邂逅。正如2017年的深秋,大洋彼岸的美國哈佛大學校園內,一位中國訪學者與美國教授的一次偶然相遇,不僅讓兩人成為志同道合的好友,更讓CBDB(中國歷代人物傳記資料庫)走進了中文在線董事長兼總裁童之磊的視野,并幫助這一由海外學者牽頭、歷時30余年打造的中國歷史人文寶庫得以漂洋過海,普惠更廣泛的用戶。
剛剛過去的3月,這一愿景在初春的上海迎來了它抽枝發(fā)芽的一刻。中文在線數(shù)字出版集團股份有限公司董事長兼總裁童之磊、哈佛大學費正清中國研究中心包弼德教授、北京大學中國古代史研究中心史睿博士齊聚滬上,共同簽署了CBDB(中國歷代人物傳記資料庫)項目合作協(xié)議。在不久的將來,中文在線將與CBDB項目組共同打造中國古籍數(shù)據(jù)的數(shù)字人文資源平臺,重構古文獻研究服務新脈絡,并運用人工智能技術,提高處理歷史資料的效率和準確度,聚合更多主題并不斷優(yōu)化用戶體驗。
“CBDB是現(xiàn)今數(shù)字人文(Digital Humanities)技術發(fā)展過程中的前沿成果,這與從誕生之初便以數(shù)字傳承文明為使命的中文在線的愿景不謀而合。過去,中文在線主要在大眾出版、教育出版兩個領域謀篇布局。與CBDB的合作,則象征著中文在線在專業(yè)出版邁出的第一步。”童之磊指出,“中文在線有使命去推動CBDB的發(fā)展和傳播,與更多有志于傳承中華文明的同伴共建數(shù)字人文的新未來?!?/p>
緣起哈佛
在童之磊看來,人類文明和文化產(chǎn)品的發(fā)展經(jīng)歷過三個階段。在經(jīng)歷了上世紀90年代從傳統(tǒng)紙媒向數(shù)字化內容的轉換后,如今人類文明的存續(xù)已經(jīng)進入了全新的階段——數(shù)字人文時代。
相較于單純的紙本數(shù)字化,數(shù)字人文時代有何獨特之處?“數(shù)字人文是用數(shù)字化的方式將人文資料進行重構,利用大數(shù)據(jù)、神經(jīng)網(wǎng)絡分析等數(shù)字技術,構建新的人文體系,這是未來非常重要的趨勢?!蓖诟嬖V《出版人》?!捌浯危瑪?shù)字人文時代充分發(fā)揮信息技術的優(yōu)點,跨越時空,對過去的人文資料進行高效的處理。這樣的重構還創(chuàng)造了很多新的可能性,比如過去鮮有人考慮到的人文資料和地理信息的結合。所有這些,都讓我們得以看到全新的人文浪潮席卷而來?!?/p>
從2000年創(chuàng)辦以來,中文在線在過去的18年間成為了大量中國經(jīng)典作品的傳播平臺,這其中包括巴金、莫言等文學巨匠的作品,也包括季羨林、啟功等人文社科領域的大家之作。而在童之磊看來,未來中文在線很重要的一步便是在數(shù)字人文方面持續(xù)推進。
“在這個過程中,我特別榮幸地在過去一年的哈佛大學訪學期間認識了包弼德教授,并深深地為他和CBDB項目組多年來的努力所折服?!蓖诟嬖V《出版人》。
在包弼德教授的介紹下,童之磊對于CBDB有了深入的了解。據(jù)悉,CBDB是由哈佛大學費正清中國研究中心、北京大學中國古代史研究中心、中研院歷史語言研究所共同主持的學術數(shù)據(jù)庫,該項目旨在將計算機技術與人文社會科學相結合,系統(tǒng)性地對中國歷史上所有重要的傳記資料進行數(shù)字化處理,以便采用社會科學方法研究中國歷史。研究人員可以通過檢索人物ID或人名(漢字或拼音),返回豐富的結構化人物傳記資料(生卒、別名、地理信息,任官、親屬關系、社會關系等),即在以傳統(tǒng)感性為主的人文學科研究基礎上引入理性技術手段,將定量分析與定性分析融為一體,輸出可視化的成果。截至目前,該數(shù)據(jù)庫共收錄超過41萬人的傳記資料。
“CBDB體量之龐大、內容之深入讓我印象深刻,客觀來講,之前在國內鮮有類似的以人物傳記構建的中國歷史文化數(shù)據(jù)庫?!蓖诟嬖V《出版人》,而更加令他感到震撼的則是包弼德接手CBDB背后的原因。“包弼德教授告訴我,在他學習世界歷史時,中國是19世紀才出現(xiàn)的,該過程似乎就像人們發(fā)現(xiàn)了一個世界文明的旁支。這令包弼德教授非常震動,中國這樣一個幾千年沒有中斷的文明,卻在西方的世界史研究架構當中出現(xiàn)如此之晚,且份量如此之輕。正是基于此,包弼德教授決定接受并延續(xù)CBDB的生命,讓更多的人了解中國的歷史和文化?!?/p>
“中文在線誕生以來的愿景,就是數(shù)字傳承文明。很快我便認定,中文在線有使命來推動CBDB這項對中華文明意義重大的工程的發(fā)展和傳播?!?/p>
助推CBDB普惠大眾
牽手后,中文在線將為CBDB注入怎樣全新的活力?在采訪中,童之磊和中文在線研發(fā)中心常務副總經(jīng)理朱厚權向記者做了詳細的介紹。
“首先很重要的一點,便是CBDB的大眾化?!蓖谡f?!爱斍癈BDB項目成果的使用對象主要是非常專業(yè)的科研人員,在易用性、合理化、友好性等方面還存在相當大的升級空間,這也是中文在線承接這個項目后首先要改進和升級的地方?!?/p>
“很重要的一個工作,便是增加簡體版和拼音版?!敝旌駲嘌a充道。“另外,去年清華附小四年級學生利用大數(shù)據(jù)研究蘇軾并寫出一系列論文的事件受到社會的關注,中文在線也和該校老師進行了交流,設想如果在當時有CBDB這樣的數(shù)據(jù)庫可以提供給學生,類似的研究便會非常方便?!敝旌駲嗾f?!傲硪环矫妫瑪?shù)字人文研究人員需要大量基于B/S的定量和定性分析工具,以解決網(wǎng)絡資源和本地資源的組合利用困境,因此為研究人員提供豐富、多樣、易操作的分析工具、接口和方法也是重點?!?/p>
其次,便是多方關注的商業(yè)化?!癈BDB過去更多地以非商業(yè)化的方式發(fā)展。這有其優(yōu)點,卻也使其面臨如何持續(xù)、穩(wěn)定發(fā)展的挑戰(zhàn)?!蓖谥赋觯裉烊祟愇拿鞯陌l(fā)展很大程度上是和商業(yè)文明的發(fā)展并行的,沒有商業(yè)文明的發(fā)展,不可能出現(xiàn)像蘋果手機這樣集合高科技和人性化于一體的優(yōu)秀產(chǎn)品,正是因為商業(yè)的推動,很多科學技術才得以廣泛地被使用,并產(chǎn)生巨大和持久的生命力。“中文在線要做的,就是把CBDB進行增值開發(fā),為用戶帶來更大的價值,相信用戶也愿意因此付費?!卑龅陆淌谝矊Υ舜蜟BDB牽手中文在線提出了自己的想法?!皩W者沒有能力進行商業(yè)運作,但‘中文在線可以。他們把學者打造的數(shù)據(jù)庫,變成所有人都可以利用的工具,這點非常重要。這樣學者就可以專注于學術,讓商業(yè)和學術各自去完成擅長的部分?!?/p>
最后的落腳點則是創(chuàng)新。童之磊指出,中文在線希望在CBDB數(shù)據(jù)庫中,重構古文獻研究服務新脈絡,創(chuàng)造研究歷史人文的全新坐標體系。“通過時間、地點、人物三個維度,打造史學的三維研究空間,當我們確定三個坐標,便可以聚焦到每個事件,這是非常有意義的新型研究模式?!?/p>
而在具體落地方面,“我們一方面將努力擴大CBDB在國內的應用范圍,并引入更多圖書館領域的合作方,充實CBDB數(shù)據(jù)庫內容資源;二是提供一定的科研支持,吸引更多高端學術人才加入CBDB項目組;三是將CBDB的成果分用戶層級地展示給不同的用戶,如可以單獨制作中小學傳統(tǒng)文化教育中涉及的重要歷史人物庫,以方便中小學生用好、學好相關知識?!敝旌駲喔嬖V《出版人》。
對于CBDB的商業(yè)化引入,同時身為共建方和使用者的北京大學相關負責人也在接受《出版人》采訪時談及了自身的理解?!霸趥鹘y(tǒng)的史學研究領域中,‘數(shù)字人文還沒有得到廣泛應用;而與中文在線合作后,除了希望把以前的工作做得更深入之外,也期待CBDB加入更標準化、更通用的工具,建成完善的‘網(wǎng)絡基礎設施,使數(shù)據(jù)庫除了在學術上應用以外,也能推向公眾,讓普通人也更方便地了解中國歷史人物的事跡、著作、生平等?!北本┐髮W中國古代史研究中心副所長史睿如是說。
北大圖書館副館長聶華表示,CBDB數(shù)據(jù)庫在圖書館界久負盛名,是中國歷史資料數(shù)據(jù)庫的鼻祖,從各個方面來講本次引入都很有意義,國內高校圖書館及公共圖書館對其的需求也毋庸置疑。而作為用戶代表,面對數(shù)據(jù)庫的商業(yè)化,聶華認為“從理智的角度看,商業(yè)化是正確的選擇。多年來,各方專家學者團隊,包括中文在線接手以來,都在該項目上投入了大量的人力和財力資源。商業(yè)化能夠更好地維持CBDB繼續(xù)健康地發(fā)展下去”。但聶華同時也指出,就最終的目的而言,希望能夠讓CBDB開發(fā)者、企業(yè)、使用者三方共贏,“只有共贏才是真正可持續(xù)的模式。”
在童之磊未來的愿景中,未來重新構建后的CBDB不僅面向國人,更要面向世界。“讓全球無數(shù)有尋根訴求的華人以及對中華歷史文明感興趣的人們受惠,一起擁抱數(shù)字人文的新未來?!蓖谡f。