張蓋倫
國(guó)家古籍?dāng)?shù)字人文建設(shè)成績(jī)喜人。兩個(gè)古籍?dāng)?shù)據(jù)庫于2月8日在國(guó)家圖書館同步發(fā)布:一個(gè)是“《永樂大典》高清影像數(shù)據(jù)庫”,一個(gè)是“《國(guó)家珍貴古籍名錄》知識(shí)庫”。
《永樂大典》是明成祖(朱棣)永樂年間編纂的一部大型百科全書,其副本目前僅發(fā)現(xiàn)有400余冊(cè)800余卷及部分零葉存世,總數(shù)不及原書的4%。國(guó)家圖書館共收藏《永樂大典》224冊(cè),占存世《永樂大典》的一半以上。這一數(shù)據(jù)庫在互聯(lián)網(wǎng)環(huán)境下以可交互、可視化的方式向大眾傳播古籍知識(shí),它展現(xiàn)了以數(shù)字人文手段實(shí)現(xiàn)古籍活化的技術(shù)路徑,實(shí)現(xiàn)了古籍的創(chuàng)造性轉(zhuǎn)化和創(chuàng)新性應(yīng)用。
項(xiàng)目第一輯收錄國(guó)家圖書館藏《永樂大典》四十冊(cè)、七十五卷的內(nèi)容,共涉及14個(gè)韻部、17個(gè)韻字、1800部書,除呈現(xiàn)《永樂大典》高清圖像、整體風(fēng)貌及相關(guān)知識(shí)外,還嘗試對(duì)部分大典內(nèi)容做了知識(shí)標(biāo)引示范,為后續(xù)《永樂大典》的知識(shí)體系化、利用智能化進(jìn)行探索。
國(guó)家圖書館(國(guó)家古籍保護(hù)中心)聯(lián)合北京大學(xué)數(shù)字人文研究中心研發(fā)的“《國(guó)家珍貴古籍名錄》知識(shí)庫”,包含了已批準(zhǔn)公布的六批《國(guó)家珍貴古籍名錄》,還收錄了《國(guó)家珍貴古籍名錄圖錄》中包含的書影圖像、說明文字內(nèi)容。該項(xiàng)目綜合應(yīng)用現(xiàn)有數(shù)字人文的多項(xiàng)技術(shù),將珍貴古籍名錄書目數(shù)據(jù)重構(gòu)為知識(shí)庫,以多維度知識(shí)圖譜、GIS等多種可視化形式展示歷史時(shí)空構(gòu)架下書與書、書與人、人與人之間的多維關(guān)系。
在古籍?dāng)?shù)字化工作中,人工智能也將成為新常態(tài)。假如讓類似的人工智能學(xué)習(xí)浩如煙海的中華歷史典籍,它能成為一個(gè)擁有中華智慧的“人”嗎,如果大家跟它聊天會(huì)怎樣?“我們古籍?dāng)?shù)字化的目標(biāo)還可以定得更高一些?!毕嚓P(guān)專業(yè)人士說。
(來源:科技日?qǐng)?bào))