據(jù)島內“中央社” 等新聞媒體報道臺灣﹃中研院﹄的數(shù)位數(shù)據(jù)庫已開放并以申請會員制方式開放島內免費授權使用
這套系統(tǒng)是由臺灣“中研院”歷史語言研究所︵簡稱史語所︶組織建立的史語所是著名的史學研究資料的重地以嚴謹扎實豐厚而著稱現(xiàn)有專任研究人員五十多人分四個學術組九個專題研究室六個工作室其︽中央研究院歷史語言研究所集刊︾傅斯年圖書館數(shù)位數(shù)據(jù)庫在史學界是非常有影響力的
傅斯年圖書館最早建立于一九二八年一九四九年遷到臺灣一九六〇年在美國的援助下興建了現(xiàn)在依舊使用的四層建筑并為紀念史語所的已故所長傅斯年先生(曾任)由胡適之先生將其命名為傅斯年圖書館此館收藏范圍以歷史學語言學文字學人類學以及古籍考訂學為主有關中國古科技史文獻生命醫(yī)學文獻亦甚豐富當下館藏總計約七十多萬冊檔案二萬余件(人物檔案包括手稿照片信件)期刊報紙三千多種現(xiàn)刊一千多種對俗文學資料的收藏是其館藏極具特色的一部分有一萬二千件二萬余目時間上溯至清乾隆年間地域遍及全中國至二〇〇四年八月已被數(shù)據(jù)庫收錄完畢
已經(jīng)建立并開放的數(shù)位數(shù)據(jù)庫則是﹃中研院史語所珍藏歷史文物數(shù)位化典藏計劃﹄的具體實施上世紀八十年代中期由史語所和傅斯年圖書館著手進行他們運用數(shù)位化方式重新整理珍貴的典藏文物“期望透過嶄新的研究平臺跨越時空與地域提供漢學界更豐富優(yōu)質的研究素材”到去年底史語所將多年來典藏的考古資料 (包括殷墟兩周考古及臺灣考古)拓片與古文書 (含甲骨文拓片青銅器拓片佛教造像拓片遼金元拓片漢墓畫像拓片居延漢簡)善本圖書中國西南少數(shù)民族文物明清兩朝檔案等整理成包括“漢籍電子文獻”“內閣大庫檔案﹄等十六個典藏數(shù)據(jù)庫暨系統(tǒng)僅“漢籍電子文獻”就包含整部二十五史整部阮刻十三經(jīng)超過兩千萬字的臺灣史料一千萬字的大正藏以及其他典籍合計字數(shù)一億三千萬字并以每年至少上千萬字的速率增長
這十六個數(shù)據(jù)庫總計提供近四億字史料電子全文一百多萬面數(shù)位影像五十六萬多筆收藏文物的數(shù)據(jù)等信息目前它是“迄今最具規(guī)模的中文古籍數(shù)據(jù)庫也是目前網(wǎng)絡中資料整理最為嚴謹?shù)闹形娜臄?shù)據(jù)庫”比如“二十五史”所選用的錄入底本是臺灣鼎文公司翻印的大陸中華書局點校本(臺灣稱為“新校本”)多名臺灣學者參與了校訂工作每部史籍都經(jīng)過至少四次校閱
在正式開放之前此數(shù)位數(shù)據(jù)庫已做了四年多的測試性開放使用人次總共累計達十九萬人次點閱次數(shù)超過六百八十萬次平均每天都有超過四千六百次的點閱記錄據(jù)豆瓣網(wǎng)“愛讀書的熊”特別推崇在“漢籍電子文獻”的一級欄目最后有一個不太引人注目的“人文資料庫師生版”是為普及文史教育而向臺灣大中小學師生免費開放的其中包括了許多文史研究的重要典籍占整個漢籍資料庫文獻的一半
另外史語所創(chuàng)所以來的文書檔案包含了人事采購公務信件工作計劃工作報告會議記錄等一九九六年開始整理現(xiàn)已進入“檔案數(shù)位化典藏計劃”
特別值得重視的是陳國棟(史語所研究員兼傅斯年圖書館主任)林妙樺(史語所傅斯年圖書館館員)于二〇〇四年在中科院牽頭主辦的“兩岸三院信息技術應用與交流研討會”上提請注意數(shù)位典藏系統(tǒng)一是建制多元平臺以提供多元服務比如整合串連各種檢索系統(tǒng)之數(shù)據(jù)再以跨平臺之電子出版型態(tài)進行出版二是數(shù)位典藏系統(tǒng)的各項經(jīng)驗傳承強調隨著數(shù)據(jù)量擴增更需經(jīng)驗的傳承否則系統(tǒng)的后續(xù)維護及運作效能也將大受影響他們提出在數(shù)位典藏工作的規(guī)劃中一要考慮多元媒體的儲存機制比如無論用何種媒體都必須考慮其保存年限及儲存環(huán)境等問題數(shù)字媒體更需考慮其改版或升級等相關問題二要依其保存及使用年限予以定期重制以避免因檔案毀損或規(guī)格變更等情況而影響數(shù)位影像的儲存及讀取三要異地儲存可預防一旦發(fā)生災難則仍難逃無典藏備份的后果四是對原件數(shù)位化也不得減少其維護和修復費用因為數(shù)位化復制品對于研究者而言仍無法取代原始典藏