文/李濤
我國的中文古籍數(shù)字信息專業(yè),相對其他專業(yè)比較冷門[1]。但是,當前社會已經(jīng)進入以信息為重要資源的時代,對于我國中文古籍的保護工作,也邁入新的階段,因此對于我國中文古籍數(shù)字信息專業(yè)人員,在我國將來,也會擁有良好的就業(yè)前景[2]。在國外,于20 世紀60 年代末,對信息專業(yè)作為研究方向,70 年代提出信息門類,80 年代中期,對信息作出了明確的定義,80年代末,信息專業(yè)迅速擴展;但是,當時的信息專業(yè)多為計算機信息、信息管理等方面專業(yè),在21世紀的今天,國外也未曾有人將古籍信息專業(yè)納入其中[3]。20 世紀70 年代后期,國內(nèi)將國外的信息專業(yè)概念引進學界,紛紛仿效國外建立信息專業(yè),隨著數(shù)字技術(shù)的到來,古籍數(shù)字信息專業(yè)也隨之建立[4]。但是隨著時間的推移,對于國內(nèi)建立的古籍數(shù)據(jù)信息專業(yè),其人員就業(yè)發(fā)展方向,卻受到了一定的限制,為此提出我國中文古籍數(shù)字信息專業(yè)人員未來求職發(fā)展方向這一課題。
古籍數(shù)字信息化,是社會發(fā)展的必然成果,也是為了保護古籍的完整性、推動學術(shù)研究的必要手段。因此在采用數(shù)字化的方式,保護我國古籍時,必然會面臨格式性問題。而這個問題,就是中文古籍數(shù)字信息專業(yè)人員未來求職發(fā)展方向。
在以往,對于中文古籍的保護,多是采取掃描、識別轉(zhuǎn)換成數(shù)字文本,存儲至計算機的數(shù)據(jù)庫中,但是對于學者來說,卻存在很大的困擾,尤其是我國中文古籍,存在異同版本、不同注釋語句、人名地名讀法不一等區(qū)別[5]。所以,中文古籍數(shù)字信息專業(yè)人員,在求職發(fā)展時,可以通過規(guī)范古籍數(shù)字化的元數(shù)據(jù)標準,方便數(shù)字化中文古籍的索引。在規(guī)范古籍數(shù)字化的元數(shù)據(jù)標準時,未曾學習過古籍的人員,難以制定出讓所有學者認可的標準。而只學習古籍的人,不具有數(shù)字化信息技術(shù),難以將古籍轉(zhuǎn)換成數(shù)字信息,因此這份工作也只有中文古籍數(shù)字信息專業(yè)人員,才可以勝任。
古籍學習人員與數(shù)字化信息人員的結(jié)合,可以直接為古籍制定統(tǒng)一的標準,并建立專業(yè)的元數(shù)據(jù)庫,為學者提供專業(yè)的信息資源,為與其他信息系統(tǒng)的對接和共享數(shù)據(jù)提供必要的接口。所以,中文古籍數(shù)字信息專業(yè)人員,可以研制統(tǒng)一的版本信息、收藏信息、作者信息和作品信息,并在元數(shù)據(jù)庫中,進行統(tǒng)一的標準,幫助學者查找、搜索所需要的古籍,為古籍的保護,提供堅實的支柱。
古籍在轉(zhuǎn)化成數(shù)字信息時,不僅需要規(guī)范古籍版本信息、收藏信息、作者信息和作品信息等,還需要在計算機上,確定相應的古籍圖片、文檔格式。且在存儲古籍的過程中會涉及產(chǎn)權(quán)等問題,因此更需要專業(yè)的數(shù)字化格式制定員,制定與古籍相適應的數(shù)字化格式。尤其是當前的數(shù)字格式種類多樣、名目繁多[6]。因此,更需要專業(yè)的中文古籍數(shù)字信息專業(yè)人員,根據(jù)古籍的特點,制定與古籍相適應的數(shù)字化格式。
不過,當前種類多樣、名目繁多的數(shù)字格式,對于數(shù)字化古籍的查閱,卻是一大障礙,因此,中文古籍數(shù)字信息專業(yè)人員,在制定古籍數(shù)字化格式時,還需要與相關的開發(fā)公司,研究可兼容其他文檔格式的APP,解決當前古籍由于格式信息原因不能統(tǒng)一查閱的問題。但是,從長遠角度來說,中文古籍數(shù)字信息專業(yè)人員,還是需要與業(yè)界主要機構(gòu)相聯(lián)合,制定出適合所有古籍的文件格式,且這個格式,不僅可以儲存簡體版本,還要儲存古籍的繁體版本。除此之外,由于古籍的讀音存在大量的同音不同義、象形字等,所以,該格式還需要具有對古籍進行漢語拼音標注的功能,保證古籍的科學性、嚴謹性和規(guī)范性。
另外,數(shù)字化格式制定員所制定的古籍數(shù)字化格式,還應該具有全文搜索的功能。尤其是目前,人們之所以喜歡數(shù)字化形式的文檔,眾多原因之一就是數(shù)字化文檔搜索速度快。一旦數(shù)字化格式制定員,所制定的古籍數(shù)字化格式不具有這個特點,很難形成較大的用戶群,提高古籍的使用率和保護效果。最后,對于古籍數(shù)字化格式文檔,檢索所制定的字詞需要予以凸顯或標記,以便學者在文檔內(nèi)檢索古籍時可以更加簡便快捷。上述這些,都是數(shù)字化格式制定員,在制定古籍數(shù)字化格式時,所必須具有的性質(zhì)和功能。
除了上述的文字方面格式外,古籍中還含有大量的圖片,與文字相互呼應。因此,數(shù)字化格式制定員,還需要將古籍原本的圖片與數(shù)字化的古籍文字相對應,增加數(shù)字化古籍的科學性和可信賴性。當前,我國對于圖形圖像的處理,雖然發(fā)展較為成熟,且圖片格式的種類、形式,并不遜色于文檔格式,也具備較強的可壓縮性。但是,處理古籍文獻時,所需要處理的圖片是海量的,其所要面對的是計算機運行和儲存問題,將會成為數(shù)字化格式制定員,未來所需要面對重點問題,即制訂出具有較高壓縮比,且圖片清晰,可以再現(xiàn)古籍圖片的原始風貌。
從上述兩種未來求職發(fā)展的情況來看,僅站在古籍保護角度,在這種角度下,對于古籍資源的開發(fā),僅僅只是比原本的圖片閱覽前進一步,存在很大的局限性。特別是針對古籍版本、句讀、偏僻字注釋、人名地名的標引等,不同的古籍都會存在一定的異同,且浩瀚的古籍資源,由于內(nèi)容、歷史發(fā)展、使用方向等眾多原因,都被分散保存在許多各不相關的部門[7],在數(shù)字化的過程中,對于古籍規(guī)范化和格式化又面臨著新的問題。因此中文古籍數(shù)字信息專業(yè)人員,可以從開發(fā)數(shù)字化古籍特色資源發(fā)展發(fā)現(xiàn)入手,深入研究“通鑒、續(xù)通鑒等” 特色收藏古籍,并不斷與精通古籍整理專業(yè)的學者,共同商討古籍的數(shù)字化特色資源開發(fā),突出每一本古籍自己的特色,從而為古籍的規(guī)范化和數(shù)字化格式奠定基礎。
而對于中文古籍數(shù)字信息專業(yè)人員,其所具有的現(xiàn)代化科技手段及其對古籍的了解都是其他合作式整理古籍、開發(fā)古籍人員所不能媲美的,只有同時掌握古籍和現(xiàn)代信息化知識,才能開展古籍研究和開發(fā)工作。應用統(tǒng)一的古籍分類法,指出開發(fā)出具有數(shù)字化特色資源的古籍。
當前,我國古籍漢字眾多,且當前的計算機所儲存的漢字不過是當前常用字,對于古籍中漢字的處理頗顯不足,這已經(jīng)成為古籍數(shù)字化的一大障礙。因此,中文古籍數(shù)字信息專業(yè)人員,所掌握的古籍知識和現(xiàn)代化信息技術(shù),完全可以勝任漢字字符代碼集完善這一工作,加快漢字字符代碼集完善進程。
尤其是我國眾多學者,都在致力于漢字字符代碼集的制定,從最早的《信息交換用漢字編碼字符集基本集》所具有的6763 個漢字,到現(xiàn)在計算機已經(jīng)收錄65,531 個漢字字符,更是為當前古籍數(shù)字化奠定良好基礎。雖然,目前包含六萬余字符的超大字符集,對于古籍數(shù)字化處理仍嫌不足。因此漢字字符代碼集完善人員將會成為中文古籍數(shù)字信息專業(yè)人員,未來求職發(fā)展的眾多方向之一。
古籍數(shù)字化數(shù)據(jù)庫,牽涉到IT 和古籍研究兩個領域人才,而中文古籍數(shù)字信息專業(yè)人員,卻是兩個領域的結(jié)合,雖然所學眾多,存在研究不足、深度不夠等問題,但是對于古籍數(shù)字化的研究卻是正合適的。因此,對于中文古籍數(shù)字信息專業(yè)人員,其未來求職發(fā)展方向之一,就是古籍數(shù)字化專題分類。
在目前對古籍的研究下,古籍數(shù)字化發(fā)展已經(jīng)具有專題專項發(fā)展趨勢。在學術(shù)層面,即是將與這個古籍相關的專題全部羅列出來,如目前正在建設專題分類的“《紅樓夢》研究資料數(shù)據(jù)庫”,在數(shù)字化存儲中就可以將這個領域和文獻全部網(wǎng)羅進來,并在此基礎上對該領域中的標點、作者簡介、時代劃分、體裁歸類等進行詳細的劃分,從而提高古籍資料查找的速度。此時,就需要中文古籍數(shù)字信息專業(yè)人員,具有研究技術(shù)標準、發(fā)展方向、選題設置、學科應用等問題的能力。將古籍數(shù)字化專題分類做出專業(yè)的規(guī)劃,促使古籍數(shù)字化交叉學科得到快速發(fā)展。
此次研究從古籍保護角度入手,以學者資料尋找和古籍資料互通角度為輔,研究中文古籍數(shù)字信息專業(yè)人員未來求職發(fā)展方向。但是,此次研究未曾深入考慮古籍數(shù)字化信息專業(yè)人員對古籍知識和數(shù)字化信息技術(shù)的掌握程度。因此,在今后的研究中,還需深入研究古籍數(shù)字化信息專業(yè)人員所需要學習的專業(yè)知識,根據(jù)學習內(nèi)容,為古籍數(shù)字化信息專業(yè)人員尋找合適的求職發(fā)展方向。