亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        館藏中醫(yī)古籍數(shù)字化的若干細節(jié)問題探討

        2015-04-29 00:00:00張偉娜等
        醫(yī)學信息 2015年15期

        摘要:本文結合我館在中醫(yī)古籍數(shù)字化工作中的實際情況,對選書過程、掃描過程和檢索系統(tǒng)建立過程中的若干細節(jié)問題進行逐一分析探討,介紹了我館在處理這些問題的具體方法和經驗。

        關鍵詞:中醫(yī);古籍;數(shù)字化

        隨著計算機技術的快速發(fā)展,古籍數(shù)字化已經成為古籍文獻保護和利用的重要手段。采用數(shù)字化技術對中醫(yī)古籍進行搶救整理,既能使這些珍貴文化遺產原書原貌得到永久保存,又可以通過網絡使這批珍貴文化遺產不受地域和時空等的限制,及時迅速地提供給廣大研究人員和其他使用者。

        中醫(yī)古籍數(shù)字化,就是利用數(shù)字化技術將中醫(yī)古籍進行掃描、文字識別與轉換或錄入,并經專門軟件使之結構化,制作出新的電子版中醫(yī)古籍。數(shù)字化的中醫(yī)古籍可用計算機進行方便的檢索與閱讀,也可在網絡上傳輸、共享。我館自2001年開始先后建立館藏中醫(yī)古籍的書目檢索數(shù)據(jù)庫和中醫(yī)古籍閱覽管理系統(tǒng),實現(xiàn)中醫(yī)古籍書目和內容檢索。目前我館的中醫(yī)古籍數(shù)字化工作已有了很大進展,但是也仍然存在許多問題。本文按照數(shù)字化加工的流程,對其中的若干細節(jié)問題進行探討。

        1 選書過程中的問題

        1.1學術價值高和版本精良的中醫(yī)古籍應優(yōu)先數(shù)字化 現(xiàn)存歷代中醫(yī)古籍品種數(shù)量眾多,版本和流傳情況復雜。例如:《中國中醫(yī)古籍總目》收錄了中醫(yī)古籍13455種,大部分古籍都有兩個以上的版本,有的甚至多達幾十個版本。因此中醫(yī)古籍數(shù)字化工作應該先對其中學術價值高、版本精良的中醫(yī)古籍進行搶救保護,可以制定具體的中醫(yī)古籍數(shù)字化選目標準,注重中醫(yī)古籍保護與利用的雙重目的。

        1.2沒有必要對所有館藏古籍都進行數(shù)字化 我館的館藏中醫(yī)古籍書目數(shù)據(jù)庫,共有1萬多條數(shù)據(jù)。我們在進行數(shù)字化工作時,沒有必要對每本書都進行數(shù)字化。這是因為以下方面。1.2.1每種古籍往往存在多種版本,版本情況復雜多樣。這些版本中,有的是不同的刻板印出來的,有的是相同的刻板印出來的,只是收藏者或年代不一樣而已。對于前者,可以對版本精良的中醫(yī)古籍進行優(yōu)先處理,其它版本可以依據(jù)平時使用的情況進行數(shù)字化,這樣在版本校對時也可以使用。對于后者,也稱之為\"副本\",這種情況只要選擇其中一種保存比較完好的來掃描即可。

        1.2.2國內中醫(yī)圖書館普遍經費有限,而且數(shù)字化的過程需要一定的時間,因此將所有的館藏古籍全部數(shù)字化并不現(xiàn)實。

        1.3建立的數(shù)字化古籍書目要與館藏書目相關聯(lián) 數(shù)字化古籍書目的建立是本館數(shù)字化加工工作的重要環(huán)節(jié)。這個看似簡單的過程,如果沒有科學、準確地錄入,也會在古籍書目的檢索利用時產生一些問題。比如我館在進行數(shù)字化掃描古籍之初,數(shù)字化古籍書目是單獨建立的,與館藏古籍書目之間是沒有聯(lián)系的。在讀者借閱古籍時,對于掃描過的古籍,本來可以只提供掃描圖像而不用再提原書,但是我們的館藏古籍書目沒有注明哪些是掃描過的古籍,只能還是提供原書給讀者。這樣非常不利于古籍的保護。因此有必要將數(shù)字化古籍書目與館藏書目相關聯(lián),或者數(shù)字化古籍書目由館藏書目派生出來,或是在館藏書目中注明掃描過的書目。總之兩個書目在格式、繁簡字體上要保持一致,保證在檢索書目時可以快速準確的得到結果。

        2 掃描過程中的問題

        2.1古籍掃描人員的培訓 古籍,與一般的書籍不同,不僅具有重要的學術價值,而且具有重要的文物價值和歷史價值。因此,在掃描工作之前,要對古籍掃描人員進行專門的培訓。要讓掃描人員樹立保護古籍,保證質量的意識,確保原件的安全性。要讓掃描人員熟悉操作環(huán)節(jié),可以用仿照的古籍進行試掃,盡量避免對古籍的損傷,確保加工環(huán)節(jié)的規(guī)范化。

        2.2古籍掃描規(guī)范

        2.2.1檢查全書 在掃描之前要檢查全書。一看是否需要拆除裝訂線進行掃描。一般情況下,盡量不拆除古籍的裝訂線,保持古籍的原貌。但是對于有的裝訂線已經斷開,或是原有的裝訂線裝訂的太寬,致使部分內容無法看到,這樣的情況最好拆除裝訂線進行掃描,待掃描后立即進行重新裝訂。如果館內不能進行修復,最好不要拆除裝訂線,以免古籍散落或丟失。二看古籍中有無散落的書頁。如果有散落的書頁,要記下書頁所在的位置,最好夾條進行標記,以防弄亂書頁順序。

        2.2.2掃描標準 古籍掃描時,圖像采集分辨率應不低于300dpi,色彩模式選用RGB全彩,具體利用時可根據(jù)需求進行調整。我館是按分辨率300dpi,24位RGB色彩模式掃描。而且將掃描后的圖像文件分別存儲為典藏版和閱讀版。古籍典藏版圖像掃描分辨率300dpi,以盡量滿足保存古籍圖像原貌的目的,但文件較大;閱讀版圖像掃描分辨率為72dpi,文件較小,但可以保證閱覽的需求。一般來講,圖像分辨率為300dpi,就可以滿足印刷出版的要求,對于字太小或顏色太淡的書籍,可以適當增加掃描分辨率。在進行數(shù)字化加工時,沒有必要設置過高的掃描分辨率,雖然圖像會更加清晰一些,但是所占的空間也很大,積累到一定程度時,也不利于使用和保存。

        文件可存儲為高品質TIFF/JPBG格式。我館的文件是存儲為JPG文件格式;文件命名為\"冊號\"+0+\"頁碼\",如第一冊第一頁,文件名為010001。每種古籍按其名稱設總文件夾,再按其具體冊數(shù)設分冊文件夾,每頁圖片分別存放在所在的冊文件夾中。

        2.2.3掃描校對 掃描圖片文件保存完成后,要與原書進行逐冊、逐頁校對。刪除其中重復掃描文件,增補遺漏掃描圖片。保存文件命名的書名要與數(shù)字化古籍書目上的書名相一致,以方便搜索利用。

        2.2.4圖像處理 掃描得到的圖像,會存在邊緣大小不等,位置不正、或色彩偏差等問題。所以必需對掃描圖像進行裁邊、糾偏、調色等處理。對于文件格式存儲不統(tǒng)一者也要進行統(tǒng)一調整。

        3 檢索系統(tǒng)建立過程中的問題

        3.1圖文關聯(lián)是中醫(yī)古籍數(shù)字化的較好方式 圖文關聯(lián)的方式不僅可以彌補單純\"圖像\"在檢索和內容編輯上的不足,而且可以校對單純\"文本\"的準確性,使讀者既能看到原書原貌的古籍文獻信息,又可以快速準確地查到所需的內容。其中,文本數(shù)據(jù)的準確度是影響用戶使用的重要因素。目前文本數(shù)據(jù)的獲取方式有對古籍圖像進行OCR識別、人工錄入和兩者結合3種方式。我館在實際工作中多采用直接人工錄入的的方式,并加以標點。為達到圖文對照和符合現(xiàn)代閱讀習慣的目的,文本數(shù)據(jù)可分為橫排、豎排兩種版式。我館自主開發(fā)建立的中醫(yī)古籍閱覽管理系統(tǒng)即采用這種方式。通過古籍的圖文關聯(lián)和版式還原可以實現(xiàn)\"圖文互校\",圖像和文本在同一界面內頁對頁、行對行、列對列、字對字的校對,減少校對者的視覺疲勞。

        3.2檢索系統(tǒng)要進行適當?shù)臉艘?圖文關聯(lián)雖然是中醫(yī)古籍數(shù)字化的較好方式。但是由于花費時間很長,并且全文檢索存在固有的一些缺點,因此為了更好的有效利用,檢索系統(tǒng)需要進行適當?shù)臉艘?。這樣基本能實現(xiàn)古籍中主要知識點的檢索。

        我館自主開發(fā)建立的中醫(yī)古籍閱覽管理系統(tǒng)采用自由標引加后控詞表的方式來實現(xiàn)檢索。其中自由標引以目錄的深加工為總原則。目錄的深加工是指在對中醫(yī)古籍圖片進行標引時,先以全書目錄中的各條內容作為標引內容,在此基礎上,將正文中明確寫到而目錄中沒有的各級標題和各段主題也作為標引內容進一步予以標注。其中,各級標題是正文中客觀存在的,在標引時一般按原文照錄即可。而各段主題則需要根據(jù)中醫(yī)專業(yè)知識予以提取,一般仍采用中醫(yī)專業(yè)術語,而且也要盡量使用原書中的詞語。后控詞表是通過參考相關的工具書或教科書,對標引用詞進行聚類分析而創(chuàng)建。詞表共設八個字段,即類號、標識詞、同義詞、近義詞、上位詞、下位詞、關聯(lián)詞和現(xiàn)代醫(yī)學對照詞。這樣就形成一個集數(shù)據(jù)加工與檢索利用于一體的中醫(yī)古籍智能檢索系統(tǒng)。

        3.3古籍生僻字的處理 古籍生僻字問題是中醫(yī)古籍數(shù)字化的一大障礙。解決好這個問題有利于保證數(shù)字化工作的統(tǒng)一性。我們可以通過手寫輸入法、拼湊法、造字法、圖片替代法、描述法等多種方式進行處理。在實際工作中可以幾種方法綜合應用。我館的檢索系統(tǒng)通過對中醫(yī)古籍數(shù)字化中遇到的生僻字問題進行深入研究并對生僻字進行分析統(tǒng)計后,對其進行編碼、造字,建立繁簡字體對照表,增加繁簡字體關聯(lián)互檢功能,從而有效提高了檢索準確率。

        總之,中醫(yī)古籍數(shù)字化需要一個逐步發(fā)展和完善的過程。在這個過程中,我們還會不斷的遇到新問題。只要我們保持科學認真的態(tài)度,一定能夠不斷地解決新問題,將中醫(yī)古籍數(shù)字化工作做得更好。

        參考文獻:

        [1]李兵,劉國正,符永馳,等.從中醫(yī)古籍數(shù)據(jù)庫建設看中醫(yī)古籍數(shù)字化[J].中國中醫(yī)藥信息雜志,2009,16(03):92-93.

        [2]符永馳,李斌,郭敏華,等.中醫(yī)古籍電子化系統(tǒng)的研究與實現(xiàn)[J].中國中醫(yī)藥信息雜志,2008,15(02):103-104.

        [3]薛清錄.中國中醫(yī)古籍總目[M].上海辭書出版社,2007:2.

        [4]符永馳,劉國正,李斌,等.中醫(yī)古籍數(shù)字化研究[J].中國中醫(yī)藥信息雜志,2004,11(06):563-564.

        編輯/哈濤

        亚洲 欧美 日韩 国产综合 在线| 国产亚洲日韩欧美一区二区三区| 亚洲阿v天堂网2021| 国产91精品丝袜美腿在线| 精品中文字幕在线不卡| 国产麻豆剧果冻传媒一区| 一本久久a久久精品亚洲| 国产精品系列亚洲第一| 亚洲天堂一区二区三区| 色欲欲www成人网站| 最新亚洲精品国偷自产在线 | 东风日产车是不是国产的| 日本最新免费二区三区| 黄 色 人 成 网 站 免 费 | 亚洲中文字幕一二区精品自拍| 精品久久久久久综合日本| 深夜福利小视频在线观看| 亚洲日韩区在线电影| 成人在线观看视频免费播放| 亚洲综合天堂av网站在线观看| 亚洲av日韩av综合| 91在线区啪国自产网页| 午夜理论片日本中文在线| 中文字幕一区日韩精品| 日韩毛片基地一区二区三区| 日韩在线中文字幕一区二区三区| 国产人妖网站在线视频| 天天夜碰日日摸日日澡| 本道无码一区二区久久激情| 国产丝袜长腿在线看片网站| 极品老师腿张开粉嫩小泬| a级黑人大硬长爽猛出猛进| 国产激情一区二区三区在线蜜臀| 中文字幕av人妻少妇一区二区| 美女av一区二区三区| 久久精品国产99久久丝袜| 少妇人妻一区二区三飞| 一本色道久久88加勒比—综合| 亚洲欧洲日产国码无码久久99| 加勒比熟女精品一区二区av| 国偷自拍av一区二区三区|