亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        我國古籍?dāng)?shù)字化研究的統(tǒng)計分析

        2010-01-01 00:00:00李盛慶
        圖書館界 2010年2期

        [摘 要]對2009年以前我國古籍?dāng)?shù)字化研究論文的數(shù)量、登載期刊、作者、主題進行統(tǒng)計,揭示古籍?dāng)?shù)字化從書目、索引等初級檢索工具到當(dāng)前智能全文檢索平臺的發(fā)展之路,并根據(jù)我國古籍?dāng)?shù)字化研究的發(fā)展趨勢探討其未來的發(fā)展方向。

        [關(guān)鍵詞]古籍?dāng)?shù)字化;數(shù)字化研究;統(tǒng)計分析

        [中圖分類號]G255.1;G250.74[文獻標(biāo)志碼]A[文章編號]1005-6041(2010)02-0011-05

        在我國,“古籍?dāng)?shù)字化”[1]這個術(shù)語最早是由劉煒提出的,但相關(guān)研究和實踐工作早在20世紀(jì)80年代就開始了,其概念和內(nèi)涵的形成經(jīng)歷了很長時間,迄今還在不斷演變。2005年,李明杰提出:“古籍?dāng)?shù)字化是以保存和普及傳統(tǒng)文化為基本目的,以知識發(fā)現(xiàn)的功能服務(wù)學(xué)術(shù)研究為最高目標(biāo),在對傳統(tǒng)紙質(zhì)古籍進行??闭淼幕A(chǔ)上,利用計算機技術(shù)將其轉(zhuǎn)換成可讀、可檢索及實現(xiàn)了語義關(guān)聯(lián)和知識重組的數(shù)字化信息的過程”[2]。2007年,毛建軍認為:“古籍?dāng)?shù)字化是從利用和保護古籍的目的出發(fā),采用計算機技術(shù),將常見的語言文字或圖形符號轉(zhuǎn)化為能被計算機識別的數(shù)字符號,從而制成古籍文獻書目數(shù)據(jù)庫和古籍全文數(shù)據(jù)庫,用以揭示古籍文獻信息資源的一項系統(tǒng)工作”[3]。

        以上兩種解釋是從古籍?dāng)?shù)字化基本理論的高度給予的精辟概括,囊括了很多研究人員的觀點。筆者基于這些認識,對2009年以前我國古籍?dāng)?shù)字化的研究成果進行了統(tǒng)計分析,認為古籍?dāng)?shù)字化研究應(yīng)該包括:古籍?dāng)?shù)字化基本理論的形成和發(fā)展,數(shù)字化古籍資源的特點和意義,古籍?dāng)?shù)字化資源的開發(fā)、共享和利用,古籍?dāng)?shù)字化實踐(書目數(shù)據(jù)庫、索引數(shù)據(jù)庫、題錄數(shù)據(jù)庫、全文數(shù)據(jù)庫、知識庫的建設(shè)),古籍?dāng)?shù)字化技術(shù)研究(加工技術(shù)、出版技術(shù)、相關(guān)軟件和服務(wù)平臺等),古籍?dāng)?shù)字化相關(guān)標(biāo)準(zhǔn)研究,古籍?dāng)?shù)字化成果分析與評估,專題古籍?dāng)?shù)字化研究(法律、農(nóng)業(yè)、中醫(yī)、歷史檔案等),少數(shù)民族古籍?dāng)?shù)字化研究,等等?;谝陨系闹黝}范圍,筆者對古籍?dāng)?shù)字化的相關(guān)研究成果進行了搜集和整理,并逐條進行統(tǒng)計分析。

        1 數(shù)據(jù)來源和研究方法

        本文以“中國學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫”[4]作為數(shù)據(jù)統(tǒng)計源,首先利用“專業(yè)檢索”界面輸入檢索式“(題名=‘古籍’or題名=‘典籍’or題名=‘善本’)and(主題=‘著錄’or主題=‘編目’or主題=‘索引’or主題=‘?dāng)?shù)字化’or主題=‘元數(shù)據(jù)’or主題=‘書目數(shù)據(jù)庫’or主題=‘全文數(shù)據(jù)庫’or主題=‘全文檢索系統(tǒng)’)”檢得518條初始記錄,而后下載詳細題錄,逐條分析,經(jīng)整理后得出347篇相關(guān)文獻,分題名、作者、單位、刊名、年代、主題1、主題2項列成表,利用Excel軟件的數(shù)據(jù)處理函數(shù)進行統(tǒng)計和分析。

        2 論文數(shù)量增長分析

        筆者按論文發(fā)表年代分類匯總,得到1987—2008年我國古籍?dāng)?shù)字化研究論文數(shù)量的增長情況(見表1)。

        數(shù)據(jù)庫建設(shè)的居多,這表明20世紀(jì)80年代到90年代中后期是我國古籍?dāng)?shù)字化研究的起步階段;從1998年開始年發(fā)表論文數(shù)量超過10篇,1998—2001年發(fā)表論文總數(shù)57篇,占歷年論文總數(shù)的16.4%,在這一時期我國的古籍?dāng)?shù)字化工作有較大突破,完成了《文淵閣四庫全書》和《古今圖書集成》的全文數(shù)字化工作,這標(biāo)志著我國的古籍?dāng)?shù)字化研究在該階段已突破關(guān)鍵技術(shù)進入一個全新的發(fā)展時期;從2002年開始累積論文總數(shù)超過100篇,年發(fā)表論文數(shù)均大于20篇,增長勢頭更加明顯,2002—2008年發(fā)表論文總數(shù)265篇,占歷年論文總數(shù)的76.4%,年均新發(fā)表論文在37篇以上,說明該階段我國古籍?dāng)?shù)字化研究已經(jīng)進入快速發(fā)展時期;當(dāng)前發(fā)展勢頭很明顯,但還沒有形成顯著的高峰期,說明我國古籍?dāng)?shù)字化研究還有很大潛力可以挖掘。

        3 作者分析

        對作者的分析可以推斷科研人員的研究能力,分析內(nèi)容為:研究人員科研的環(huán)境和條件,確定核心作者、核心研究單位。筆者按第一作者及其所在單位分別加以分類統(tǒng)計,再進行統(tǒng)計分析。

        3.1 核心作者

        統(tǒng)計結(jié)果顯示:有260人發(fā)表1篇論文,占論文總數(shù)的74.9%,這表明我國古籍?dāng)?shù)字化的研究人員較為分散,大部分研究人員發(fā)表論文數(shù)量較少;發(fā)表3篇以上(含3篇)論文的作者為9人,共發(fā)表47篇論文,占論文總發(fā)表量的13.5%,南京大學(xué)中文系博士毛建軍共發(fā)表17篇論文,位居第一。根據(jù)普賴斯公式N=0.749max(max代表最高產(chǎn)作者發(fā)文數(shù)),令max=17,則N≈3,所以可以確定毛建軍、包和平等9人為我國古籍?dāng)?shù)字化研究的核心作者(見表2)。

        該領(lǐng)域核心作者發(fā)文數(shù)量跟其他學(xué)科的高產(chǎn)作者相比有很大的差距,這表明我國古籍?dāng)?shù)字化的研究還在發(fā)展中,科研和實踐活動有待進一步的創(chuàng)新和突破。從作者的知識背景來看,有中文、歷史、圖書情報、計算機、電子信息工程、醫(yī)學(xué)、農(nóng)業(yè)等多個領(lǐng)域,這說明古籍?dāng)?shù)字化的研究和實踐是一個跨學(xué)科、協(xié)同化的領(lǐng)域。

        3.2 作者合著度分析

        [JP+3]對論文作者數(shù)的統(tǒng)計數(shù)據(jù)如表3所示,從表中可以看出著者為2人或2人以上的論文占論文總數(shù)量的27.4%,利用公式:合著度=6×1+5×2+4×8+3×17+2×67+1×252347,[JP]求得合著度約等于1.40,這表明我國古籍?dāng)?shù)字化研究工作者有一定的合作,同時也說明研究人員較為分散、合作力度不大。

        3.3 作者所在單位分布狀況分析

        對作者單位的統(tǒng)計結(jié)果為(對部分屬于同一單位的不同子部門進行了合并):發(fā)表1篇論文的單位數(shù)為99個,發(fā)表論文總數(shù)為99篇,占論文總發(fā)表量的28.5%;發(fā)表2~3篇論文的單位40個,發(fā)表論文總數(shù)為91篇,占論文總發(fā)表量的26.3%;發(fā)表4篇以上(含4篇)的單位22個,發(fā)表論文總數(shù)為157篇,占論文總發(fā)表量的45.2%。從數(shù)據(jù)上來看,一方面說明了從事我國古籍?dāng)?shù)字化研究的科研單位較為分散,另一方面又明顯看出我國古籍?dāng)?shù)字化研究在少數(shù)單位較突出,它們的相關(guān)研究明顯走在該領(lǐng)域的前列。根據(jù)普賴斯公式,可以確定發(fā)表4篇以上(含4篇)文章的研究單位為核心的研究單位(見表4)。

        從單位性質(zhì)來看,研究部門主要集中在圖書館、情報研究機構(gòu)、專題古籍研究機構(gòu)和相關(guān)教學(xué)單位,部分研發(fā)文獻信息數(shù)字化軟件的企業(yè)也參與進來了,各個單位根據(jù)自己的需要開展古籍?dāng)?shù)字化的研究和實踐活動,一道利用商業(yè)化市場運作模式開發(fā)出古籍?dāng)?shù)字化產(chǎn)品。數(shù)據(jù)表明:處于核心區(qū)的研究單位,其研究成果數(shù)量上差別也很大,河北師范大學(xué)等幾家單位研究成果數(shù)量較多,筆者認為這與古籍的館藏占有量和開展古籍?dāng)?shù)字化實踐有很大關(guān)系。比如:國家圖書館已經(jīng)依托館藏資源建成數(shù)字方志、碑帖菁華、敦煌遺珍、西夏碎金、甲骨世界、《永樂大典》等多個古籍全文數(shù)字化資源庫。

        4 論文登載的期刊分析

        按期刊刊名進行分類匯總得到我國古籍?dāng)?shù)字化研究論文的分布情況(見表5),統(tǒng)計發(fā)現(xiàn)相關(guān)研究論文主要分布于圖書情報刊物中,只有《古籍整理研究學(xué)刊》收入4篇、《電子出版》收入3篇、《數(shù)字與縮微影像》收入5篇。

        從表中可以看出累積收入論文數(shù)量達到10篇以上(含10篇)的期刊為10種,合計收入116篇論文,占論文總數(shù)的33.4%;收入論文數(shù)量達3~9篇的期刊為23種,合計收入123篇論文,占論文總數(shù)的35.5%;收入論文數(shù)量達1~2篇的期刊為69種,合計收入108篇論文,占論文總數(shù)的31.1%,論文在期刊中的分布比例為10∶[KG-2mm]23∶[KG-2mm]69,核心區(qū)、相關(guān)區(qū)、外圍區(qū)的期刊數(shù)比例約為1∶[KG-2mm]2.3∶[KG-2mm]6.9。以上數(shù)據(jù)表明我國古籍?dāng)?shù)字化研究領(lǐng)域的核心期刊基本形成,相關(guān)區(qū)期刊也聚集了相當(dāng)數(shù)量的論文,這樣研究者可以集中精力在部分期刊中查找古籍?dāng)?shù)字化研究的相關(guān)文獻。

        5 論文主題分析

        對古籍?dāng)?shù)字化相關(guān)研究論文的主題分析可以得知該領(lǐng)域的研究重點和難點。筆者逐一對347篇相關(guān)論文的文摘進行分析,將古籍?dāng)?shù)字化研究劃分為12個主題門類(一篇文章有多個主題則分別統(tǒng)計)。統(tǒng)計結(jié)果表明我國古籍?dāng)?shù)字化研究的主要領(lǐng)域為:1)古籍?dāng)?shù)字化的基本理論,包括古籍?dāng)?shù)字化的概念、性質(zhì)、內(nèi)涵與外延、發(fā)展現(xiàn)狀、問題、發(fā)展趨勢、定位等;2)古籍?dāng)?shù)字化標(biāo)準(zhǔn)研究,包括為古籍元數(shù)據(jù)、著錄規(guī)則、分類標(biāo)引規(guī)則、字符編碼等;3)古籍?dāng)?shù)字化資源的特點和意義,包括古籍?dāng)?shù)字化資源的優(yōu)點以及古籍?dāng)?shù)字化的必要性、作用和重要意義(古籍保護和古籍整理的意義、古籍開發(fā)利用及對其他學(xué)科發(fā)展的作用)等;4)書目數(shù)據(jù)庫建設(shè),包括書目數(shù)據(jù)庫建設(shè)的前期準(zhǔn)備、編目人員的素質(zhì)和培訓(xùn)、聯(lián)機編目、書目數(shù)據(jù)共建共享、古籍的著錄、分類標(biāo)引、機讀書目數(shù)據(jù)的編制、書目數(shù)據(jù)的質(zhì)量控制等問題;5)全文數(shù)據(jù)庫建設(shè),包括基于圖像的全文數(shù)據(jù)庫和基于圖像與文本對照的全文數(shù)據(jù)庫以及全文數(shù)據(jù)庫中輔助工具(索引、字典、關(guān)聯(lián)網(wǎng)絡(luò))等;6)專題古籍?dāng)?shù)字化研究,包括法律、農(nóng)業(yè)、中醫(yī)、數(shù)學(xué)、飲食、地方志等專題性古籍的數(shù)字化研究;7)少數(shù)民族古籍?dāng)?shù)字化研究,包括我國各少數(shù)民族古籍的數(shù)字化研究和實踐、元數(shù)據(jù)、字符編碼、字符輸入、顯示、檢索等問題;8)其他數(shù)據(jù)庫建設(shè),包括索引數(shù)據(jù)庫、資料庫、知識庫建設(shè)等;9)數(shù)字化技術(shù)研究,包括古籍的數(shù)字化處理技術(shù)(非鍵盤光學(xué)輸入、圖像處理、機器校對等)、信息組織技術(shù)、存儲技術(shù)、全文檢索技術(shù)、漢字的關(guān)聯(lián)擴展檢索技術(shù)、數(shù)字出版技術(shù)、人機接口技術(shù)等;10)數(shù)字化相關(guān)軟件和平臺的應(yīng)用研究,包括ILAS、SulcmisⅢ、CALIS等書目數(shù)據(jù)庫和TRS、方正德賽(DESI)等全文數(shù)據(jù)庫建設(shè)實踐等;11)數(shù)字化資源的共享和利用,包括古籍?dāng)?shù)字化資源的共建、共享、檢索、利用等子主題;12)數(shù)字化成果分析與評估,包括我國各地區(qū)已建成的古籍書目數(shù)據(jù)庫、索引數(shù)據(jù)庫、全文數(shù)據(jù)庫、知識庫等數(shù)字化資源的分析和評估。

        從各個研究主題分布范圍和所占的比例可以看出,我國古籍?dāng)?shù)字化建設(shè)已經(jīng)從最初書目數(shù)據(jù)庫、索引數(shù)據(jù)庫等簡單的二次文獻揭示形式向全文數(shù)據(jù)庫甚至具有輔助檢索和研究功能的智能全文檢索系統(tǒng)發(fā)展,其中非鍵盤的光學(xué)輸入、不常用字符的編碼技術(shù)、元數(shù)據(jù)標(biāo)準(zhǔn)、少數(shù)民族的古籍?dāng)?shù)字化開發(fā)以及數(shù)字化古籍的深層次開發(fā)等問題成為研究的難點與熱點,部分技術(shù)上的壁壘已經(jīng)被攻克,較多人性化、視覺效果好、使用便捷的數(shù)字化產(chǎn)品已經(jīng)提供給用戶使用,這些數(shù)字化產(chǎn)品不僅提供全文檢索功能,還包含輔助支撐工具,這些工具能夠幫助讀者更高效的使用數(shù)字化產(chǎn)品,還可以讓讀者參與到勘誤中來,比較典型的產(chǎn)品如書同文公司開發(fā)出的局域網(wǎng)版、國際互聯(lián)網(wǎng)絡(luò)版以及單機版的《文淵閣四庫全書》《十通》《四部叢刊》《康熙字典》《大清五部會典》《大清歷朝實錄》等數(shù)字精品。

        我國古籍?dāng)?shù)字化研究已經(jīng)取得了較豐碩的成果,公益性和市場化的產(chǎn)品不斷問世,盡管成果非常豐碩,但是還是存在一些問題:部分數(shù)字化古籍錯訛多,僅能用于查詢索引,難以準(zhǔn)確引用;重復(fù)建設(shè)的問題比較突出,如《二十四史》大多數(shù)字化產(chǎn)品中都已包含[5];相比世界其他館藏中文古籍的單位,我國古籍?dāng)?shù)字化水平及網(wǎng)絡(luò)化服務(wù)水平還有很大差距,目前我國已數(shù)字化的古籍占全部古籍的比例無疑是很低的,我國的古籍?dāng)?shù)字化產(chǎn)品大多由商業(yè)公司開發(fā),他們只限于選擇市場開發(fā)價值較高、較實用的古籍版本,遠遠不能滿足廣大科研人員的需求;大多數(shù)讀者只能使用經(jīng)單位購買的數(shù)字化產(chǎn)品,公益性開放資源較少,這樣古籍?dāng)?shù)字化資源的利用受到限制;數(shù)字化產(chǎn)品的深度開發(fā)還需要進一步加強,專題、精深化整理研究還需要不斷深入。

        總的看來,在未來很長一段時間,在宏觀和微觀兩個層次上,古籍?dāng)?shù)字化研究還有很長的路要走:一方面,浩如煙海的古籍將被陸續(xù)按照嚴格的標(biāo)準(zhǔn)和加工流程數(shù)字化,費時較多,所需人力、物力和財力都較大,如哈佛大學(xué)圖書館與中國國家圖書館已達成協(xié)議,將合作建立一個中國之外最大的中國國學(xué)珍本書籍?dāng)?shù)字圖書館,哈佛的技術(shù)人員將用6年的時間,花費數(shù)百萬美元將館藏51 500冊珍本數(shù)字化[6],我國以國家圖書館為首的各收藏單位也已經(jīng)開始啟動更大規(guī)模的古籍?dāng)?shù)字化工作[7];另一方面,我們對古籍?dāng)?shù)字化資源的深度開發(fā)將進入細微化階段,如知識元的標(biāo)引、相關(guān)知識元關(guān)聯(lián)形成知識網(wǎng)絡(luò)、輔助知識庫建設(shè)、智能輔助檢索和研究工具建設(shè)、信息的統(tǒng)計和分析、專題性資料的自動挖掘等,可以說未來的數(shù)字化古籍將是立體的、智能的知識挖掘系統(tǒng)平臺[8]

        [參考文獻]

        [1]劉 煒.上海圖書館古籍?dāng)?shù)字化的初步嘗試[J].圖書館雜志,1997(4):33.

        [2]李明杰.中文古籍?dāng)?shù)字化基本理論問題芻議[J].圖書館論壇,2005(10):98.

        [3]毛建軍.古籍?dāng)?shù)字化的概念與內(nèi)涵[J]. 圖書館理論與實踐,2007(4):82.

        [4]中國學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫[DB/OL].[2009-03-16].http://acad.cnki.net/Kns55/brief/result.aspx?dbPrefix=CJFQ.

        [5]王發(fā)社.古籍?dāng)?shù)字化的幾點思考[J].圖書館論壇,2006(3):122.

        [6]哈佛圖書館擬將國學(xué)珍本數(shù)字化[EB/OL].[2009-10-13].http://book.hexun.com/2009-10-13/121322896.html.

        [7]陳 力.中國古籍?dāng)?shù)字化的現(xiàn)狀與展望[EB/OL].[2009-10-13].http://www.guoxue.com/gjzl/gj398/gj398_03.htm.

        [8]徐 清,石向?qū)?,?唯.古籍?dāng)?shù)字化資源的深度開發(fā)[J].圖書情報工作,2007(3):95—97.

        [收稿時間]2009-10-15

        [作者簡介]李盛慶(1983—),男,助理館員,本科。

        国产剧情亚洲一区二区三区| 国产狂喷潮在线观看| 日本av一区二区三区四区| 精品一区二区三区a桃蜜| 国产精品天堂在线观看| 亚洲一区二区综合精品| 国产午夜亚洲精品国产成人av| 亚洲线精品一区二区三区| 日韩aⅴ人妻无码一区二区| 日韩亚洲av无码一区二区不卡 | 亚洲av精品一区二区| 一区二区三区国产精品麻豆| 午夜秒播久久精品麻豆| 精品国产麻豆免费人成网站| 国产精品女同久久久久电影院| 亚洲黄色天堂网站在线观看禁18 | 国产97在线 | 中文| 国产麻豆成人精品av| 亚洲人成网站在线观看播放| 亚洲αⅴ无码乱码在线观看性色| 国产精品亚洲专区无码不卡| 白色橄榄树在线阅读免费| 天天色天天操天天日天天射 | 国产精品www夜色视频| a级毛片毛片免费观看久潮喷| 欧美成人a在线网站| 久久精品国产亚洲av成人擦边 | 亚洲中文字幕无码天然素人在线| 中文字幕人妻熟女人妻洋洋| 国产在线高清视频| 色青青女同性恋视频日本熟女| 免费看av网站在线亚洲| 久久精品国产99国产精品澳门| 国产精品欧美一区二区三区| 国产亚洲婷婷香蕉久久精品| 免费国产h视频在线观看86| 在线免费观看国产视频不卡| 亚洲天堂av一区二区| 日日摸天天碰中文字幕你懂的| 海角国精产品一区一区三区糖心 | 人妻丰满av∨中文久久不卡|