王克平,蘇艷麗
(山東理工大學(xué) 科技信息研究所,山東 淄博 255000)
我國高校數(shù)字圖書館研究現(xiàn)狀與趨勢
——基于碩博士學(xué)位論文的統(tǒng)計分析
王克平,蘇艷麗
(山東理工大學(xué) 科技信息研究所,山東 淄博 255000)
以碩博士學(xué)位論文為數(shù)據(jù)源,利用社會科學(xué)統(tǒng)計軟件,結(jié)合文獻(xiàn)計量學(xué)相關(guān)理論,研究發(fā)現(xiàn):我國高校數(shù)字圖書館研究近幾年呈現(xiàn)下降趨勢,相關(guān)研究集中在圖書情報與檔案管理、計算機(jī)科學(xué)與技術(shù)等學(xué)科;吉林大學(xué)、湘潭大學(xué)等重點(diǎn)大學(xué)成為主要研究機(jī)構(gòu);有關(guān)高校數(shù)字圖書館研究主題熱點(diǎn)為數(shù)字資源建設(shè)、數(shù)字圖書館技術(shù)、信息服務(wù)。實(shí)踐中可以從加強(qiáng)跨學(xué)科交流、加大宣傳力度、開展產(chǎn)學(xué)研結(jié)合等多種培養(yǎng)模式入手,以促進(jìn)高校數(shù)字圖書館的發(fā)展。
高校數(shù)字圖書館;學(xué)位論文;統(tǒng)計分析
數(shù)字圖書館(Digital Library) 是以數(shù)字形式存儲和處理信息的新型圖書館,通過計算機(jī)技術(shù)進(jìn)行圖書館各種信息資源的采集、數(shù)字化加工處理、信息的存儲和管理、信息的發(fā)布和服務(wù)、信息利用與挖掘等處理工作,向讀者提供智能檢索和下載服務(wù),實(shí)施知識的增值和快速傳播,代表了圖書館發(fā)展的必然趨勢[1]327-331。碩士、博士學(xué)位論文是高等學(xué)校專業(yè)人才培養(yǎng)方案的重要組成部分,是高校研究生教育實(shí)現(xiàn)培養(yǎng)目標(biāo)最重要的教學(xué)環(huán)節(jié),反映了學(xué)生綜合知識水平、實(shí)踐應(yīng)用能力及相關(guān)科研成果[2]218-223。
基于“高校數(shù)字圖書館”的相關(guān)學(xué)位論文,采用社會科學(xué)統(tǒng)計方法,認(rèn)識我國高校數(shù)字圖書館的研究現(xiàn)狀并預(yù)測發(fā)展趨勢,對高校數(shù)字圖書館的發(fā)展具有指導(dǎo)意義。
在對比中國知網(wǎng)、維普、萬方等數(shù)據(jù)庫的基礎(chǔ)上,本文選取CNKI的碩博士學(xué)位論文數(shù)據(jù)庫作為數(shù)據(jù)源,以保證數(shù)據(jù)的完整、質(zhì)量高和新穎性①參見中國知網(wǎng)“博碩士學(xué)位論文”,網(wǎng)址鏈接為:http://epub.cnki.net/kns/brief/result.aspx?dbPrefix=CDMD.。為了盡量全面收集國內(nèi)關(guān)于高校數(shù)字圖書館研究的碩博士學(xué)位論文,本文選取“高校數(shù)字圖書館”“大學(xué)數(shù)字圖書館”作為檢索詞,詞間邏輯關(guān)系為“或”;檢索字段選擇能反映文獻(xiàn)主題內(nèi)容的主題、題名和關(guān)鍵詞字段,字段間邏輯關(guān)系為“或”;檢索時間范圍為2001—2014年;匹配模式均為模糊匹配。對CNKI的碩博士學(xué)位論文數(shù)據(jù)庫進(jìn)行高級檢索,共獲得508篇學(xué)位論文,其中包括20篇博士學(xué)位論文,488篇碩士學(xué)位論文。
借助CNKI及E-study工具導(dǎo)出學(xué)位論文的作者、篇名、時間、機(jī)構(gòu)等相關(guān)題錄信息,采用統(tǒng)計軟件SPSS22.0及文獻(xiàn)題錄信息統(tǒng)計分析工具SATI3.2進(jìn)一步分析。
(一)學(xué)位論文年代分布
通過年代分布可以了解我國數(shù)字圖書館近幾年的發(fā)展趨勢,包括起始研究、研究的峰值和轉(zhuǎn)折點(diǎn)等。通過CNKI及E-study工具可以直接導(dǎo)出碩博士學(xué)位論文每年的論文數(shù),使用SPSS對數(shù)據(jù)進(jìn)行整理并繪制分布圖如圖1所示,從圖形來看,碩博士研究生從2001年開始進(jìn)行我國高校數(shù)字圖書館的研究,隨著關(guān)注熱度的增加相應(yīng)的學(xué)位論文數(shù)呈現(xiàn)遞增的趨勢,直至2012年達(dá)到峰值,自2013年開始呈現(xiàn)下降趨勢;國內(nèi)博士研究生對高校數(shù)字圖書館的研究與碩士研究生相比相對較少,且多年來未有較大變化,說明博士研究生學(xué)位論文在高校數(shù)字圖書館方面關(guān)注較少。由于博士學(xué)位論文數(shù)量較少,以下內(nèi)容采用總體學(xué)位論文數(shù)據(jù)進(jìn)行研究分析。
圖1 高校數(shù)字圖書館學(xué)位論文數(shù)量與年代關(guān)系分布圖
(二)學(xué)位論文學(xué)科分布
依據(jù)《授予博士、碩士學(xué)位和培養(yǎng)研究生的學(xué)科、專業(yè)目錄》①參見《授予博士、碩士學(xué)位和培養(yǎng)研究生的學(xué)科、專業(yè)目錄》(1997年頒布),網(wǎng)址鏈接為:http://www.moe.edu.cn/publicfiles/business/htmlfiles/moe/moe_834/201005/xxgk_88437.html.和CNKI對508篇文獻(xiàn)的學(xué)科分類,使用SPSS工具繪制得到統(tǒng)計結(jié)果如圖2所示。從圖2可以看出高校數(shù)字圖書館方向碩博士學(xué)位論文主要分布于圖書館情報與檔案管理、計算機(jī)科學(xué)與技術(shù)、信息與通信工程、教育學(xué)、法學(xué)、新聞傳播學(xué)、應(yīng)用經(jīng)濟(jì)學(xué)、中醫(yī)學(xué)和基礎(chǔ)醫(yī)學(xué)等學(xué)科領(lǐng)域。圖情學(xué)科與數(shù)字圖書館關(guān)系最密切,也是研究高校數(shù)字圖書館的重要領(lǐng)域;數(shù)字圖書館的發(fā)展離不開技術(shù)的支撐,計算機(jī)科學(xué)與技術(shù)、信息與通信工程等學(xué)科為數(shù)字圖書館的發(fā)展提供了技術(shù)支持和保障。隨著公共數(shù)字文化建設(shè)進(jìn)程的推進(jìn),版權(quán)問題越來越突出,數(shù)字圖書館在公共數(shù)字文化建設(shè)中占有舉足輕重的地位,遇到的版權(quán)侵權(quán)問題具有較強(qiáng)的代表性[3]27-33。圖書館作為科研工作者獲取知識的重要渠道,在信息化的時代背景下,教育學(xué)、新聞傳播學(xué)、應(yīng)用經(jīng)濟(jì)學(xué)等領(lǐng)域也改變了往日獲取、傳播信息的渠道,加強(qiáng)了對數(shù)字圖書館的利用,因此法學(xué)學(xué)科碩博士學(xué)位論文從法律和版權(quán)角度對數(shù)字圖書館做了有效界定、管理和研究,這也使法學(xué)在數(shù)字圖書館的研究中占有較高比重。同時很多院校的醫(yī)學(xué)院有診斷治療和科研人員項(xiàng)目申報、選題、結(jié)項(xiàng)等方面的教學(xué)科研需要,從而開發(fā)了專門的醫(yī)學(xué)數(shù)字圖書館,使得中醫(yī)學(xué)、基礎(chǔ)醫(yī)學(xué)等醫(yī)學(xué)學(xué)科在數(shù)字圖書館研究中占有一席之地。
圖2 高校數(shù)字圖書館學(xué)位論文學(xué)科分布
(三)研究機(jī)構(gòu)分布
由于每個研究單位有研究的側(cè)重點(diǎn),通過統(tǒng)計數(shù)字圖書館的研究機(jī)構(gòu),可以了解該領(lǐng)域的主要研究機(jī)構(gòu),后續(xù)研究中可集中精力關(guān)注主要研究機(jī)構(gòu)的研究成果。使用SPSS按照發(fā)文數(shù)量大小繪制機(jī)構(gòu)分布條形圖,并截取發(fā)文篇數(shù)大于7的機(jī)構(gòu)分布如圖3所示。從所有研究機(jī)構(gòu)發(fā)表碩博士學(xué)位論文的統(tǒng)計數(shù)據(jù)來看,占比14.75%的共有18家培養(yǎng)單位,發(fā)表學(xué)位論文數(shù)占全部學(xué)位論文的50.20%.這種論文產(chǎn)出關(guān)系體現(xiàn)了情報學(xué)中“二八”定律[4]5-8。
圖3 學(xué)位論文研究機(jī)構(gòu)分布圖(發(fā)文篇數(shù)大于7)
二八定律是最省力的法則,可以集中力量把時間、精力、金錢等花在刀刃上,即最受關(guān)注的20%上[5]68-69。從圖3可以看出,發(fā)文量較多的機(jī)構(gòu)幾乎全部為“211工程”及“985工程”院校,其中吉林大學(xué)、湘潭大學(xué)、南京農(nóng)業(yè)大學(xué)、電子科技大學(xué)、黑龍江大學(xué)發(fā)文量最多,由此可知綜合實(shí)力較強(qiáng)的211、985院校在數(shù)字圖書館研究上也具備相當(dāng)大的優(yōu)勢。根據(jù)“二八定律”, 若研究人員在
研究高校數(shù)字圖書館過程中計劃進(jìn)行實(shí)證研究,用20%的院校作為研究對象,就基本可以達(dá)到概括高校數(shù)字圖書館研究現(xiàn)狀的目的,這將在很大程度上節(jié)約人力物力,幫助研究人員更加高效地開展研究工作。
(四)學(xué)位論文研究主題分布
聚類分析,能把關(guān)系密切的主題聚集在一起形成類團(tuán),表達(dá)某一領(lǐng)域分支的組成[6]118-120。本文采用SPSS22.0關(guān)鍵詞聚類的方法,在眾多碩博士學(xué)位論文中歸納出高校數(shù)字圖書館的研究主題,為高校數(shù)字圖書館準(zhǔn)確界定研究范圍,并為下一步分析其研究熱點(diǎn)奠定了研究基礎(chǔ)。
SATI是一種文獻(xiàn)題錄信息統(tǒng)計分析工具,可以抽取題錄信息中的多項(xiàng)指標(biāo),如關(guān)鍵詞、作者、機(jī)構(gòu)、文獻(xiàn)來源、年份等,然后通過統(tǒng)計頻次,生成共現(xiàn)矩陣、相似矩陣等[7]7-12。本文使用SATI工具獲取高頻關(guān)鍵詞相似矩陣如圖4所示。
圖4 基于高頻關(guān)鍵詞的相似矩陣
將相似矩陣導(dǎo)入SPSS進(jìn)行“分析—分類—系統(tǒng)聚類”分析,結(jié)果25個高頻關(guān)鍵詞被分成六類:第一類關(guān)鍵詞可概括為數(shù)字化,第二類關(guān)鍵詞可概括為數(shù)字資源,第三類關(guān)鍵詞可概括為圖書館技術(shù),第四類關(guān)鍵詞可概括為數(shù)字資源建設(shè),第五類關(guān)鍵詞可概括為信息服務(wù),第六類關(guān)鍵詞可概括為數(shù)據(jù)挖掘。與前述人工合并結(jié)果比較,兩者基本一致,從而較為準(zhǔn)確地得出高校數(shù)字圖書館領(lǐng)域的研究熱點(diǎn)為數(shù)字資源、信息服務(wù)領(lǐng)域和圖書館技術(shù)。
圖5 多維尺度分析圖
多維尺度分析圖把反應(yīng)變量之間相似程度的坐標(biāo)在平面上排列出來,通過觀察哪些散點(diǎn)比較接近,將變量進(jìn)行分類,并尋找散點(diǎn)之間相關(guān)性的合理解釋[8]288。將相似矩陣導(dǎo)入SPSS進(jìn)行“分析—度量—多維尺度(ALSCAL)”分析,得到多維尺度分析圖,如圖5所示。從圖5中可以看出,第一象限集中的信息服務(wù)、知識服務(wù)等關(guān)鍵詞,可概括為信息服務(wù)類;同樣第二、三、四象限可依次概括為圖書館技術(shù)、數(shù)字資源和數(shù)字化大類。
通過SPSS系統(tǒng)聚類分析和多維尺度分析結(jié)果可知,兩種分析方法得到的有關(guān)高校數(shù)字圖書館研究熱點(diǎn)的結(jié)果類似。經(jīng)過歸納可知,現(xiàn)在高校數(shù)字圖書館的研究主題為數(shù)字資源的建設(shè)、有關(guān)數(shù)字圖書館技術(shù)的提升以及信息服務(wù)。
(五)學(xué)位論文研究熱點(diǎn)分布
一篇文獻(xiàn)的關(guān)鍵詞是文章核心內(nèi)容的濃縮和提煉,如果某一關(guān)鍵詞在其所在領(lǐng)域的文獻(xiàn)中反復(fù)出現(xiàn),則可反映出該關(guān)鍵詞或主題詞所表征的研究主題是該領(lǐng)域的研究熱點(diǎn)[9]163-171?;诖耍疚倪x用學(xué)位論文的關(guān)鍵詞來研究高校數(shù)字圖書館的研究熱點(diǎn)。在本研究采用的508篇碩博士學(xué)位論文中,經(jīng)過同義合并,保留關(guān)鍵詞1335個,詞頻數(shù)最高的關(guān)鍵詞“數(shù)字圖書館”“高校圖書館”“圖書館”(共計229頻次)與本文研究題目一致,不能表征研究熱點(diǎn),對此類關(guān)鍵詞進(jìn)行剔除處理。由于在本次研究中,頻次大于7的18個關(guān)鍵詞(稱為高頻關(guān)鍵詞)分布較為集中,能較好地反映研究內(nèi)容;而頻次小于7的關(guān)鍵詞分布離散,不能清晰地說明碩博士學(xué)位論文關(guān)于高校數(shù)字圖書館的研究熱點(diǎn)。故繪制高頻關(guān)鍵詞及其詞頻對應(yīng)關(guān)系如表1所示。
通過對比表1中的關(guān)鍵詞可以發(fā)現(xiàn):頻次為30的“信息服務(wù)”、頻次為19的“個性化服務(wù)”、 頻次為14的“數(shù)字參考咨詢”等雖然在研究中有不同的側(cè)重點(diǎn),但總體研究都基本圍繞“圖書館服務(wù)”開展;類似同義詞詞匯在低頻關(guān)鍵詞中也有出現(xiàn)。筆者分析,這一方面是由于部分作者對“數(shù)據(jù)”“信息”“知識”“情報”等概念化詞匯認(rèn)識不清;另一方面是由于不同詞匯確實(shí)表征不同的核心概念,很多作者為了更清晰地描述,斟酌選擇了不同詞匯造成的。而“數(shù)字參考咨詢”作為圖書館服務(wù)的一部分,也被列入此類。
如上文所述,“圖書館服務(wù)”成為碩博士在完成有關(guān)高校數(shù)字圖書館的學(xué)位論文時研究的最大熱點(diǎn),不同作者從“信息”“知識”等方面展開研究,體現(xiàn)了當(dāng)今社會以用戶為核心的服務(wù)模式,這不僅是服務(wù)行業(yè)的重要認(rèn)知,圖書館作為服務(wù)部門,更應(yīng)該加強(qiáng)以用戶為核心的理念,積極探索新方法新思路,以在“互聯(lián)網(wǎng)+”的時代背景下保持和增強(qiáng)其吸引力。
以“數(shù)字資源”“數(shù)據(jù)挖掘”“信息資源”為關(guān)鍵詞的研究關(guān)注了圖書館資源的獲取,主要分析了在保證提供傳統(tǒng)紙質(zhì)資源的同時,對電子圖書、數(shù)據(jù)庫等資源的獲取和使用。較多論文從技術(shù)層面研究資源的組織建設(shè)等,鮮有研究關(guān)注這些數(shù)字資源的使用情況,尤其是很多高?;ㄖ亟鹳徣霐?shù)據(jù)庫,以方便在校生查詢獲取較多學(xué)習(xí)資源,但實(shí)際上這些數(shù)據(jù)庫的利用率較低,許多本科生只有在撰寫學(xué)士學(xué)位論文時才開始使用;碩博士研究生中,文科類專業(yè)利用率相對較高,許多工科專業(yè)仍不重視數(shù)據(jù)庫的使用,總體利用率較低。針對這種現(xiàn)象,筆者認(rèn)為,一方面,研究人員應(yīng)多關(guān)注數(shù)字資源的利用情況,提供研究成果供高校和學(xué)生反思;另一方面,高校應(yīng)加大對各種數(shù)據(jù)庫的宣傳和指導(dǎo)使用,可以考慮在課程作業(yè)中加入相關(guān)要求,以提高數(shù)字資源的利用率。
表1 高頻關(guān)鍵詞詞頻表(頻次大于7)
以“XML”“關(guān)聯(lián)規(guī)則”“元數(shù)據(jù)”“J2EE”為關(guān)鍵詞的研究關(guān)注了計算機(jī)技術(shù)在高校數(shù)字圖書館建設(shè)中的重要作用,主要論述了資源組織、整合、建設(shè)、推廣等方面的技術(shù)支撐。XML和J2EE等技術(shù)體現(xiàn)了當(dāng)下計算機(jī)技術(shù)研究和應(yīng)用的熱點(diǎn)。筆者在研究中發(fā)現(xiàn),高校數(shù)字圖書館的建設(shè)固然以計算機(jī)技術(shù)為支撐,但技術(shù)應(yīng)以理論為基礎(chǔ),理論通過技術(shù)發(fā)展,很多學(xué)科如管理學(xué)、傳播學(xué)、社會學(xué)的理論已較為完善,研究人員可以通過借鑒不同學(xué)科的理論來發(fā)展和完善高校數(shù)字圖書館的理論,采用理論與技術(shù)結(jié)合的方式推動高校數(shù)字圖書館的研究。
本研究以碩博士學(xué)位論文為數(shù)據(jù)來源,以社會科學(xué)統(tǒng)計分析軟件為研究工具,結(jié)合文獻(xiàn)計量學(xué)相關(guān)理論基礎(chǔ),對“我國高校數(shù)字圖書館”現(xiàn)狀進(jìn)行梳理,并借助關(guān)鍵詞聚類分析了研究熱點(diǎn),從多個角度展示了研究特點(diǎn),并揭示了一些現(xiàn)象。
我國高校數(shù)字圖書館的研究自受到關(guān)注以來,整體上研究數(shù)量呈現(xiàn)增長趨勢,而且參與高校數(shù)字圖書館研究的學(xué)科日益增多,研究范圍逐漸增大。其中, 圖書館情報與檔案管理、計算機(jī)科學(xué)與技術(shù)、信息與通信工程三個一級學(xué)科的學(xué)位論文數(shù)量居多,圖書館情報與檔案管理仍是高校數(shù)字圖書館研究的主要學(xué)科,而圖書館情報與檔案管理、計算機(jī)科學(xué)與技術(shù)兩個學(xué)科在全部有關(guān)高校數(shù)字圖書館的學(xué)位論文研究中占據(jù)了較大比重,一方面肯定了其作用,另一方面也促使后來者從這兩個學(xué)科入手對高校數(shù)字圖書館進(jìn)行深入研究。吉林大學(xué)、湘潭大學(xué)、南京農(nóng)業(yè)大學(xué)、電子科技大學(xué)、黑龍江大學(xué)等五家單位已成為高校數(shù)字圖書館的主要研究機(jī)構(gòu)。研究熱點(diǎn)相對突出,數(shù)字資源、信息服務(wù)和數(shù)據(jù)挖掘等技術(shù)成為高校數(shù)字圖書館的主要研究熱點(diǎn)和方向。數(shù)字資源的建設(shè)、有關(guān)數(shù)字圖書館技術(shù)的提升以及信息服務(wù)成為高校數(shù)字圖書館的研究主題。
雖然總體看來我國高校數(shù)字圖書館碩博士學(xué)位論文數(shù)量增長較快,但自2013年以來呈現(xiàn)出下降趨勢,這說明有關(guān)高校數(shù)字圖書館的研究進(jìn)入到一個成熟階段,接下來可根據(jù)前文所述從相關(guān)研究熱點(diǎn)如數(shù)字圖書館技術(shù)和信息服務(wù)等領(lǐng)域?qū)で笸黄疲匀〉酶碌难芯砍晒?。有關(guān)高校數(shù)字圖書館的研究廣泛分布于多種學(xué)科,跨學(xué)科之間的學(xué)術(shù)、技術(shù)交流可以相互促進(jìn)。同時,目前參與高校數(shù)字圖書館研究的均為高等院校,這在一定程度上限制了該項(xiàng)研究的進(jìn)步,各研究單位可以考慮與研究院所及各大公立圖書館合作,例如采用產(chǎn)學(xué)研聯(lián)合培養(yǎng)研究生模式等,在不同研究模式的結(jié)合中尋找突破。
[1]王元.高校數(shù)字圖書館信息安全保障研究[J].圖書情報工作,2010,(S2).
[2]唐琳.從碩士、博士學(xué)位論文看北京大學(xué)人文地理學(xué)研究熱點(diǎn)和發(fā)展趨勢[J].圖書情報工作,2013,(S2).
[3]韋景竹,董寶蕾.圖書館版權(quán)侵權(quán)案例研究[J].圖書館論壇,2015,(11).
[4]李蔭濤.情報學(xué)的權(quán)威法則淺論[J].情報理論與實(shí)踐,1992,(6).
[5]徐志彬.基于長尾理論效應(yīng)構(gòu)建圖書館新型信息服務(wù)模式[J].內(nèi)蒙古科技與經(jīng)濟(jì),2012,(16).
[6]鐘偉金,李佳,楊興菊.共詞分析法研究(三)——共詞聚類分析法的原理與特點(diǎn)[J].情報雜志,2008,(7).
[7]趙蓉英,李飛.基于社會網(wǎng)絡(luò)分析方法的國內(nèi)外信息計量比較研究[J].情報科學(xué),2013,(2).
[8]杜強(qiáng),賈麗艷,嚴(yán)先鋒.SPSS統(tǒng)計分析從入門到精通:第2版[M].北京:人民郵電出版社,2014.
[9]馬費(fèi)成,張勤.國內(nèi)外知識管理研究熱點(diǎn)——基于詞頻的統(tǒng)計分析[J].情報學(xué)報,2006,(2).
(責(zé)任編輯 李逢超)
2017-02-23
國家社科基金項(xiàng)目“復(fù)雜動態(tài)環(huán)境下產(chǎn)業(yè)集群創(chuàng)新中的群體知識協(xié)同行為與機(jī)制研究”(13CGL012);山東理工大學(xué)青年教師發(fā)展支持計劃項(xiàng)目“科技型小微企業(yè)技術(shù)創(chuàng)新風(fēng)險管理中競爭情報保障研究”(SDLG4052)。
王克平,男,山東淄博人,山東理工大學(xué)科技信息研究所副研究館員、碩士生導(dǎo)師,情報學(xué)博士;蘇艷麗,女,山東菏澤人,山東理工大學(xué)科技信息研究所研究生。
G350
A
1672-0040(2017)04-0083-05