尹燕
關(guān)鍵詞:?全文數(shù)據(jù)庫;CAJD;ASP;比較研究
摘 要:?文?章以CAJD和ASP全文電子期刊數(shù)據(jù)庫為例,從檢索功能、檢索結(jié)果處理、個性化服務(wù)等方面進行比較分析,并在此基礎(chǔ)上提出了完善各項服務(wù)功能及擴大全文獲取范圍的建議,以期對學(xué)界和業(yè)界有所幫助。
隨著互聯(lián)網(wǎng)技術(shù)的快速發(fā)展,數(shù)字資源迅速進入社會生活的各個方面,人們獲取知識的途徑已經(jīng)不再局限于印刷的書籍、期刊、報紙等,而是大量使用網(wǎng)絡(luò)上的數(shù)字化資源。數(shù)據(jù)庫資源作為龐大的數(shù)字化資源,在目前的科研、教學(xué)等領(lǐng)域被廣泛使用,并發(fā)揮著舉足輕重的作用。作為電子數(shù)據(jù)庫的重要組成部分,期刊全文數(shù)據(jù)庫包含目錄、摘要和全文等內(nèi)容,并對期刊文獻(xiàn)資源進行了較為科學(xué)系統(tǒng)的整合,同時提供回溯服務(wù)?[1]。筆者主要以CAJD和ASP兩種國內(nèi)外全文學(xué)術(shù)期刊數(shù)據(jù)庫為例,從數(shù)據(jù)庫的檢索功能設(shè)置現(xiàn)狀、檢索結(jié)果處理情況以及數(shù)據(jù)庫為用戶提供的個性化服務(wù)等方面進行系統(tǒng)比較,并分析了兩個數(shù)據(jù)庫的優(yōu)勢和不足,在此基礎(chǔ)上進一步提出相關(guān)改進建議。
1 CAJD和ASP全文期刊數(shù)據(jù)庫基本情況
1.1 CAJD數(shù)據(jù)庫
《中國學(xué)術(shù)期刊(網(wǎng)絡(luò)版)》(簡稱CAJD)是世界上最大的連續(xù)動態(tài)更新的中國學(xué)術(shù)期刊全文數(shù)據(jù)庫,是“十一五”國家重大網(wǎng)絡(luò)出版工程的子項目,是《國家“十一五”時期文化發(fā)展規(guī)劃綱要》中國家“知識資源數(shù)據(jù)庫”出版工程的重要組成部分。其內(nèi)容覆蓋自然科學(xué)、人文社會科學(xué)、醫(yī)學(xué)、農(nóng)學(xué)等領(lǐng)域。截至目前,CAJD共收錄國內(nèi)學(xué)術(shù)期刊10,975種,全文文獻(xiàn)總量6,000余萬篇,分為基礎(chǔ)科學(xué)、工程科技、農(nóng)學(xué)、醫(yī)學(xué)、哲學(xué)與人文科學(xué)、社會科學(xué)、信息科技、經(jīng)濟與管理科學(xué)等10個專輯,同時又參考《中國圖書分類法》(第五版)詳細(xì)劃分為168個專題。CAJD數(shù)據(jù)庫收錄自1915年至今出版的期刊,并提供3,500余種期刊的回溯至創(chuàng)刊的檢索,其中收錄核心期刊共1,955種?[2]。
1.2 ASP數(shù)據(jù)庫
Academic Search Premier(簡稱ASP)數(shù)據(jù)庫,為EBSCO host(史蒂芬斯數(shù)據(jù)庫)數(shù)據(jù)庫提供全部11個數(shù)據(jù)庫服務(wù)中的最大的綜合學(xué)科參考類全文期刊數(shù)據(jù)庫,由美國EBSCO Publishing出版,也是目前全球最大的綜合性學(xué)科全文數(shù)據(jù)庫之一?[3]。ASP數(shù)據(jù)庫涵蓋社會科學(xué)、自然科學(xué)、醫(yī)學(xué)等研究領(lǐng)域,?提供4,600多種期刊全文,其中包括3,900多種同行評審期刊的全文,同時還提供100多種期刊自1975年或更早期發(fā)表的PDF格式資料以及1,000?多種期刊的可搜索引用參考文獻(xiàn)。ASP數(shù)據(jù)庫通過EBSCOhost數(shù)據(jù)庫進行每日更新。
2 檢索功能比較
2.1 檢索途徑
檢索途徑是影響用戶選擇和使用數(shù)據(jù)庫的重要因素,檢索途徑多樣化早已成為各個數(shù)據(jù)庫商最大的追求,以分面分類和主題分類的檢索途徑呈現(xiàn)已成為一種普遍做法。CAJD數(shù)據(jù)庫和ASP數(shù)據(jù)庫所提供的檢索途徑在已有數(shù)據(jù)庫中頗具代表性,具體檢索途徑見表1。
從表1可以看出,CAJD數(shù)據(jù)庫提供了比ASP數(shù)據(jù)庫更多的檢索途徑。CAJD提供的一框式檢索和ASP提供的基本檢索,基本上都可以實現(xiàn)一步檢索,這兩種數(shù)據(jù)庫都為用戶提供了先進的檢索系統(tǒng)和檢索選擇。但相比較而言,CAJD的專業(yè)檢索需要專業(yè)檢索技巧,反映了該數(shù)據(jù)庫對傳統(tǒng)檢索技術(shù)的綜合運用,可以彌補解決復(fù)雜檢索問題時運用菜單檢索的不足。全文句子檢索和作者檢索為檢索某一作者全部發(fā)文情況或某一句的論文出處提供了便捷的檢索途徑。
2.2 檢索字段
雖然CAJD和ASP兩個數(shù)據(jù)庫都提供了比如篇名、摘要、全文、作者、主題詞等檢索字段,但具體來講,其檢索字段存在一定的差異性。CAJD數(shù)據(jù)庫提供的檢索字段除上述列舉的內(nèi)容之外,還提供了參考文獻(xiàn)、中圖分類號、欄目信息和DOI檢索字段,而ASP提供GE、PS、CO、IC、DN、TK、IS、IB和AN等檢索字段。相比之下,ASP提供的檢索字段似乎更加全面。雖然CAJD數(shù)據(jù)庫沒有像ASP一樣將檢索字段統(tǒng)一歸納在檢索對話框中,但CAJD數(shù)據(jù)庫在高級檢索功能中將期刊來源、作者單位、來源類別、期刊支持基金等其他一些檢索字段另行列出,同時增加網(wǎng)絡(luò)首發(fā)、增強出版、數(shù)據(jù)論文、中英文擴展、同義詞擴展等限定檢索,這與ASP提供的檢索字段的限制結(jié)果選項的主旨思想基本一致。兩個數(shù)據(jù)庫檢索字段的最大不同之處在于,ASP提供的檢索字段并非僅僅屬于ASP數(shù)據(jù)庫,還適用于EBSCOhost數(shù)據(jù)庫中包含的所有子數(shù)據(jù)庫,而CAJD數(shù)據(jù)庫則設(shè)置有單獨屬于本庫的特殊檢索字段。
2.3 檢索技術(shù)
CAJD和ASP兩個數(shù)據(jù)庫均提供了AND、OR及NOT三種邏輯算符。此外,ASP還提供了符號檢索,包括通配符?和*以及位置算符N和W。通配符?和*可替代一個字符,對于不確定的詞可以使用。例如,用戶輸入Re?d可以找到read,Reid,Reed。*可替代0~N個字符,可用于查找不同意義的詞。例如,用戶輸入walk可以找到walk,walking,walked,walkway。位置算符包括N和W。N算符代表檢索詞與檢索詞之間允許加入其他檢索詞,檢索詞的數(shù)量視用戶的需求而定,而檢索詞的擺列順序則為任意。W算符包括表示檢索詞與檢索之間允許加入其他檢索詞,檢索詞的數(shù)量視用戶需要而定,檢索詞的順序依輸入檢索詞的順序排列?[4]。例如,taxW8reform可以檢索出taxreform,但不能檢索出reformofincometax。
3 對檢索結(jié)果的處理比較
如何處理檢索結(jié)果是評估數(shù)據(jù)庫質(zhì)量的重要指標(biāo)之一。一個好的網(wǎng)絡(luò)數(shù)據(jù)庫的檢索過程應(yīng)該是簡單、方便和易操作的,檢索結(jié)果的處理也是清晰明了的。CAJD和ASP兩個數(shù)據(jù)庫檢索結(jié)果的處理比較見表2。
從?表2可以看出,兩個數(shù)據(jù)庫在全文數(shù)據(jù)信息組織方面的主要思想大致相同,如二者的文獻(xiàn)檢索結(jié)果排序功能、檢索功能、標(biāo)記功能、收藏功能及文獻(xiàn)導(dǎo)出參考功能等基本一致。但是,筆者發(fā)現(xiàn),CAJD數(shù)據(jù)庫提供的文獻(xiàn)基本上都可以全文下載,但ASP數(shù)據(jù)庫大量文獻(xiàn)僅僅提供全文鏈接,無法直接進行全文下載,給用戶使用該數(shù)據(jù)庫帶來了諸多不便。
4 個性化服務(wù)
伴?隨著互聯(lián)網(wǎng)技術(shù)和其他智能技術(shù)的迅速發(fā)展,部分圖書館在逐步開展個性化服務(wù)的同時,一些國內(nèi)外網(wǎng)絡(luò)數(shù)據(jù)庫商也紛紛開始借助網(wǎng)絡(luò)技術(shù),以更加迅猛的態(tài)勢持續(xù)不斷地推出網(wǎng)絡(luò)數(shù)據(jù)庫產(chǎn)品,并免費為用戶提供個性化服務(wù)。CAJD和ASP數(shù)據(jù)庫也為用戶提供了數(shù)據(jù)庫個性化服務(wù),但是,用戶如果想獲得數(shù)據(jù)庫所提供的免費的個性化服務(wù),就需要在所使用的數(shù)據(jù)庫系統(tǒng)中進行新用戶注冊。CAJD和ASP數(shù)據(jù)庫為用戶提供的個性化服務(wù)見表3。
CAJD數(shù)據(jù)庫提供免費訂閱服務(wù),在用戶訂閱的內(nèi)容有更新或關(guān)注的文獻(xiàn)有新的引用時,系統(tǒng)會定期發(fā)送郵件或短信通知訂閱用戶;可視化服務(wù)為用戶提供檢索到的期刊發(fā)表的年度趨勢;分組瀏覽則可以滿足用戶對檢索結(jié)果的學(xué)科、發(fā)表年度、基金、研究層次、作者和機構(gòu)等不同需求的歸類瀏覽。同時,CAJD在每一頁檢索列表末尾呈現(xiàn)該主題領(lǐng)域研究的知名專家,在列表邊緣呈現(xiàn)檢索到的期刊來源、期刊類別、關(guān)鍵詞以及檢索歷史、瀏覽歷史和下載歷史,在單篇期刊呈現(xiàn)時則為用戶提供較為完整的知網(wǎng)節(jié)和相關(guān)文獻(xiàn)以及引文內(nèi)容。
ASP數(shù)據(jù)庫在檢索首頁為用戶提供檢索技巧的說明和幫助鏈接,在語言選擇對話框中為用戶提供了30種語言選擇,通過登錄首選項設(shè)置可以實現(xiàn)用戶登錄并保存首選項,供以后會話時使用(設(shè)置項包括常規(guī)設(shè)置、結(jié)果列表顯示、打印、電子郵件和保存導(dǎo)出設(shè)置等)。而搜索歷史記錄/快訊則可以直接為用戶呈現(xiàn)以往的檢索詞語、檢索選項、檢索模式及檢索結(jié)果等歷史記錄。
相比之下,CAJD數(shù)據(jù)庫提供的個性化服務(wù)內(nèi)容更加豐富,但CAJD數(shù)據(jù)庫檢索結(jié)果的可視化僅僅是檢索結(jié)果的淺顯視圖,可視化結(jié)果揭示遠(yuǎn)遠(yuǎn)不如如CiteSpace、VOSviewer、SATI等可視化軟件,且文本內(nèi)容挖掘不夠,參考價值不大。ASP數(shù)據(jù)庫為用戶提供了30種語言選擇,充分顯示了其全球性的綜合期刊全文數(shù)據(jù)庫的戰(zhàn)略定位。
5 綜合評價
CAJD和ASP兩個數(shù)據(jù)庫都是綜合性的全文數(shù)據(jù)庫,涵蓋了廣泛的學(xué)科范圍,基本上都包括自然科學(xué)、社會科學(xué)、哲學(xué)等所有學(xué)科的期刊內(nèi)容。從檢索功能的角度看,CAJD和ASP兩個數(shù)據(jù)庫基本上都可以滿足用戶的信息檢索需求,并有多種瀏覽和檢索方式,檢索技術(shù)也較為先進,包括邏輯運算符、位置運算符、通配符等算符的使用和配置。具體體現(xiàn)在:①檢索結(jié)果呈現(xiàn)方式較為全面。如:檢索結(jié)果可以二次檢索、按照用戶需求自主排序、文章標(biāo)記及全文下載等。②用戶服務(wù)較為個性化。如:定期向數(shù)據(jù)庫用戶推送所關(guān)注的期刊目錄、檢索結(jié)果更新、論文下載引用等個性化信息。
6 建議
6.1 不斷完善各項服務(wù)功能
盡管ASP數(shù)據(jù)庫可以標(biāo)記檢索結(jié)果,但其無法查看標(biāo)記的檢索結(jié)果(查看選定的結(jié)果),缺少下載標(biāo)記檢索結(jié)果的功能;CAJD數(shù)據(jù)庫缺少直接將檢索結(jié)果發(fā)送到用戶電子郵箱的功能,這給用戶利用全文數(shù)據(jù)庫帶來諸多不便。另外,在輸出結(jié)果可視化分析方面,ASP數(shù)據(jù)庫應(yīng)該盡快采取相關(guān)技術(shù),將可視化文本分析技術(shù)引入該數(shù)據(jù)庫,而CAJD數(shù)據(jù)庫需要在可視化過程中不斷提高文本挖掘的深度和數(shù)據(jù)挖掘的質(zhì)量。筆者認(rèn)為,CAJD和ASP數(shù)據(jù)庫應(yīng)該改進和增加搜索功能,使數(shù)據(jù)庫個性化服務(wù)功能更加完善。
6.2 擴大全文的獲取范圍
CAJD和ASP數(shù)據(jù)庫雖然都宣稱自己是全文數(shù)據(jù)庫,但事實證明由于受版權(quán)、網(wǎng)絡(luò)通道、IP地址等限制,兩個數(shù)據(jù)庫中大部分文章的全文不能直接通過Internet進行下載。筆者認(rèn)為,CAJD和ASP兩個數(shù)據(jù)庫商應(yīng)該進一步擴大期刊全文的搜集及下載范圍,為數(shù)據(jù)庫用戶快速獲取高質(zhì)量的全文資源提供便利,從而不斷提高學(xué)術(shù)資源利用效率,最大限度地發(fā)揮數(shù)據(jù)庫的學(xué)術(shù)價值及商業(yè)價值。
7 結(jié)語
隨著互聯(lián)網(wǎng)和計算機人工智能技術(shù)、數(shù)據(jù)庫技術(shù)的發(fā)展,國內(nèi)外數(shù)據(jù)庫出版商紛紛依托其不斷完善全文期刊數(shù)據(jù)庫的數(shù)據(jù)搜集、資源整合、信息組織、信息檢索、信息呈現(xiàn)、用戶信息等個性化服務(wù)功能。在此背景下,業(yè)界更應(yīng)該比較國內(nèi)外重要數(shù)據(jù)庫的服務(wù)現(xiàn)狀,分析其存在的相關(guān)問題,通過問題的及時發(fā)現(xiàn)與解決,推動數(shù)據(jù)庫本身的完善與用戶使用體驗的提升。
參考文獻(xiàn):
[1] ?路雅祺.國外四種綜合全文電子期刊數(shù)據(jù)庫比較研究?[J].現(xiàn)代情報,2007(2):155-158.
[2] 中國知網(wǎng)簡介?[EB/OL].?[2018-03-27].http://navi.cnki.net/KNavi/Journal.html.
[3] 雷順利.EBSCO數(shù)據(jù)庫的綜合評價:與ProQuest平臺的比較?[J].圖書館建設(shè),2008(8):45-49.
[4]?趙琪,相平.高校圖書館應(yīng)用教程?[M].西安:西北工業(yè)大學(xué)出版社,2011:107-110.