亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        對(duì)CALIS查收查引系統(tǒng)的測試和應(yīng)用效果評(píng)價(jià)

        2016-09-28 08:15:32馬芳珍李峰季梵劉姝王旭
        關(guān)鍵詞:系統(tǒng)測試

        馬芳珍 李峰 季梵++劉姝++王旭++劉素清

        摘要:CALIS論文收錄及引用檢索系統(tǒng)是基于圖書館論文收錄及引用檢索業(yè)務(wù)開發(fā)的一款軟件,具有較強(qiáng)的實(shí)用價(jià)值。北京大學(xué)圖書館對(duì)該系統(tǒng)進(jìn)行了六輪測試和近半年的試用,得出對(duì)該系統(tǒng)的功能評(píng)價(jià)和核心模塊測試結(jié)果,據(jù)此為系統(tǒng)的進(jìn)一步改進(jìn)提出建議。

        關(guān)鍵詞 查收查引 系統(tǒng)測試 系統(tǒng)評(píng)價(jià)CALIS

        分類號(hào)G250.7

        DOI 10.16603/i.issnl002-1027.2016.02.015

        1.背景

        查收查引服務(wù)是檢索證明機(jī)構(gòu)根據(jù)委托人提供的已發(fā)表文章的題名、作者、出版時(shí)間等信息,檢索文章在參考數(shù)據(jù)庫中的收錄和被引用情況,并出具相應(yīng)的論文收錄及引用報(bào)告。目前北京大學(xué)圖書館查收查引服務(wù)的檢索數(shù)據(jù)源包括WOS(Web of Sci-ence)平臺(tái)的SCI(Science Citation Index)、SSCI(So-cial Sciences Citation Index)、A&HCI(Art&Hu-manity Citation Index)、CPCI-S(Conference Pro-ceedings Citation Index-Science)和CPCI-SSH(Conference Proceedings Citation Index-Social Sci-enees & Humanities)英文數(shù)據(jù)庫和CSCD(ChineseScience Citation Database,中國科學(xué)引文數(shù)據(jù)庫)、CSSCI(Chinese Social Science Citation Index,中文社會(huì)科學(xué)引文索引數(shù)據(jù)庫)。

        由于引用者標(biāo)注的引用格式不規(guī)范、數(shù)據(jù)庫誤標(biāo)誤引、作者重名等原因,查收查引工作容易出現(xiàn)漏檢、誤檢、自引誤判等問題,需要檢索人員耗費(fèi)大量時(shí)間反復(fù)判斷,也為全自動(dòng)化的查收查引工作的實(shí)現(xiàn)帶來很大困難,因此許多機(jī)構(gòu)仍采用手工檢索的方式。但手工檢索的人力和時(shí)間成本較高,難以滿足委托高峰期的用戶需求。目前已有許多關(guān)于手工檢索技巧、流程規(guī)范等方面的研究文獻(xiàn),也有一些機(jī)構(gòu)開發(fā)了論文查收查引工具。北京大學(xué)圖書館的李曉東、盧振波曾提出通過工具軟件實(shí)現(xiàn)作者論文數(shù)據(jù)的采集、自動(dòng)檢索和自動(dòng)下載等功能,但許多功能僅有構(gòu)想框架,并未實(shí)踐。中國科學(xué)院文獻(xiàn)情報(bào)中心的查收查引報(bào)告自動(dòng)生成系統(tǒng)基本實(shí)現(xiàn)了英文文獻(xiàn)預(yù)處理一收錄檢索一引用檢索一報(bào)告生成功能,但對(duì)中文數(shù)據(jù)庫的檢索卻未涉及。山東大學(xué)圖書館的師曉青梳理了高校圖書館查收查引的工作流程,但沒涉及檢索過程的自動(dòng)化。除了開發(fā)軟件,樊亞芳、陳鍇等提出利用Excel的篩選功能和EndNote Web等文獻(xiàn)管理軟件輔助檢索,改進(jìn)手工檢索和統(tǒng)計(jì)流程。

        為了提高查收查引的工作效率,實(shí)現(xiàn)工作智能化,CALIS技術(shù)中心與北京大學(xué)圖書館聯(lián)合開發(fā)了CALIS論文收錄及引用檢索系統(tǒng)(以下簡稱查收引系統(tǒng))。系統(tǒng)開發(fā)完成后,接到許多同行的咨詢,為更好地分享使用經(jīng)驗(yàn),本文從工作流程、基本功能和檢索結(jié)果等層面來論述系統(tǒng)的評(píng)測結(jié)果。

        2.查收引系統(tǒng)的功能測評(píng)

        北京大學(xué)圖書館信息咨詢部于2014年11月至2015年4月進(jìn)行了查收引系統(tǒng)的測試和試運(yùn)行,共完成428個(gè)委托單、10517篇文獻(xiàn)的檢索,具體檢索情況見表1。

        在試運(yùn)行過程中主要對(duì)系統(tǒng)的基本功能和流程、文獻(xiàn)檢索準(zhǔn)確性這兩項(xiàng)內(nèi)容進(jìn)行了重點(diǎn)測試和驗(yàn)證。

        2.1查收引系統(tǒng)的基本功能和流程使用評(píng)測

        在手工環(huán)境中,查收引服務(wù)主要分為10個(gè)步驟(見圖1)。查收引系統(tǒng)完全實(shí)現(xiàn)對(duì)步驟3-8和步驟10的管理,步驟1、2、9目前仍然采用傳統(tǒng)方式,準(zhǔn)備在系統(tǒng)升級(jí)版中實(shí)現(xiàn)相關(guān)功能。

        經(jīng)過六輪測試和系統(tǒng)改進(jìn),查收引系統(tǒng)在功能上能夠完成對(duì)查收查引業(yè)務(wù)的規(guī)范管理的需求,流程控制順暢,操作步驟簡單。查收引系統(tǒng)的主操作界面見圖2。

        對(duì)查收引系統(tǒng)的功能和流程管理的試用主要考察三個(gè)方面:正確性、易用性和可靠性。正確性是指能夠正確完成指令;易用性是指操作便利流暢;可靠性是指控制有效,能處理錯(cuò)誤操作,有回滾機(jī)制等。試用結(jié)果顯示,查收引系統(tǒng)的各模塊均滿足正確性和可靠性要求,表2為對(duì)各模塊功能的易用性評(píng)價(jià)。

        2.2對(duì)查收引系統(tǒng)功能的測評(píng)

        2.2.1對(duì)英文數(shù)據(jù)庫的查收引功能測評(píng)

        查收引系統(tǒng)支持在WOS核心庫和EI數(shù)據(jù)庫的論文檢索功能,包括SCI、SSCI、AHCI、CPCI-SCPCI-SSH和EI數(shù)據(jù)庫的收錄檢索,以及SCI、SS-CI、AHCI數(shù)據(jù)庫的引用檢索。

        (1)對(duì)英文數(shù)據(jù)庫的查收錄功能測評(píng)。

        查收引系統(tǒng)的收錄檢索包括兩部分:一是查詢委托文獻(xiàn)是否被目標(biāo)數(shù)據(jù)庫收錄,二是對(duì)檢索到收錄的文獻(xiàn),從數(shù)據(jù)庫中獲取規(guī)范信息并自動(dòng)更新到系統(tǒng)中。

        系統(tǒng)抽取文獻(xiàn)的作者、題名、刊名、發(fā)表年份等信息字段,使用預(yù)設(shè)的檢索策略對(duì)文獻(xiàn)逐條檢索,如果命中記錄則終止檢索。系統(tǒng)再根據(jù)匹配策略判斷命中記錄為完全匹配或疑似匹配。有疑似匹配時(shí),系統(tǒng)將提示工作人員進(jìn)行人工確認(rèn)。

        對(duì)于正確規(guī)范的論文清單,系統(tǒng)檢索結(jié)果的正確率接近100%;對(duì)于部分信息有誤的論文清單或缺失信息較多時(shí),系統(tǒng)會(huì)出現(xiàn)未檢索到等問題。表3即為系統(tǒng)檢索英文文獻(xiàn)的測試結(jié)果。

        表3中“人工再確認(rèn)”是指檢索結(jié)果與原文獻(xiàn)清單有部分不一致,或原論文清單信息缺失,系統(tǒng)無法判斷,需要人工干預(yù)。由于系統(tǒng)在匹配策略中設(shè)置了合理的容錯(cuò)機(jī)制,因此即使論文信息不完全準(zhǔn)確,仍可在不需要人工干預(yù)的情況下準(zhǔn)確命中大多數(shù)記錄。同時(shí)系統(tǒng)設(shè)計(jì)了便利人工干預(yù),因此館員可以輕松地在系統(tǒng)提供的近似結(jié)果中進(jìn)行判斷和選擇。

        “錯(cuò)誤檢索”主要是由于文獻(xiàn)清單有誤或者數(shù)據(jù)庫信息不規(guī)范導(dǎo)致數(shù)據(jù)庫有收錄而未用系統(tǒng)檢出的情況,因此當(dāng)系統(tǒng)反饋“未收錄”結(jié)果時(shí)仍需謹(jǐn)慎對(duì)待,核查用戶提供的文獻(xiàn)信息是否準(zhǔn)確。

        (2)對(duì)英文數(shù)據(jù)庫的查引用功能測評(píng)。

        查收引系統(tǒng)的查引用是將用戶提交的文獻(xiàn)清單按檢索策略進(jìn)行檢索,并自動(dòng)對(duì)檢索結(jié)果進(jìn)行匹配和過濾,將完全匹配和近似匹配的記錄下載到系統(tǒng)中供館員確認(rèn),“校對(duì)引證”的界面見圖3。

        引用查全率是查收引系統(tǒng)關(guān)注的重點(diǎn)問題之一,在實(shí)際檢索過程中,由于數(shù)據(jù)庫的引文信息易出現(xiàn)錯(cuò)誤,并且受作者署名習(xí)慣、引文習(xí)慣等因素的影響,會(huì)導(dǎo)致漏檢和錯(cuò)檢。針對(duì)可能出現(xiàn)的諸多問題,系統(tǒng)通過組合多種策略,從多個(gè)角度檢索文獻(xiàn)的被引信息。查收引系統(tǒng)檢索英文文獻(xiàn)的引用信息的正確率見表4。

        表4中,“錯(cuò)誤檢索”是指由于數(shù)據(jù)庫中的施引文獻(xiàn)信息不規(guī)范而未檢索出的情況(這種情況下,人工檢索也無法查到)。值得提出的是,部分?jǐn)?shù)據(jù)庫中

        不規(guī)范或錯(cuò)引的信息,系統(tǒng)也能很好地檢出并作為近似結(jié)果供館員選擇,例如:

        1)能夠正確識(shí)別作者各種形式的簡稱,例如linzc、lin z、zc lin、z lin。

        2)施引文獻(xiàn)與論文年份前后相差一年的情況,如查詢某篇2007年文獻(xiàn)的引用情況,數(shù)據(jù)庫中有3篇施引文獻(xiàn)將其標(biāo)注為2006年,手工可能漏檢,而系統(tǒng)通過放寬條件能夠檢索到。

        綜上所述,查收引系統(tǒng)的收錄和引用檢索策略采用機(jī)器判斷+人工判斷的機(jī)制,英文文獻(xiàn)的檢索結(jié)果基本上能夠達(dá)到人工檢索的標(biāo)準(zhǔn),部分檢索結(jié)果甚至超過人工檢索。

        2.2.2對(duì)中文數(shù)據(jù)庫的查收引功能測評(píng)

        查收引系統(tǒng)支持在CSCD和CSSCI數(shù)據(jù)庫檢索中文文獻(xiàn)。中文數(shù)據(jù)庫的檢索策略與英文數(shù)據(jù)庫類似,但是由于中文數(shù)據(jù)庫的特點(diǎn),也有不同之處。

        (1)對(duì)中文數(shù)據(jù)庫的查收錄功能測評(píng)。

        系統(tǒng)檢索中文文獻(xiàn)收錄的步驟與英文數(shù)據(jù)庫一致,但檢索策略和匹配策略都進(jìn)行了調(diào)整。檢索中文數(shù)據(jù)庫時(shí),對(duì)中文題名和期刊題名等信息都進(jìn)行了檢索前的過濾和字段規(guī)范,濾掉了所有非中文字符,用空格代替;在結(jié)果匹配階段又增加了切分詞處理,以保證部分匹配值的計(jì)算。系統(tǒng)檢索中文文獻(xiàn)的收錄情況見表5。

        中文文獻(xiàn)的查收錄功能可以發(fā)現(xiàn)“錯(cuò)誤檢索”的情況,例如:

        1)年份錯(cuò)誤。如論文為2007年發(fā)表,而數(shù)據(jù)庫錯(cuò)寫為2001年,與原文年代跨度較大。

        2)論文題名有錯(cuò)誤,同時(shí)數(shù)據(jù)庫里的信息也有誤。如《突發(fā)性泥沙災(zāi)害危險(xiǎn)性快速區(qū)劃方法》,作者是倪晉仕、劉仁志,作者誤將題目寫為《突發(fā)性泥土災(zāi)害危險(xiǎn)性快速區(qū)劃方法》,誤將作者寫成倪晉仁、劉仁志),因此系統(tǒng)未檢出。

        (2)對(duì)中文數(shù)據(jù)庫的查引用功能測評(píng)。

        CSCD與CSSCI數(shù)據(jù)庫在引用檢索時(shí)有一個(gè)最大的不同是CSCD不能使用題名檢索,因此需要單獨(dú)制定CSCD的檢索策略。查收引系統(tǒng)對(duì)中文數(shù)據(jù)庫的查引用情況如表6所示。

        雖然有錯(cuò)誤檢索,但系統(tǒng)具有很好的容錯(cuò)率,可識(shí)別很多特殊情況,例如:

        1)學(xué)報(bào)類期刊的多種書寫格式,如北京大學(xué)學(xué)報(bào)(自然科學(xué)版)、北京大學(xué)學(xué)報(bào)·自然科學(xué)版和北京大學(xué)學(xué)報(bào)(自然科學(xué)版)等寫法,系統(tǒng)都能檢出。

        2)三個(gè)作者以上的文獻(xiàn),如果作者名字寫錯(cuò),如王妍和王研,系統(tǒng)也可檢出。

        3)CSCD在被引檢索中只顯示部分作者,對(duì)于多作者文章,如一篇論文作者有宋述光/季建清/魏春景/蘇犁/鄭亞東/宋彪/張立飛,在CSCD的引文檢索時(shí)只顯示前三位,但引用此文的文章有一篇出現(xiàn)了作者蘇犁,人工判斷自引和他引時(shí)容易出錯(cuò),而系統(tǒng)可根據(jù)來源文獻(xiàn)智能判斷。

        2.3查收引系統(tǒng)的邊界和特例測試

        (1)作者數(shù)量超多的情況。

        在識(shí)別自引和他引問題上,作者數(shù)量多少是準(zhǔn)確快速判別的主要條件,一般情況下,文章作者多為5人以內(nèi),但有一些團(tuán)體作者的文章,作者數(shù)量可達(dá)幾千個(gè)。例如以北京大學(xué)物理學(xué)院的班老師發(fā)表在PHYSICS LETTERS B(2014)的文章Constraintson the Higgs boson width from off-shell produc-tion and decay to Z-boson pairs,作者有2138個(gè),但使用系統(tǒng)從新建清單到完成報(bào)告只需5分鐘。

        (2)單篇文章引用數(shù)量超大的情況。

        大多數(shù)文獻(xiàn)的被引量在100條以內(nèi),手工檢索和下載也很便利。但個(gè)別文獻(xiàn)的單篇引用量多達(dá)幾千條,由于WOS平臺(tái)的“打印下載”的條數(shù)限制(每次下載50條),一篇文獻(xiàn)的引用信息就需要幾十次翻頁和下載。例如北京大學(xué)物理學(xué)院的湯老師,有兩篇文章的被引次數(shù)分別為3567和2409次,如果手工下載,要翻頁72次和49次,但系統(tǒng)可在10分鐘內(nèi)自動(dòng)完成下載。

        (3)委托人文章數(shù)量超多的情況。

        對(duì)于委托人查詢論文的數(shù)量為上百篇的,例如北京大學(xué)物理學(xué)院的余老師查詢論文406篇,地球與空間學(xué)院的黃老師的團(tuán)隊(duì)查詢論文358篇,在時(shí)間緊迫時(shí),需分配多人同時(shí)檢索,再合并檢索結(jié)果。合并時(shí)要調(diào)整編號(hào)和表格,由于文檔較大處理非常耗時(shí),而系統(tǒng)則可自動(dòng)完成檢索并將結(jié)果合并。

        3.查收引系統(tǒng)的應(yīng)用效果

        3.1提高館員的工作效率

        查收引系統(tǒng)支持多進(jìn)程、多任務(wù)并行,可同時(shí)處理多個(gè)數(shù)據(jù)庫的檢索。例如建筑設(shè)計(jì)、心理學(xué)等專業(yè),由于其跨學(xué)科性質(zhì),論文在各數(shù)據(jù)庫都可能有收錄或引用,使用系統(tǒng)進(jìn)行多庫并行檢索,檢索總耗時(shí)約為手工的三分之一。系統(tǒng)還設(shè)置了語種識(shí)別功能,允許中英文文獻(xiàn)同步檢索,系統(tǒng)會(huì)根據(jù)預(yù)先設(shè)定的語種自動(dòng)識(shí)別檢索庫。其次,系統(tǒng)避免了處理檢索中斷的損失。在手工檢索的時(shí)候,一般逐條檢索完畢后再統(tǒng)一導(dǎo)出結(jié)果,如遇數(shù)據(jù)庫或電腦的突然故障,會(huì)導(dǎo)致檢索結(jié)果丟失。使用查收引系統(tǒng),即使系統(tǒng)前臺(tái)頁面關(guān)閉、電腦關(guān)閉,系統(tǒng)后臺(tái)仍會(huì)繼續(xù)運(yùn)行,不會(huì)丟失。再次,由于系統(tǒng)是自動(dòng)檢索,在下班前建立委托單,可充分利用夜間進(jìn)行自動(dòng)檢索,第二天上班后核對(duì)檢索結(jié)果??傊槭找到y(tǒng)通過多種途徑節(jié)省了館員的工作時(shí)間,提高了工作效率。

        3.2改善用戶體驗(yàn)和圖書館服務(wù)質(zhì)量

        較手工檢索而言,使用查收引系統(tǒng)縮短了檢索時(shí)間,提高了處理效率,在保障本校委托的基礎(chǔ)上,還能在高峰期接納部分校外讀者的委托。同時(shí),系統(tǒng)實(shí)現(xiàn)了檢索結(jié)果的結(jié)構(gòu)化存儲(chǔ),用戶可對(duì)同一委托提出不同需求,獲得多份不同排列組合的報(bào)告。另外,除了正式的檢索報(bào)告,系統(tǒng)還可提供文獻(xiàn)的收錄引用情況的概覽清單,讓用戶輕松了解概況。由于查收引系統(tǒng)支持多種檢索策略并行,在用戶提供的文獻(xiàn)信息部分有誤時(shí),也能獲得較高的結(jié)果準(zhǔn)確率。以上這些方面,使用戶獲得更好的服務(wù)體驗(yàn),提升了圖書館的服務(wù)質(zhì)量。

        4.對(duì)查收引系統(tǒng)的展望

        經(jīng)大量測試和多次改進(jìn),查收引系統(tǒng)基本滿足高校圖書館的服務(wù)需求,極大緩解了人力資源緊張,實(shí)用價(jià)值較強(qiáng)。但系統(tǒng)仍有進(jìn)一步改善的空間,如在功能上應(yīng)增加網(wǎng)上委托、用戶跟蹤委托情況、歷史委托結(jié)果查詢等,數(shù)據(jù)接口應(yīng)支持多樣化文獻(xiàn)的列表導(dǎo)入,檢索報(bào)告可增加期刊影響因子、委托人為第一作者的文獻(xiàn)數(shù)等輔助標(biāo)識(shí)和統(tǒng)計(jì),為用戶提供更多信息等。

        目前,CALLS中心已經(jīng)對(duì)70多家大學(xué)圖書館開通CALLS論文收錄及引用檢索系統(tǒng)的試用,包括7所985高校。希望借助本文分享系統(tǒng)的測試結(jié)果和應(yīng)用效果,在大家的共同努力下,把高校圖書館的查收查引工作逐步推向自動(dòng)化、智能化,大大提高科研支撐服務(wù)的效率。

        猜你喜歡
        系統(tǒng)測試
        水質(zhì)監(jiān)測智能巡航船的設(shè)計(jì)與實(shí)現(xiàn)
        基于LoRa技術(shù)的礦井?dāng)?shù)據(jù)監(jiān)測系統(tǒng)的設(shè)計(jì)與研究
        基于智能控制算法的自動(dòng)駕駛系統(tǒng)優(yōu)化研究
        南京大學(xué)大型高性能計(jì)算集群平臺(tái)建設(shè)研究
        自動(dòng)化對(duì)廣播發(fā)射工作的影響
        移動(dòng)邊緣計(jì)算系統(tǒng)服務(wù)器測試方法
        基于AFDX總線的數(shù)據(jù)監(jiān)測與管理系統(tǒng)設(shè)計(jì)
        基于.NET的維漢居民信息管理系統(tǒng)測試研究
        互聯(lián)網(wǎng)平臺(tái)下的智能信息管理系統(tǒng)設(shè)計(jì)
        微弱信號(hào)檢測裝置的設(shè)計(jì)
        华人在线视频精品在线| 久久男人av资源网站无码| 亚洲中文字幕人妻诱惑| 亚洲第一黄色免费网站| 精品国产这么小也不放过| 熟妇高潮一区二区三区在线观看 | 国产午夜久久久婷婷| 国产av普通话对白国语| 久久精品国产av麻豆五月丁| 无人区一码二码三码四码区| 青草福利在线| 国产精品久久中文字幕亚洲| 久久久精品国产性黑人| 久久久av精品波多野结衣| 久久久亚洲经典视频| 国产三级c片在线观看| 亚洲av色影在线| 99久久99久久精品国产片果冻| 亚洲AV乱码毛片在线播放| 亚州av高清不卡一区二区| 狠狠人妻久久久久久综合蜜桃| 全免费a级毛片免费看视频| 99精品国产av一区二区| 亚洲最大中文字幕熟女| 国产成人a∨激情视频厨房| 蜜臀久久99精品久久久久久小说| 91精品91久久久久久| 国产午夜精品视频在线观看| 无码人妻一区二区三区免费视频 | 日本高清一级二级三级| 中文字幕一区在线观看视频| 国产国语对白一区二区三区| 看一区二区日本视频免费 | 男女性爽大片视频| 亚洲妓女综合网99| 手机av男人天堂免费网址| 在线精品国产亚洲av蜜桃| 亚洲中文字幕无码爆乳| 久久露脸国产精品WWW| 日韩少妇人妻精品中文字幕| 边喂奶边中出的人妻|