亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于WOS API的論文自動(dòng)查收查引程序設(shè)計(jì)與實(shí)現(xiàn)

        2019-04-12 08:28:40營(yíng)
        圖書館研究與工作 2019年4期
        關(guān)鍵詞:網(wǎng)頁(yè)檢索次數(shù)

        高 營(yíng)

        (深圳大學(xué)城圖書館 廣東深圳 518055)

        1 引言

        科技論文是科研人員研究的結(jié)晶,其被各類數(shù)據(jù)庫(kù)收錄及被引用的次數(shù)在一定程度上能反映學(xué)者的科研能力和水平,因此論文查收查引證明被廣泛應(yīng)用于職稱評(píng)定、課題申報(bào)、獎(jiǎng)勵(lì)申報(bào)、人才選拔、科研評(píng)估以及成果鑒定等工作中[1-3]。由于其可計(jì)量以及具有相對(duì)客觀性等,查收查引服務(wù)目前仍然是高校圖書館信息檢索工作的一項(xiàng)重要內(nèi)容。

        隨著我國(guó)科研論文數(shù)量的增加,論文收錄引用的需求隨之增加,深圳大學(xué)城圖書館(以下簡(jiǎn)稱“我館”)近年來(lái)一直呈上升趨勢(shì),2017年全年完成查收查引報(bào)告1 414份,檢索文獻(xiàn)30 018篇。論文查收查引服務(wù)是工作量大、重復(fù)度高的勞動(dòng),以人工為主的工作方式已難以滿足及時(shí)、高質(zhì)量的服務(wù)要求[4-6]。同時(shí)委托人一般會(huì)在項(xiàng)目申報(bào)截止前較短時(shí)間集中申請(qǐng)論文查收查引證明,導(dǎo)致同時(shí)收到大量委托,更增加了工作難度。圖書館員們從各種方面研究如何提高工作效率,目前已有許多關(guān)于手工檢索技巧、流程規(guī)范等方面的研究文獻(xiàn)[1-3,7]。中國(guó)科學(xué)技術(shù)大學(xué)樊亞芳、陳鍇等提出利用Excel的篩選功能、Endnotes Web以及EndNote、NoteExpress等文獻(xiàn)管理軟件輔助檢索,改進(jìn)檢索和統(tǒng)計(jì)流程[1-2,7]。華南理工大學(xué)圖書館涂穎哲利用工具軟件進(jìn)行論文查收查引,但其他引查詢?nèi)孕枰斯みM(jìn)行二次檢索[8]。也有一些機(jī)構(gòu)開發(fā)了論文查收查引工具,如中國(guó)科學(xué)院系統(tǒng)[9-10]以及CALIS技術(shù)中心與北京大學(xué)圖書館聯(lián)合開發(fā)的CALIS論文收錄及引用系統(tǒng)[11]。查收查引自動(dòng)化工作有較好的設(shè)計(jì)和實(shí)現(xiàn),但系統(tǒng)較為復(fù)雜,需要進(jìn)行購(gòu)買且每個(gè)圖書館有其各自不同的需求,有一些功能不能完全滿足。

        論文查收查引工作中他引次數(shù)的查詢手工檢索步驟復(fù)雜,在整個(gè)工作中占用較多工作量。我館查收查引工作中他引次數(shù)采用的嚴(yán)格排自引,即引用文獻(xiàn)和被引用文獻(xiàn)中,只要有一個(gè)作者相同即為自引。通常情況下,論文查收查引中的去除自引論文工作是利用WOS(Web of Science)數(shù)據(jù)庫(kù)的作者分析功能及精煉檢索功能來(lái)完成的,這種方法適用于對(duì)于他人引用次數(shù)不多或者需檢索引用情況的文獻(xiàn)合作者不多時(shí),當(dāng)用戶查詢的論文引用過(guò)多或者原論文合作者過(guò)多時(shí),如果檢索人員仍使用精煉檢索將無(wú)法完成多合作者引用的排除[2,12],該方法工作量大且容易出錯(cuò)。上述作者排除法需要對(duì)每一篇論文的被引論文列表進(jìn)行一次操作,存在大量的重復(fù)勞動(dòng),工作效率低下。中國(guó)科學(xué)技術(shù)大學(xué)樊亞芳等采用EndNote、NoteExpress等文獻(xiàn)管理軟件中的檢索功能來(lái)解決這個(gè)問(wèn)題,利用檢索功能在被引論文Library中查找作者含有被檢索人的論文,即可批量去除自引論文,利用Label 功能分類統(tǒng)計(jì)總他引頻次[1-2]。該方法能減少一定的勞動(dòng)強(qiáng)度,但需要下載所有施引文獻(xiàn)。哈爾濱工業(yè)大學(xué)圖書館李莘等采用的他人引用查詢方法在當(dāng)用戶查詢的論文引用過(guò)多或者原論文合作者過(guò)多時(shí),如果檢索人員仍使用精煉檢索將無(wú)法完成多合作者引用的排除,巧用WOS數(shù)據(jù)庫(kù)的高級(jí)檢索功能,將高級(jí)檢索功能與被引參考文獻(xiàn)檢索結(jié)合完成 SCI/SSCI/A&HCI多合作者自引的排除,檢索方式為:#1 NOT AU=(被引文章所有作者的姓名),其中#1為被引文獻(xiàn)標(biāo)題[12]。高級(jí)檢索的方法存在一個(gè)問(wèn)題,如果論文作者非常多,手工編寫檢索并不是一個(gè)簡(jiǎn)單的方法。華南理工大學(xué)圖書館涂穎哲的論文查收查引工具軟件的他引查詢過(guò)程可以軟件提取作者列表,然后在Word軟件里利用查找替換生成檢索式來(lái)進(jìn)行查詢[8]。

        我館采用的他引查詢方法是利用檢索式排除作者的方法,在工作中采用Word宏來(lái)輔助生成WOS平臺(tái)排除自引檢索式來(lái)輔助檢索,這種方法可以在一定程度上減少手工工作,但未減少在線檢索的步驟,仍需要花費(fèi)較多的時(shí)間。

        電子科技大學(xué)藺梅芳應(yīng)用Python語(yǔ)言開發(fā)的SCI引文檢索自動(dòng)化軟件能夠?qū)崿F(xiàn)4種他引標(biāo)準(zhǔn)下的引文檢索,該軟件他引判斷方法通過(guò)程序讀入施引文獻(xiàn),進(jìn)行作者字段比較來(lái)排除自引,仍需要下載所有施引文獻(xiàn)記錄,且檢索過(guò)程采用模擬瀏覽器訪問(wèn)方式來(lái)獲取數(shù)據(jù)[13]。

        我們?cè)诠ぷ髦薪Y(jié)合工作實(shí)際,利用Python語(yǔ)言開發(fā)了WOS他引查詢軟件,利用WOS平臺(tái)提供的APIs(Web of Science Web Services)獲取數(shù)據(jù),采用SOAP(Simple Object Access Protocol)可以直接獲取WOS平臺(tái)提供的格式化數(shù)據(jù)。程序可以提取輸入內(nèi)容中的WOS入藏號(hào),自動(dòng)生成相關(guān)檢索式進(jìn)行檢索,直接獲得他引次數(shù),減少人工操作的步驟,大大減輕了工作強(qiáng)度,提高了準(zhǔn)確度,并且結(jié)果具有可重復(fù)性。

        2 設(shè)計(jì)與實(shí)現(xiàn)

        2.1 設(shè)計(jì)思路

        軟件模擬人工查詢他引次數(shù)的步驟,實(shí)現(xiàn)自動(dòng)獲得他引次數(shù),具體流程如下(見圖1)。

        圖1 他引查詢程序流程圖

        輸入信息可以直接從Word文件或網(wǎng)頁(yè)信息復(fù)制粘貼含有入藏號(hào)的信息,也可以輸入WOS平臺(tái)導(dǎo)出記錄文件,軟件從輸入信息中利用正則匹配提取所有入藏號(hào)信息。軟件按照入藏號(hào)通過(guò)WOS API查詢引用次數(shù),如果引次數(shù)為0次則不進(jìn)行他引次數(shù)查詢,如果引用次數(shù)大于0次,進(jìn)入他引查詢步驟,直至查詢完成所有入藏號(hào)的查詢,顯示輸出結(jié)果。

        2.2 開發(fā)語(yǔ)言選擇

        Python語(yǔ)言誕生于20世紀(jì)90年代初,現(xiàn)今已經(jīng)成為最受歡迎的程序設(shè)計(jì)語(yǔ)言之一[14],在最近的Git Hub排行榜中名列前茅。Python是一種解釋型、面向?qū)ο?、?dòng)態(tài)數(shù)據(jù)類型的高級(jí)程序設(shè)計(jì)語(yǔ)言,有豐富的標(biāo)準(zhǔn)庫(kù)和其他一些擴(kuò)展庫(kù),可以用較少的代碼完成一些復(fù)雜的工作。并且Python具有簡(jiǎn)單、易學(xué)、免費(fèi)、開源等諸多優(yōu)點(diǎn)。GitHub中有非常多的代碼實(shí)例可供參考,是一種易于閱讀和方便編寫代碼的語(yǔ)言,因此我們選擇Python作為開發(fā)語(yǔ)言。

        2.3 WOS平臺(tái)API

        藺梅芳等開發(fā)的引文自動(dòng)化檢索軟件[13]和涂穎哲開發(fā)的論文查收查引工具軟件[8]等均采用模擬瀏覽器訪問(wèn)的方式來(lái)獲取數(shù)據(jù),通過(guò)分析網(wǎng)頁(yè)結(jié)構(gòu)來(lái)提取數(shù)據(jù)。這種方式有可能受到網(wǎng)頁(yè)讀取速度的影響[13],如果網(wǎng)站升級(jí)網(wǎng)頁(yè)結(jié)構(gòu)變化,則需要修改程序來(lái)適應(yīng)相應(yīng)的變化,利用WOS API可以避免這些影響。

        Web of Science Web Services[15]是基于SOAP 1.1 (Simple Object Access Protocol,簡(jiǎn)單對(duì)象訪問(wèn)協(xié)議)和WSDL 1.1(Web Services Description Language,網(wǎng)絡(luò)服務(wù)描述語(yǔ)言)的API,用于訪問(wèn)和搜索Web of Science數(shù)據(jù)庫(kù)訂閱內(nèi)容。該API有兩個(gè)服務(wù)接口WOKMWSAuthenticate和WokSearch。其中WOKMWSAuthenticate是身份驗(yàn)證和會(huì)話管理服務(wù),WokSearch提供數(shù)據(jù)檢索服務(wù)??梢栽趯W(xué)校或機(jī)構(gòu)IP范圍內(nèi)通過(guò)WOKMWSAuthenticate接口獲取授權(quán)信息,然后通過(guò)WokSearch接口來(lái)進(jìn)行檢索和獲取數(shù)據(jù)??梢酝ㄟ^(guò)該API可獲取到格式規(guī)范的XML數(shù)據(jù)(見圖2),由于僅獲取所需要的數(shù)據(jù),不需要打開整個(gè)網(wǎng)頁(yè),可避免受到網(wǎng)頁(yè)讀取速度或網(wǎng)站改版的影響,且所獲取數(shù)據(jù)具有穩(wěn)定、規(guī)范的數(shù)據(jù)結(jié)構(gòu)。

        圖2 通過(guò)WOS API獲取數(shù)據(jù)結(jié)構(gòu)

        2.4 實(shí)現(xiàn)過(guò)程

        WOS數(shù)據(jù)庫(kù)收錄的每一篇文章都有一個(gè)唯一的入藏號(hào),入藏號(hào)是以“WOS:”開頭,后面是15—16位數(shù)字或字母組成的編號(hào),我們可以用正則表達(dá)式(WOS:w{15,16})來(lái)匹配提取所有入藏號(hào)。

        通過(guò)Python的suds庫(kù)訪問(wèn)WOS API來(lái)獲取數(shù)據(jù)(見圖3),通過(guò)WOKMWSAuthenticate接口的authenticate操作來(lái)獲取授權(quán)會(huì)話session SID,并將獲得的授權(quán)信息加入搜索進(jìn)程。WokSearch服務(wù)有7個(gè)檢索操作[15],包括search、citedReference、citingArticles、relatedRecords、retrieveById、citedReferencesRetrieve、retrieve。其中Search查詢可以提交查詢并返回結(jié)果,與網(wǎng)頁(yè)界面高級(jí)檢索查詢功能返回結(jié)果一致;citingArticles查詢可以獲取引用查詢文章的所有文章,我們可以通過(guò)這個(gè)功能檢索引用次數(shù);可以結(jié)合search和citingArticles進(jìn)行他引次數(shù)查詢。首先通過(guò)citingArticles查詢文章的所有引用次數(shù),即總引次數(shù),同時(shí)通過(guò)這個(gè)查詢可以獲得所查詢文章的詳細(xì)信息以及該查詢的查詢序號(hào)(queryId),從所得詳細(xì)信息中提取出所有作者列表,生成檢索式#queryId NOT AU=(被引文章所有作者的姓名),通過(guò)search查詢獲得他引次數(shù)及他引文章列表信息。

        圖3 程序?qū)崿F(xiàn)過(guò)程

        為了方便其他同事利用該程序,利用wxPython編寫可視化界面GUI(見圖4),并用pyinstaller打包成獨(dú)立的exe文件,可以拷貝到任何電腦使用,不需要電腦安裝Python環(huán)境的步驟。程序可以通過(guò)導(dǎo)入文本格式文件來(lái)提取入藏號(hào),檢索完成后可以導(dǎo)出csv格式的文件,方便后續(xù)工作。

        圖4 他引次數(shù)查詢程序界面

        3 效果分析

        軟件開發(fā)以來(lái)已經(jīng)使用兩年有余,期間經(jīng)歷WOS從湯森路透到科睿唯安的轉(zhuǎn)變,均能穩(wěn)定使用。由于使用步驟簡(jiǎn)便,輸出結(jié)果穩(wěn)定可靠,可以節(jié)約大量時(shí)間,減少重復(fù)性勞動(dòng),提高工作效率,得到了查收查引工作人員的認(rèn)可。

        表1比較了本文程序及涂穎哲[8]、王學(xué)勤[9]和藺梅芳[13]所發(fā)表論文的引文檢索用時(shí),本程序同藺梅芳文章中的程序用時(shí)相當(dāng),在引用查詢方面優(yōu)于其他兩篇文章中的程序。因?yàn)榫鶠镻ython語(yǔ)言編寫,均采用多線程,考慮樣本選擇、網(wǎng)絡(luò)環(huán)境等可能存在差異,效率基本相當(dāng),但其結(jié)果有部分還需要人工復(fù)核。本程序通過(guò)兩次檢索可以得到他引查詢結(jié)果。

        表1 引文查詢用時(shí)相關(guān)文獻(xiàn)比較

        此外,本程序具有非常好的擴(kuò)展性,除了可以檢索WOS總引、他引外,通過(guò)設(shè)置檢索數(shù)據(jù)庫(kù)范圍還可以檢索SCI總引和他引。通過(guò)設(shè)置檢索時(shí)間范圍,可以滿足一些特殊的需要。比如某項(xiàng)目需要檢索近5年的SCI引用情況,通過(guò)修改檢索時(shí)間范圍timespan開始和結(jié)束時(shí)間,就可以完成相應(yīng)他引次數(shù)的查詢。比如某大型科技公司集團(tuán)有近千篇SCI收錄論文,其科技辦工作人員想知道每個(gè)月其所有論文的被引次數(shù)變化,如果通過(guò)人工檢索工作量可想而知,經(jīng)常需要幾天的時(shí)間,對(duì)本程序進(jìn)行簡(jiǎn)單修改,只需要一個(gè)小時(shí)左右即可完成檢索,省時(shí)省力,而且還能保證數(shù)據(jù)準(zhǔn)確可靠。

        4 結(jié)語(yǔ)

        本文利用程序來(lái)進(jìn)行他人引用次數(shù)的查詢,減輕了工作強(qiáng)度,并且減少了人為操作帶來(lái)的誤差和錯(cuò)誤,有很好的重復(fù)性和穩(wěn)定性。程序?yàn)閱挝募问?,方便傳播及使用,得到了檢索人員的好評(píng)。

        在后續(xù)工作中可以在軟件的易用性、美觀性等方面進(jìn)行改進(jìn)。例如,可建立數(shù)據(jù)庫(kù)保存相關(guān)人員的論文記錄,下次再進(jìn)行檢索時(shí)僅需要檢索新增加記錄即可;除了檢索總引次數(shù)和他引次數(shù)外,可同時(shí)導(dǎo)出檢索論文列表及引文列表,更進(jìn)一步可生成出具報(bào)告的相關(guān)內(nèi)容和格式,最大程度地降低人工工作強(qiáng)度。

        猜你喜歡
        網(wǎng)頁(yè)檢索次數(shù)
        機(jī)場(chǎng)航站樓年雷擊次數(shù)計(jì)算
        2020年,我國(guó)汽車召回次數(shù)同比減少10.8%,召回?cái)?shù)量同比增長(zhǎng)3.9%
        商用汽車(2021年4期)2021-10-13 07:16:02
        一類無(wú)界算子的二次數(shù)值域和譜
        2019年第4-6期便捷檢索目錄
        基于CSS的網(wǎng)頁(yè)導(dǎo)航欄的設(shè)計(jì)
        電子制作(2018年10期)2018-08-04 03:24:38
        基于URL和網(wǎng)頁(yè)類型的網(wǎng)頁(yè)信息采集研究
        電子制作(2017年2期)2017-05-17 03:54:56
        依據(jù)“次數(shù)”求概率
        專利檢索中“語(yǔ)義”的表現(xiàn)
        專利代理(2016年1期)2016-05-17 06:14:36
        網(wǎng)頁(yè)制作在英語(yǔ)教學(xué)中的應(yīng)用
        10個(gè)必知的網(wǎng)頁(yè)設(shè)計(jì)術(shù)語(yǔ)
        国产品精品久久久久中文| 激情综合色五月丁香六月欧美 | 欧美国产亚洲精品成人a v| 亚洲av第一区综合激情久久久 | 精品无码一区二区三区爱欲| 天天综合网天天综合色| 精品四虎免费观看国产高清| 能看的网站中文字幕不卡av| 一本色道久久综合亚洲| 国产亚洲自拍日本亚洲| 丰满少妇a级毛片野外| 国产主播福利一区二区| 女人一级特黄大片国产精品| 在线播放亚洲丝袜美腿| 免费观看成人欧美www色| 中文字幕日本特黄aa毛片| 国产剧情国产精品一区| 国产熟女av一区二区三区四季| 日韩av天堂一区二区| 白丝兔女郎m开腿sm调教室| 亚洲特黄视频| 成人偷拍自拍在线视频| 精品一区二区三区芒果| 三a级做爰片免费观看| 亚洲国产无线乱码在线观看| 亚洲精品中文字幕乱码二区| 人成在线免费视频网站| 亚洲av日韩av无码污污网站| 99国产精品久久久蜜芽| 女同在线视频一区二区 | 2021国产精品国产精华| 国内精品伊人久久久久av| 久久中文字幕av一区二区不卡| 18岁日韩内射颜射午夜久久成人| 无码一区二区波多野结衣播放搜索| 欧美成人网视频| 大量漂亮人妻被中出中文字幕| 亚洲国产精品va在线看黑人| 伊人久久一区二区三区无码| 午夜国产精品一区二区三区| 久久久久亚洲av成人片|