[摘 要]浙江大學(xué)科技查新工作站把文獻(xiàn)檢索與管理系統(tǒng)NoteExpress成功應(yīng)用于查新過程中對相關(guān)文獻(xiàn)的格式處理,極大地提高了查新工作的效率。
[關(guān)鍵詞]科技查新;NoteExpress;樣式;過濾器
DOI:10.3969/j.issn.1008-0821.2010.08.042
[中圖分類號]G252.7;G354.4 [文獻(xiàn)標(biāo)識碼]B [文章編號]1008-0821(2010)08-0152-03
Application of NoteExpress for Sci-Tech Novelty RetrievalChuan Rong
(Library,Zhejiang University,Hangzhou 310027,China)
[Abstract]Library of Zhejiang university has succeeded in applying NoteExpress to the management of documents during the process of science information consulting.By using NoteExpress,it has solved the repetitive and time-consuming data format processing problems,and improved working efficiency greatly as well.
[Keywords]sci-tech novelty retrieval;NoteExpress;style;filters
NoteExpress(以下簡稱NE)是北京愛琴海軟件公司開發(fā)的、符合國內(nèi)用戶需求的專業(yè)文獻(xiàn)檢索與管理系統(tǒng)。NE可以通過各種途徑自動搜索在線數(shù)據(jù)庫、下載、管理文獻(xiàn)資料和論文,其最具特色的功能是能方便地導(dǎo)入許多的中文文獻(xiàn)數(shù)據(jù)庫,如維普、萬方、CNKI、CBM的參考文獻(xiàn)。目前國內(nèi)多家高校已購買了該軟件,高校的師生已能免費享用NE給論文撰寫、參考文獻(xiàn)管理帶來的便利??萍疾樾逻^程與撰寫論文過程有一個共通之處就是要檢索和處理大量的文獻(xiàn),但由于NE在制作樣式和過濾器方面比較麻煩,一直未見公開發(fā)表的中文文獻(xiàn)中報道查新人員使用NE的情況。筆者嘗試制作和修正了NE的樣式和過濾器,實現(xiàn)了將查新常用的幾個中外文數(shù)據(jù)庫的相關(guān)文獻(xiàn)題錄按照本查新工作站制定的規(guī)范導(dǎo)入、導(dǎo)出。NE應(yīng)用于查新工作的結(jié)果產(chǎn)生了明顯成效,把原來查新報告撰寫過程中最機(jī)械、重復(fù)性最高、費時多的文獻(xiàn)格式處理過程簡化成在檢索數(shù)據(jù)庫的同時輕點幾下鼠標(biāo)就能瞬間完成。通過對NE各功能的學(xué)習(xí)以及制作NE相關(guān)樣式和過濾器的嘗試,目前已成功實現(xiàn)將維普、中國知網(wǎng)、萬方、中國生物醫(yī)學(xué)文獻(xiàn)數(shù)據(jù)庫、中國專利信息網(wǎng)、ISI Web of Knowledge、Ei Village、PubMed中涉及的期刊、會議、學(xué)位論文、專利4種類型的文獻(xiàn)題錄通過NE轉(zhuǎn)換成我們規(guī)定的著錄格式。在此,筆者將NE樣式、過濾器的制作經(jīng)驗與大家分享。
1 NoteExpress的查新樣式、過濾器的制作
雖然NE本身自帶多種中外文期刊參考文獻(xiàn)格式,但多只能按某一特定的期刊樣式輸出,輸出的格式往往不符合各查新工作站的規(guī)范。我們查新工作站在2007年根據(jù)《教育部科技查新工作站查新報告撰寫規(guī)范》的要求,結(jié)合國家標(biāo)準(zhǔn)《文后參考文獻(xiàn)著錄規(guī)則GB/T 7714-2005》,制定了本站的查新報告撰寫規(guī)范,對期刊、會議、學(xué)位論文、專利、成果、書等各類文獻(xiàn)的著錄格式做了不同程度地修改和補(bǔ)充。為了能將這么強(qiáng)大的文獻(xiàn)管理軟件用于查新工作,需要對NE樣式和過濾器進(jìn)行重新制作。
1.1 新建輸出樣式
比較方便的辦法是直接選用NE自帶的Annotated(Multilingual)樣式作為基本輸出樣式,我們在它的基礎(chǔ)上進(jìn)行了局部修改,創(chuàng)建了本查新工作站的輸出樣式,它使NE中的各類文獻(xiàn)題錄在統(tǒng)一的界面中按我們的規(guī)范顯示。
第一步是常規(guī)設(shè)置。樣式編輯器提供了對姓名、頁碼、日期、期刊命名格式、引文格式、題錄格式、腳注格式等的設(shè)置。對于姓名、頁碼、日期等的設(shè)置相對簡單,NE在線教程中都有詳細(xì)說明。
第二步是題錄模板設(shè)置。在圖1中可見“參考文獻(xiàn)模版”中提供了“題錄類型”和“插入字段”兩個按鈕。點擊各按鈕,系統(tǒng)會分別彈出一個菜單,通過對菜單中字段的選擇,我們可以在模版中添加文獻(xiàn)類型或插入字段。Annotated(Multilingual)樣式的“題錄—模版”已經(jīng)包括了通用、期刊文章、會議論文集、學(xué)位論文、書等題錄類型,一般不需要自己再做文獻(xiàn)類型的添加。但是需要對每種題錄的字段、格式進(jìn)行修改。每個“題錄——模版”必需有一個“通用”題錄類型,不能把它刪除,NE對無法識別的題錄類型自動按“通用”題錄類型輸出樣式。其余的題錄類型(如:期刊、學(xué)位論文等)的輸出樣式可以根據(jù)自己的需要進(jìn)行適當(dāng)?shù)膭h除或添加。在修改每種題錄樣式的字段時首先要使用“插入字段”按鈕。比如在“期刊文章”題錄類型中,想要在“作者”后面的“()”中添加作者單位信息,就要單擊“插入字段”按鈕,然后在彈出菜單中選擇插入的字段名稱“作者地址”就可以完成該設(shè)置。此外還有一種情況,數(shù)據(jù)庫中的字段(如:專利的公告號、公告日期)在NE中沒有定義,造成NE無法導(dǎo)入這些字段內(nèi)容,這時就需要對NE中自帶的“自定義字段”進(jìn)行設(shè)置來增加這些字段的定義。在樣式編輯器中的字段和字符之間要遵循系統(tǒng)的分割規(guī)則,否則在輸出樣式中的字段和字段之間就會因沒有空格或符號而挨在一塊兒,或者產(chǎn)生錯誤的輸出結(jié)果。最常用的是連接符“”和分隔符“|”,它們能夠規(guī)定不同字段輸出的間隔。在實際操作中需要根據(jù)導(dǎo)入的題錄信息不斷地修正設(shè)置,才能直到得出令人滿意的輸出結(jié)果。
第三步就是要為導(dǎo)出的內(nèi)容添加序號和摘要以構(gòu)成查新要求的完整的題錄信息。查新員在進(jìn)行相關(guān)文獻(xiàn)的初步對比分析時非常需要這些摘要信息。這個步驟可以在“題錄——前綴與后綴”中完成。把字段“題錄編號”添加到題錄前綴文本,把“摘要”字段添加到題錄后綴文本就完成了整個樣式的編輯。此外還可以對輸出樣式的字體、字號等進(jìn)行設(shè)置,使NE的瀏覽界面能夠滿足多種閱讀需求。
NoteExpress在科技查新工作中的應(yīng)用Aug.,2010圖1 樣式編輯器——題錄類型
圖2 樣式編輯器——插入字段
最后就是要將NE中按新的輸出樣式處理好的記錄導(dǎo)出到WORD文檔。選中NE中的一條或多條記錄,單擊鼠標(biāo)右鍵,選擇“格式化復(fù)制”,再粘貼到WORD文檔中,就可以在WORD文檔中保存經(jīng)NE轉(zhuǎn)換過的整齊、規(guī)范的文獻(xiàn)題錄了。新建樣式的輸出結(jié)果請看圖3。圖3 新建樣式的輸出結(jié)果
1.2 新建過濾器
過濾器是數(shù)據(jù)導(dǎo)入NE的關(guān)鍵步驟,不管是在線檢索還是指定格式數(shù)據(jù)導(dǎo)入,都需要使用過濾器。NE通過過濾器將一條或者多條題錄的信息準(zhǔn)確提取并準(zhǔn)確存到指定的字段中去。NE已經(jīng)具有許多查新常用的數(shù)據(jù)庫過濾器,如:NoteExpress、重慶維普、萬方系列、中國知網(wǎng)系列、CBM、專利數(shù)據(jù)庫——知識產(chǎn)權(quán)網(wǎng)、Web of Science、Refman-(RIS)、PubMed。但是并不是每個數(shù)據(jù)庫都提供完全符合我們要求的題錄字段。比如萬方數(shù)據(jù)庫中期刊類型的題錄按NoteExpress格式輸出,輸出的樣式中缺少起止頁碼。而同樣的期刊類型的題錄按萬方數(shù)據(jù)庫 “查新”格式輸出,輸出的樣式中有頁碼,但是NE沒有萬方數(shù)據(jù)庫查新格式的過濾器,“查新”格式輸出的題錄信息就無法導(dǎo)入到NE。在這種情況下有兩種解決方法,一是在按照NE格式導(dǎo)入后,手動添加起止頁碼;另一種就是要創(chuàng)建一個新的萬方——查新格式的過濾器。新建過濾器要比新建輸出樣式麻煩的多,要涉及計算機(jī)專業(yè)知識——正則表達(dá)式。
首先在“過濾器編輯器—常規(guī)”中設(shè)置過濾器的全局信息,對過濾器名稱,制作人,類型,注釋等進(jìn)行設(shè)置。然后對“過濾器編輯器——過濾器”進(jìn)行設(shè)置,這部分工作最重要。圖5顯示的是維普過濾器的編輯器。在這里設(shè)置“記錄解析”、“標(biāo)識解析”、“日期解析”、“作者名解析”。其中“記錄解析”、“標(biāo)識解析”是最關(guān)鍵的設(shè)置。在“記錄解析”中必需對每條記錄的分隔方式進(jìn)行選擇,一般常用的分隔方式是“起始標(biāo)識”,通??梢愿鶕?jù)數(shù)據(jù)庫下載的每條記錄的格式,來設(shè)置相對應(yīng)的過濾器的記錄起始標(biāo)識。接下來的“標(biāo)識解析”是用來匹配各個字段的,NE采用了一種類正則表達(dá)式的表示方法,系統(tǒng)提供了關(guān)鍵詞匹配語法幫助。但類正則表達(dá)式不太好掌握,需要花時間摸索和學(xué)習(xí)。第三步需要進(jìn)行“過濾器編輯器——字段”設(shè)置。不同數(shù)據(jù)庫下載的題錄字段格式是不同的,所以對應(yīng)
圖4 過濾器編輯器
圖5 過濾器編輯器——字段規(guī)則
的過濾器的字段匹配設(shè)置必需與數(shù)據(jù)庫中的格式一致,否則NE就無法解析數(shù)據(jù)庫的題錄信息。在“常規(guī)——字段”中雙擊某個具體的字段,就可以進(jìn)入字段規(guī)則設(shè)置的明細(xì)界面。每個字段的設(shè)置包括了樣式、模式、類型等,其中樣式部分可以根據(jù)需要選擇“正則表達(dá)式”或“單一字段”。如果獲取的字段是比較簡潔的結(jié)構(gòu),如作者單位、期刊名稱、題名等,可以直接選擇“單一字段”。
筆者建議制作過濾器最好在已有的類似的模版上進(jìn)行,會減少許多工作量。在制作過程中可以對比參照不同數(shù)據(jù)庫過濾器的記錄解析和標(biāo)識解析規(guī)則,摸索出與數(shù)據(jù)庫題錄格式匹配的NE的類正則表達(dá)式規(guī)則,提高過濾器制作的效率。
值得一提的是新建的樣式和過濾器制作完成后都可以從NE中導(dǎo)出保存在電腦硬盤或移動存儲設(shè)備中,這樣就可以在其它電腦上隨時安裝這些新的樣式和過濾器,為查新人員共享和交換數(shù)據(jù)帶來了便利。
2 結(jié) 語
對于查新員來說摸索NE的使用方法需要花幾小時的寶貴時間可能會覺得麻煩,但是一旦用好了這個管理工具,就能為日后節(jié)省下大量的整理文獻(xiàn)的時間,提高查新報告完成的速度。而且查新員可以將部分時間和精力從文獻(xiàn)處理轉(zhuǎn)移到對文獻(xiàn)內(nèi)容的分析對比,也有助于提高查新報告的完成質(zhì)量。此外,查新工作站在開展定題檢索、為學(xué)校決策者進(jìn)行專題情報分析等其它類型的文獻(xiàn)信息服務(wù)時,都需要進(jìn)行大批量的文獻(xiàn)處理。我們可以利用NE來幫助建立專題數(shù)據(jù)庫,將極大地提高對文獻(xiàn)的檢索、管理、跟蹤、定量分析的效率,并使提交給用戶的檢索結(jié)果更加整齊、規(guī)范。
參考文獻(xiàn)
[1]NoteExpress在線教程[EB/OL].http:∥www.reflib.org/indexchs.htm#Home,2010-04-15.
[2]劉瓊,田稷,繆家鼎.擬寫科技查新報告中檢索結(jié)果的精細(xì)化研究[J].現(xiàn)代情報,2007,27(6):178-180.
[3]楊菲菲,王寶杏,李朝品.NoteExpress在構(gòu)建粉螨專題數(shù)據(jù)庫中的應(yīng)用[J].江西圖書館學(xué)刊,2008,38(3):119-120.
[4]黎健杏,賴群,朱麗珍.基于NoteExpress的桉樹人工林專題數(shù)據(jù)庫管理[J].農(nóng)業(yè)圖書情報學(xué)刊,2009,21(5):62-65.
[5]劉愛原.建立個人的參考文獻(xiàn)數(shù)據(jù)庫[J].現(xiàn)代情報,2007,27(3):134-136.
[6]羅紅燕.利用NoteExpress建立專題文獻(xiàn)數(shù)據(jù)庫的方法與技巧[J].西南師范大學(xué)學(xué)報:自然科學(xué)版,2009,34(6):81-84.
[7]陳定權(quán),劉頏頡.參考文獻(xiàn)管理軟件評析與展望——以EndNote、NoteExpress為例[J].現(xiàn)代圖書情報技術(shù),2009,(7):80-84.