郝曉春,李躍青,付改俠,劉素梅,張創(chuàng)軍,楊曉哲
(西安近代化學(xué)研究所,陜西西安 710065)
科技查新咨詢是一項(xiàng)以文獻(xiàn)檢索為基礎(chǔ),以文獻(xiàn)分析為手段,從科學(xué)技術(shù)發(fā)展的宏觀角度對所檢索文獻(xiàn)運(yùn)用綜合分析和對比方法,為評價(jià)科研立項(xiàng)、成果鑒定、專利和基金申請等的新穎性和先進(jìn)性提供文獻(xiàn)依據(jù)的一種公眾性信息咨詢服務(wù)工作[1-2]。同時(shí),科技查新也是一項(xiàng)比較復(fù)雜的信息服務(wù)工作,在進(jìn)行查新的過程中,需要查新人員、查新審核人員、相關(guān)專家具備較高的專業(yè)化的文獻(xiàn)檢索能力、高度的工作責(zé)任感和多學(xué)科的專業(yè)知識素養(yǎng),綜合運(yùn)用文獻(xiàn)分析、對比、歸納等查新手段,為查新委托人提供一個(gè)明確并且客觀的文獻(xiàn)事實(shí)綜述。其目的是為科技管理部門和評審專家提供立項(xiàng)選擇、鑒定成果的客觀文獻(xiàn)依據(jù),從而提高科研項(xiàng)目立項(xiàng)、科研成果鑒定的準(zhǔn)確性和評價(jià)結(jié)論的可信度。
火炸藥科技查新是伴隨著中國科技查新特別是國防科技查新的產(chǎn)生、發(fā)展而發(fā)展的。由于歷史的原因,中國的國內(nèi)外火炸藥技術(shù)資料分散地保存在國防各大部委的情報(bào)所如兵器、航天、航空、船舶、電子、核能、國防科技情報(bào)所等相關(guān)情報(bào)機(jī)構(gòu),以及相關(guān)部委主管的大學(xué)、研究所、重點(diǎn)大企業(yè)中[3-4]。
火炸藥科技查新檢索經(jīng)歷了從手工檢索,翻找紙質(zhì)資料,到計(jì)算機(jī)通過專線遠(yuǎn)程檢索固定的數(shù)字化的文獻(xiàn)數(shù)據(jù)庫查尋信息,再到計(jì)算機(jī)通過光盤、光盤塔檢索,直到現(xiàn)在的多種手段檢索過程。國外數(shù)字化的文獻(xiàn)數(shù)據(jù)庫起步較早,從20 世紀(jì)六十年代就開始了。其代表就是始建于1963 年的美國的DIALOG 數(shù)據(jù)庫系統(tǒng)。國內(nèi)的聯(lián)機(jī)檢索系統(tǒng)開始于20世紀(jì)80 年代末,90 年代初開始提供文獻(xiàn)信息檢索服務(wù)。其代表如:由中國科技情報(bào)研究所研發(fā)的萬方數(shù)據(jù),由國防科技情報(bào)所研發(fā)的國防科技情報(bào)檢索系統(tǒng)。目前通過國防科技情報(bào)檢索系統(tǒng)就可以檢索兵器、航天、航空、船舶、電子、核能、國防科技情報(bào)所等單位收藏的國防科技信息。
火炸藥技術(shù)是國防關(guān)鍵的技術(shù)之一,是先進(jìn)的高技術(shù)武器的核心技術(shù),其發(fā)展水平直接制約著高技術(shù)武器的發(fā)展。因此世界各國特別是發(fā)達(dá)國家均對火炸藥技術(shù)的發(fā)展給予高度重視,投入了巨大的人力、物力。
目前網(wǎng)絡(luò)上以及在大型的綜合數(shù)據(jù)庫中查找信息主要還是使用主題詞/關(guān)鍵詞進(jìn)行查找。另外,火炸藥技術(shù)的應(yīng)用專業(yè)性很強(qiáng),但火炸藥技術(shù)涉及面又很廣,這個(gè)特殊性決定了火炸藥技術(shù)的最新信息資料的來源分散,分布很廣。網(wǎng)絡(luò)檢索往往得到的信息量非常大,在海量的信息中如何快速找到所需的內(nèi)容,目前仍然需要一定的經(jīng)驗(yàn)和技術(shù)。即在目前的技術(shù)條件下,火炸藥技術(shù)查新仍然面臨著查找技術(shù)信息不準(zhǔn)、不易分辨的問題。
在科技查新的實(shí)踐中,出現(xiàn)過個(gè)別的查新委托人員為了某種目的,在與查新人員共同分析相關(guān)文獻(xiàn)與查新課題的異同點(diǎn)時(shí),利用查新人員專業(yè)知識、專業(yè)外語不強(qiáng)的弱點(diǎn)刻意回避一些文獻(xiàn),誘導(dǎo)查新人員做出對其有利的查新結(jié)論[5]。
為了有針對性的解決上述問題,筆者們借助先進(jìn)的計(jì)算機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)、數(shù)據(jù)庫技術(shù),結(jié)合對規(guī)范的科技查新流程數(shù)字化的研究,特別是結(jié)合火炸藥科技查新的專業(yè)特點(diǎn),構(gòu)建了火炸藥科技查新系統(tǒng),將現(xiàn)有規(guī)范的查新工作集成在計(jì)算機(jī)平臺系統(tǒng)中[6-7],將火炸藥科技查新過程以工作流的形式呈現(xiàn)、操作和管理。結(jié)合先進(jìn)的數(shù)據(jù)庫技術(shù),利用權(quán)威的《兵器科學(xué)技術(shù)敘詞表》(兵器工業(yè)出版社1995 年版)構(gòu)建了火炸藥主題詞數(shù)據(jù)庫,以幫助查新人員在檢索資料時(shí)選取權(quán)威、準(zhǔn)確、專業(yè)的關(guān)鍵詞,提高檢索文獻(xiàn)的正確性。
同時(shí),筆者們將相似度算法引入查新流程中,利用計(jì)算機(jī)強(qiáng)大的運(yùn)算能力,對檢出的文獻(xiàn)進(jìn)行相似度排序,提高查新人員、查新委托人員對相關(guān)文獻(xiàn)的分辨、鑒別能力,提高查新的正確性和準(zhǔn)確性。
目前的科技查新工作已經(jīng)形成了規(guī)范的流程,如圖1 所示。
圖1 現(xiàn)有科學(xué)查新流程
筆者們在現(xiàn)有的查新流程中集成和應(yīng)用智能處理技術(shù),將火炸藥技術(shù)主題詞數(shù)據(jù)庫和文獻(xiàn)相似度排序算法集成到查新系統(tǒng)中。從技術(shù)手段入手,提高查新中文獻(xiàn)檢索的準(zhǔn)確性,同時(shí)提高查新人員對相關(guān)文獻(xiàn)相似度的判斷能力,確??萍疾樾碌臏?zhǔn)確性和客觀性。提出的新查新流程如圖2 所示。
圖2 火炸藥科技查新流程
對比新舊查新流程,可以看出新流程增加了智能處理環(huán)節(jié),依托新增的火炸藥主題詞庫和集成現(xiàn)有的相似度排序算法,對查新主題詞的選擇、相關(guān)文獻(xiàn)的判斷,提供技術(shù)手段的智能化支撐,從技術(shù)上對查新檢索的準(zhǔn)確性、相關(guān)文獻(xiàn)選擇的準(zhǔn)確性提供保障。
主題詞分類數(shù)據(jù)庫是為解決檢索的準(zhǔn)確和全面而設(shè),所以其詞源的選擇就必須以檢索文獻(xiàn)的準(zhǔn)確和全面來考慮。為選擇合適的主題詞源,筆者們考察了《現(xiàn)代科學(xué)技術(shù)詞典》(上??茖W(xué)技術(shù)出版社1980 版)、《科學(xué)技術(shù)主題詞典》(北京文獻(xiàn)服務(wù)處1980 版)、《國防科學(xué)技術(shù)敘詞表》(軍事科學(xué)出版社1992 版)和《兵器科學(xué)技術(shù)敘詞表》(兵器工業(yè)出版社1995 年版)。就其權(quán)威性和準(zhǔn)確性來講,前三個(gè)各有所長,它們都是老一輩情報(bào)人多年研究、編輯的成果,其權(quán)威性和準(zhǔn)確性不容置疑。但由于其編輯時(shí)間較早,涵蓋的學(xué)科較多,所以其火炸藥詞匯的同義詞近義詞等明顯比《兵器科學(xué)技術(shù)敘詞表》的少,這不利于查全。另外《兵器科學(xué)技術(shù)敘詞表》在編輯時(shí)參考了上述三個(gè)詞典,吸收了它們的長處。在考慮了查準(zhǔn)和查全兩方面的因素后,確定采用權(quán)威的《兵器科學(xué)技術(shù)敘詞表》(兵器工業(yè)出版社1995 年版)中的火炸藥技術(shù)相關(guān)的詞構(gòu)建了火炸藥主題詞數(shù)據(jù)庫,以幫助查新人員在檢索資料時(shí)選取權(quán)威、準(zhǔn)確、專業(yè)的關(guān)鍵詞,提高檢索文獻(xiàn)的正確性和全面性。在設(shè)計(jì)主題詞表時(shí),不僅考慮到主題詞的中英文表達(dá)及其同義詞的中英文表達(dá),還根據(jù)火炸藥中化學(xué)材料名稱,將美國化學(xué)文摘社給每個(gè)成分確定的化合物編的化學(xué)物質(zhì)登記號引入主題詞表中??紤]到在查新檢索時(shí),經(jīng)常會檢索專利信息,所以在主題詞表中,還引入了國際專利分類號。
將相似度排序算法引入查新文獻(xiàn)分析環(huán)節(jié),對題目、關(guān)鍵詞、文摘等字段設(shè)置了各字段的權(quán)重。題目字段的權(quán)重值最大,文摘字段次之。按照檢索詞在各個(gè)字段出現(xiàn)的頻率,乘以各字段的權(quán)重值,再將相應(yīng)的計(jì)算分值相加,按照所得分值的大小,對檢索到的文獻(xiàn)加以排序。這里表示的相似度是在所檢索的文獻(xiàn)中,與已檢索策略表示的檢索主題的相似程度。在以后的實(shí)際運(yùn)行中還可以對權(quán)重值進(jìn)行調(diào)整,還可以根據(jù)以后技術(shù)發(fā)展的情況增加新的運(yùn)算字段,以進(jìn)一步提高系統(tǒng)的相似度排序的相關(guān)性、準(zhǔn)確性。這樣就能確保系統(tǒng)的技術(shù)與時(shí)俱進(jìn)。
該功能主要用于對檢索文獻(xiàn)的分析,幫助檢索和課題委托單位的研究人員客觀的確定相關(guān)文獻(xiàn),減少人為因素對相關(guān)文獻(xiàn)分析的影響,提高查新對比的客觀性和準(zhǔn)確性。
根據(jù)上述思路,研究提出了模塊化的火炸藥技術(shù)科技查新系統(tǒng)。從查新人員的角度出發(fā),研究設(shè)計(jì)了系統(tǒng)的各功能模塊的關(guān)系,如圖3 所示。
圖3 系統(tǒng)各功能模塊關(guān)系
火炸藥科技查新系統(tǒng)是采用瀏覽器/服務(wù)器(B/S)的形式,運(yùn)用純Java 語言編寫的,可跨系統(tǒng)運(yùn)行的平臺。它在現(xiàn)有成熟的操作系統(tǒng)環(huán)境中,采用先進(jìn)的工具軟件構(gòu)建的。
系統(tǒng)的各部分均采用模塊化設(shè)計(jì)。其主要部分“查新工作”所包含模塊及其各模塊的關(guān)系如圖4 所示。
圖4 查新系統(tǒng)構(gòu)成模塊關(guān)系示意圖
火炸藥查新系統(tǒng)規(guī)范查新管理,從根本上實(shí)現(xiàn)查新工作流程及查新管理工作的自動(dòng)化和科學(xué)化,達(dá)到了提高查新工作效率的目的。且其利用權(quán)威、規(guī)范的主題詞數(shù)據(jù)庫對檢索詞進(jìn)行補(bǔ)充和規(guī)范,利用計(jì)算機(jī)的運(yùn)算能力對檢索的相關(guān)文獻(xiàn)進(jìn)行相似度排序,提高了查新人員對相關(guān)文獻(xiàn)的判斷力。