王丹丹
科技論文關(guān)鍵詞使用中存在的問題及解決方法
王丹丹
科研工作者在做項目研究或撰寫科技論文時,都會遇到如何確定關(guān)鍵詞的問題。例如,若想在檢索系統(tǒng)中搜索相關(guān)課題材料時,首先需要解決的就是分析課題的主題內(nèi)容,確定規(guī)范、通用、能表達核心概念的關(guān)鍵詞,關(guān)鍵詞確定得當與否關(guān)系到檢索結(jié)果的全面性和準確性。撰寫科技論文時,能夠準確地確定關(guān)鍵詞可以提高論文的被檢率。然而,筆者通過調(diào)查水利、農(nóng)業(yè)、醫(yī)學(xué)、化學(xué)、電子工程、生命科學(xué)和機械制造7個專業(yè)的84位科研人員,發(fā)現(xiàn)占被調(diào)查者67%的高級職稱的科研人員都比較了解本專業(yè)的敘詞表或?qū)I(yè)名詞表,知道如何去使用這些主題標引工具;但其中只有32.1%的高職稱人員表示在確定關(guān)鍵詞時會查閱敘詞表或?qū)I(yè)名詞表。而占被調(diào)查者33%的中級職稱人員之中只有14.3%的科研工作者了解主題標引工具,并使用這些工具確定關(guān)鍵詞。所以,總體計算之后,只有26.2%的被調(diào)查者會使用受控標引方式來處理關(guān)鍵詞確定問題,那么余下的73.8%的科研人員在確定關(guān)鍵詞時都會遇到困難或出現(xiàn)各種問題以及錯誤。
筆者通過調(diào)查中國期刊網(wǎng)(CNKI)上的7個專業(yè)的210篇文章,發(fā)現(xiàn)了以下三個普遍存在的問題。[1]
(一)主題標引不夠深入,關(guān)鍵詞外延過于寬泛
對于科技論文的檢索者而言,首先,他們希望有效地提高查全率,因為深入研究某一課題時,積累大量的相關(guān)主題文獻是必要的。然而,由于一部分科技論文的撰寫者在確定關(guān)鍵詞時,僅對表達論文基本主題內(nèi)容的檢索點進行了揭示,而忽略了論文中某些組成部分里具有重要檢索價值的細小主題概念,所以檢索者如果使用關(guān)鍵詞為限定檢索字段,以細化專深的主題概念進行檢索,則會漏檢。
因此,為了能夠提高論文的被利用率,科技論文的撰寫者在確定關(guān)鍵詞時,應(yīng)認真分析論文構(gòu)成單元中所包含的各種主題概念,將那些能夠揭示論文主題又具有重要檢索價值的詞條逐一加以標引和揭示。但是在標引過程中也要注意不能過度標引,因為如果將一些文章中論述的回溯性內(nèi)容的主題概念提煉為關(guān)鍵詞,將造成檢準率的降低,此外,在分析主題概念時應(yīng)注意將表述的字面意思轉(zhuǎn)換為專業(yè)化的隱性概念,以使檢索系統(tǒng)能夠在統(tǒng)一的專業(yè)概念之下有序地集合與組織各種從不同角度論述同一主題的論文資源。如在《奶制品中三聚氰胺含量檢測的方法》與《辣椒制品中蘇丹紅含量檢測的方法》兩篇文章中,都隱含著一個共同的主題,即食品安全。因此,準確地提煉出字面含義之外的隱含概念,并將其確定為關(guān)鍵詞,對于檢索者把握某一領(lǐng)域的整體情況是具有重要意義的,而且還可以大大縮短檢索時間和檢索成本。
(二)關(guān)鍵詞之間的關(guān)系以及內(nèi)涵表述不清
以“病毒對體弱兒童的侵襲原理分析”為例,若擬定“病毒”作關(guān)鍵詞,則計算機領(lǐng)域里的科研人員也有可能誤檢到這篇文章。所以針對這種情況,不同學(xué)科專業(yè)的科技論文撰寫者應(yīng)在關(guān)鍵詞項,將一些容易誤解的詞匯或詞組用“限定詞”的方式,加以明確的說明,如上述的例子就可以將其轉(zhuǎn)換為“病毒(醫(yī)學(xué))”的方式,這樣就可以避免內(nèi)涵表述不清的現(xiàn)象,提高論文檢索的查準率。
現(xiàn)在,學(xué)科之間的交叉融合現(xiàn)象較多,而交叉領(lǐng)域里的科技論文數(shù)量也與日俱增,由于其科技含量高,所以對這類論文的需求利用率也在逐漸攀升,然而對有關(guān)學(xué)科的關(guān)鍵詞確定時,卻經(jīng)常出現(xiàn)字面分拆的現(xiàn)象,如在《生物制藥學(xué)里的不明成分檢測》一文中,如果作者將學(xué)科關(guān)鍵詞確定為“生物”和“制藥學(xué)”,那么當檢索者使用這兩個詞查檢時就有可能誤檢到有關(guān)“制藥學(xué)中藥物成品的生物活體實驗”的論文。從上述檢索案例中可以看到關(guān)鍵詞之間的關(guān)系需要用概念分解的方法加以表述,才能避免誤檢現(xiàn)象,因此,通過概念分析可知上例中的學(xué)科關(guān)鍵詞應(yīng)確定為“生物學(xué)”和“制藥學(xué)”。
(三)關(guān)鍵詞的組配結(jié)果具有二義性,易造成誤檢
以“工業(yè)酒精制造工藝的發(fā)展研究”為例,如果作者將關(guān)鍵詞定為“工業(yè)”“酒精”和“制造工藝”,那么當查檢者使用“工業(yè)”和“酒精”在關(guān)鍵詞限定字段內(nèi)進行檢索時就會同時將有關(guān)“酒精工業(yè)發(fā)展”方面的論文檢出,但是顯而易見,酒精工業(yè)里的酒精是乙醇的成分,而工業(yè)用酒精的成分則是甲醇,二者有明顯區(qū)別,所以為了避免這種誤檢現(xiàn)象的發(fā)生,應(yīng)該使用不容易誤解的完整概念直接作關(guān)鍵詞,或是使用說明語的方式,將其表述清楚,例如:上例中就可以直接使用“工業(yè)酒精”或“酒精,工業(yè)用”或“甲醇”作為關(guān)鍵詞。
(一)對于科研人員、編輯人員要加強主題標引教育
教育活動可以從不同角度分別展開。首先,為了全面提高科技論文寫作質(zhì)量以及科研論文的利用率,各高校從學(xué)生本科階段就應(yīng)當開設(shè)信息組織以及信息檢索課程,使他們在從事科研事業(yè)或開展科研活動之前,就能夠詳細地了解各種分類體系以及主題標引工具;通過大量實踐使他們具備扎實的分類基礎(chǔ)和較強的主題標引能力,并掌握利用多種綜合性或?qū)I(yè)性數(shù)據(jù)庫的方法,從根本上解決科研論文寫作不規(guī)范的問題,當然,關(guān)鍵詞的確定問題也就迎刃而解了。
其次,對于那些已經(jīng)開展科研工作的學(xué)者而言,應(yīng)該尋求一定的途徑使之了解使用規(guī)范敘詞的重要性,盡量避免使用自由標引的方式。然而,如何指導(dǎo)這類人群學(xué)會使用詞表或相關(guān)工具為文章確定檢索標志?筆者認為最有效的教育應(yīng)該由各專業(yè)領(lǐng)域里的核心期刊編輯部共同完成。目前,各高校以及科研院所在評定科研人員等級或發(fā)放科研獎勵時,都普遍重視SCI來源期刊、EI來源期刊、中文核心期刊、CSCD來源期刊、CSSCI來源期刊發(fā)文,所以科研人員都在積極地按照各來源期刊的《征稿簡則》,撰寫符合期刊格式要求和內(nèi)容要求的文章并投稿,所以如果各刊都能在《征稿簡則》里規(guī)定“作者需按照某專業(yè)敘詞表或使用某工具轉(zhuǎn)換自然語詞為規(guī)范敘詞,如不轉(zhuǎn)換,稿件不予錄用”,那么這些科研人員必定會嚴格按照要求自學(xué)敘詞表等工具的使用方法。此外,各專業(yè)的核心期刊也可以共同推舉一位資深編輯,詳細地講解關(guān)鍵詞的確定方法和注意事項,并將此類講解刊登在學(xué)術(shù)期刊上,或形成教學(xué)錄像,放置于各專業(yè)領(lǐng)域里的知名網(wǎng)站上,或整合各專業(yè)的講解內(nèi)容集中放置于CNKI、萬方、維普、龍源或CALIS等綜合性文獻數(shù)據(jù)庫中,以供科研人員根據(jù)自己專業(yè)領(lǐng)域的特點進行選擇性學(xué)習。這種強制性的方式可以迅速地指引科研人員通過恰當?shù)耐緩綄W(xué)會如何做好主題標引。
最后,對專業(yè)期刊的編輯也要進行必要的崗前培訓(xùn)。目前的各個學(xué)刊在招聘編輯時,大多只考慮專業(yè)背景和學(xué)歷要求、是否有能力編校加工專業(yè)稿件,而較少考慮應(yīng)聘人員的分類、主題標引能力。例如一些科技期刊的編輯人員就分別來自于物理、數(shù)學(xué)、化學(xué)等專業(yè),而沒有一個是來自于圖書、情報、檔案專業(yè)或編輯出版學(xué)專業(yè)的。從專業(yè)素養(yǎng)的角度而言,后者的審稿能力較強,然而就標引能力而言,則大多不了解分類以及主題標引的相關(guān)規(guī)則以及工具。所以,為了提高各刊稿件的標引質(zhì)量,編輯人員進入崗位之前,應(yīng)該到圖書館的編目部門參加一段時間的編目工作實際訓(xùn)練,以便掌握各種標引工具的使用方法。如果沒有條件進行此類實訓(xùn),也要通過社內(nèi)“一帶一”的方式,使這些新進編輯在老編輯的教導(dǎo)下,迅速了解本刊的主題標引規(guī)則或方法。
(二)編輯以及檢索系統(tǒng)應(yīng)逐層、深入地加工關(guān)鍵詞項
以上的分類、主題、檢索的普及性教育以及強制性的征稿規(guī)范,可以在很大程度上幫助潛在或顯在的科研人員學(xué)會正確的主題標引規(guī)則,然而,畢竟在確定敘詞時可能會出現(xiàn)選詞錯誤、詞間關(guān)系處理不恰當、某些基本主題因素缺失等現(xiàn)象。所以,編輯首先應(yīng)嚴格依照綜合性敘詞表或?qū)I(yè)性敘詞表以及相關(guān)的科技名詞規(guī)范,對作者所提供的中英文關(guān)鍵詞項進行核對,并給出修改意見。
其次,檢索系統(tǒng)應(yīng)在錄入科技論文時,對期刊社編輯加工過的關(guān)鍵詞進行更深入的加工。因為大多機檢系統(tǒng)是按照后組式方式進行主題標引的,所以組配時可能會出現(xiàn)并列主題因素的錯誤組合,如在《中國鍛鋼制動盤和美國粉末冶金閘片的研制工作綜述》一文中,如果簡單地將“鍛鋼制動盤”“中國”“粉末冶金閘片”“美國”直接作為關(guān)鍵詞輸入機檢文檔,那么該文獻除了可以以“鍛鋼制動盤—中國”“粉末冶金閘片—美國”檢出外,還可以以“鍛鋼制動盤—美國”“粉末冶金閘片—中國”檢出。后者是該文獻內(nèi)容里所沒有的虛假信息。因此,在輸入多主題文獻里表示不同成分的關(guān)鍵詞時,可以在相應(yīng)的檢索標志之后加聯(lián)號,[2]以表示不同成分之間的關(guān)系,如果以數(shù)字1、2為聯(lián)符,則該文獻可以標引為“鍛鋼制動盤1”“中國1”“粉末冶金閘片2”“美國2”。這樣就可以根據(jù)聯(lián)號,將有關(guān)文獻檢出,排除多主題因素的虛假組配可能。
此外,檢索系統(tǒng)還可以通過加職號的方式對關(guān)鍵詞進行深入加工。職號可以使主題標志的關(guān)系更清晰,因為加入職能符號之后,文獻主題標志中的施動者、動作對象、部分、性質(zhì)以及操作因素就可以用“E、A、B、C、D”5個字母確定下來,避免誤檢現(xiàn)象發(fā)生。[3]例如,在《成纖維細胞激活蛋白對卵巢癌細胞增殖、遷徙和侵襲的影響》一文中,主題標志里的“成纖維細胞激活蛋白”是施動者,“卵巢癌細胞”是動作對象,“影響”是與主體因素密切聯(lián)系但沒有獨立檢索意義的通用因素,即操作因素。如果在后組式檢索系統(tǒng)中簡單地使用“成纖維細胞激活蛋白”“卵巢癌細胞”“影響”三個主題詞進行標引,檢索時,就有可能檢出“成纖維細胞激活蛋白對卵巢癌細胞的影響”和“卵巢癌細胞對成纖維細胞激活蛋白的影響”兩種文獻。所以在將論文輸入檢索系統(tǒng)時,最好可以對上述三個主題詞進行深入加工,即將其標引為:成纖維細胞激活蛋白E、卵巢癌細胞A、影響D。這樣在檢索時就可以避免因為邏輯關(guān)系錯誤而造成的誤檢。雖然這種方法會增加檢索系統(tǒng)工作人員的標引難度,但是如果能有效地使用,將會提高系統(tǒng)的檢準率,幫助檢索用戶節(jié)省排除非相關(guān)結(jié)果的時間。
通過各種方式、方法提高科研工作人員受控主題標引的能力,培養(yǎng)他們規(guī)范主題標引活動的意識,對于信息檢索系統(tǒng)按照關(guān)鍵詞項有效組織與聚類相似主題文獻具有重要意義,同時,規(guī)范的主題標引也有利于提高論文的檢全率或檢準率。一些科研工作者知道使用綜合性、專業(yè)性敘詞表的益處,但有時也是迫于沒有途徑獲取這些主題詞表,而無法使用做主題標引。畢竟高校圖書館對于《漢語主題詞表》《中國分類主題詞表》《社會科學(xué)檢索詞表》以及一些專業(yè)敘詞表的藏書復(fù)本量較少,所以相對于數(shù)量頗多的科研工作者而言,它們的作用顯得很小;而且印刷版體積大,也不方便使用,相應(yīng)的電子版則收費較多,不利于這些工具的廣泛普及,所以建議國內(nèi)的這些主題詞表能夠像美國的《醫(yī)學(xué)標題表》(MeSH)一樣進入公共領(lǐng)域,免費提供下載,以鼓勵廣大科研人員積極地使用。
[2][3]馬張華.信息組織[M].北京:清華大學(xué)出版社,2008:263-264.
(作者單位:黑龍江大學(xué)信息管理學(xué)院)
方.中國學(xué)術(shù)期刊
總庫[DB/OL].(2011-09-01) http://www.cnki.net,2011-09-01.