非控主題詞,也稱自由詞,是指詞表未收、可隨需要增補、不作為正式標引檢索用詞、但可實際用于檢索,具有較大的識別功能的詞。非控主題詞屬于自然語言范疇,其專指度一般高于詞表中的正式詞。在CNMARC(中國機讀目錄格式)中,610字段反映非控主題詞。
1.受控主題詞的局限性
敘詞是經(jīng)過規(guī)范化的詞或詞組。敘詞排除了自然語言中一詞多義、多詞一義和語意含混的現(xiàn)象,通過顯示概念之間的等同、等級以及相關關系,達到概念與語詞一一對應,在文獻檢索中實現(xiàn)了較高的查準率和查全率。隨著科技發(fā)展,敘詞的不足也顯示出來,這主要表現(xiàn)在:一、敘詞詞表的相對滯后,敘詞詞表的修訂一般要經(jīng)過5~7年的時間,由于詞表更新周期偏長,故它的詞匯滯后問題比較突出,不少新、特、專名詞或術語未見表中,詞表難以滿足新學科、新技術文獻標引的需要;二、敘詞標引對標引人員要求較高且標引成本較高,由于敘詞標引需要查表和斟酌,標引速度較慢且難以保證標引的統(tǒng)一性(既不同標引者或同一標引者不同時期標引同一文獻的基本一致);三、敘詞標引查準率低。敘詞標引,查全率高,但詞匯量有限且詞表出版滯后,故查準率低;四、不符合大多數(shù)讀者的檢索習慣。普通的讀者不了解敘詞標引,一般采用自然語言做檢索入口詞,這使敘詞標引不能起到引導讀者的作用。
2.非控主題詞的優(yōu)勢
在手工檢索時代,非控主題詞由于存在同義詞、近義詞難以排檢的問題而難以使用。文獻主題分析一般都使用受控主題詞。隨著計算機技術在信息檢索領域的應用,計算機強大的信息處理能力,計算機快速的反應速度使非控主題詞的排檢難題得以解決,非控主題詞不可替代的優(yōu)勢逐步體現(xiàn)。非控主題詞標引與受控主題詞標引相比,具有以下優(yōu)勢:一、直接反映了新學科、新技術文獻,并且為主題詞表的增補、修訂提供了文獻數(shù)據(jù)保證;二、加大文獻的檢索深度和專指度;三、較好地解決了讀者界面問題,更適應讀者使用自然語言檢索,并通過自由詞入口,指引讀者使用主題詞擴大檢索范圍;四、提高信息檢索的查準率。
3.非控主題詞選詞存在的問題
非控主題詞用于主題標引、揭示文獻主題內容給文獻編目工作帶來了很大的便利。特別是對于新興學科、邊沿學科、綜合學科的主題揭示,編目人員可以選擇專指度更高的詞語、詞組揭示主題,而且這些詞語更符合讀者的檢索習慣。但是所謂不受主題詞表約束的自由取詞,并不意味著可以任意遣詞,可以按任何形式表達主題,即便是“自由”也要受制于文獻主題內容以及約定俗成的語言習慣。綜合說來,非控主題詞的使用還存在以下問題。
3.1 沒有充分反映新興學科、邊沿學科
由于主題詞表存在修訂周期過長,難以反映新興學科、邊沿學科的問題,非控主題詞應在反映最新學科動態(tài)中發(fā)揮積極作用。但是部分書目數(shù)據(jù)并未反映這些學科的最新發(fā)展。例:
例1:博客:信息革命最前沿的定位
誤:6060#$a互聯(lián)網(wǎng)絡$x傳播媒介$x研究
正:6060#$a互聯(lián)網(wǎng)絡$x傳播媒介$x研究
6100#$a博客
例2:四季花語:紙黏土花藝創(chuàng)作
誤:6060#$a雕塑$x技法(美術)
正:6060#$a雕塑$x技法(美術)
6100#$a紙黏土
3.2 選詞專指度不足
由于自由詞可選擇的范圍大、形式多樣,揭示同一主題往往有多個可以選擇自由詞。但是,列出所有自由詞來反映主題既不現(xiàn)實也是不必要。非控主題詞也應盡量選擇專指度高的詞來反映主題。但是,在一些書目數(shù)據(jù)中還存在選用專指度不高的非控主題詞的問題。
例3:張國榮畫傳
誤:6060#$a演員$x生平事跡$y中國$z現(xiàn)代
6100#$a張發(fā)宗(1956-2003)
正:6060#$a演員$x生平事跡$y中國$z現(xiàn)代
6100#$a張國榮(1956-2003)
例4:部落格就醬玩
誤:6060#$a互聯(lián)網(wǎng)絡$x傳播媒介$x研究
6100#$ablog
正:6060#$a互聯(lián)網(wǎng)絡$x傳播媒介$x研究
6100#$a博客
例5:臺灣?;鶗墓适?/p>
誤:6060#$a海峽兩岸$x臺灣問題
6100#$a臺灣?;鶗?/p>
正:6060#$a海峽兩岸$x臺灣問題
6100#$a?;鶗?/p>
3.3 非控主題詞揭示學科內涵過于狹隘
現(xiàn)在新興學科發(fā)展迅速,技術更新的速度加快,很多技術一至兩年已經(jīng)實現(xiàn)更新?lián)Q代。如果非控主題詞選取過于機械而不加提煉,就會割裂同一學科技術,不利于同類學科檢索。例如,Photoshop 6.0、Photoshop 7.0、Photoshop 8.0只是Photoshop的不同版本,在非控主題詞選取上應采用相同形式。
例7:Photoshop 8.0案例教程上機指導與練習
誤:6060#$a圖象處理$x應用軟件$x職業(yè)高中$j教學參考資料
6100#$a Photoshop 8.0
正:6060#$a圖象處理$x應用軟件$x職業(yè)高中$j教學參考資料
6100#$a Photoshop
3.4 非控主題詞揭示深度不足
在CNMARC中,610字段不像其它受控主題詞字段有多個子字段,分別可以表示主題的款目要素、名稱的其余部分、名稱附加、年代、形式復分、論題復分、地理復分、年代復分等眾多內容。610字段只有$a一個子段,這造成部分非控主題詞過于簡單,不能起到區(qū)別標識不同主題的作用。特別是人名作為非控主題詞時問題特別突出。中國人名一般是兩個字或三個字,重名情況比較多,特別是王、李、趙等大姓,重名現(xiàn)象特別突出。筆者在國家圖書館書目數(shù)據(jù)庫做了一個測試,以“王愛英”檢索書目數(shù)據(jù),共有29條數(shù)據(jù)命中。這些數(shù)據(jù)是10余名不同著者的不同作品,數(shù)據(jù)內容涉及計算機、小說、職工教育、電器維修、家庭文化、公共關系、胃腸道雙重對比造影、建筑力學、水力發(fā)電站、室外景觀等多個方面。這說明單一形式的人名不能起到區(qū)分作用。
3.5 選詞形式不規(guī)范
非控主題詞選詞不僅需要考慮文獻主題內容,而且要考慮漢語表達的形式。非控主題詞應選擇名詞,而不能選擇表示行為的動詞。至于代詞、介詞、連詞、副詞等不應做為非控主題詞的備選對象。如例8所示,創(chuàng)業(yè)是動詞,不應做為非控主題詞。
例8:自備額0元成功貸款創(chuàng)業(yè)
誤:6060#$a商業(yè)經(jīng)營$x基本知識
6100#$a創(chuàng)業(yè)
正:6060#$a 商業(yè)經(jīng)營$x基本知識
3.6 主題詞表中被替代的詞不應再作為非控主題詞使用
隨著社會、經(jīng)濟、科技與文化的發(fā)展,新的主題概念與新的詞匯大量出現(xiàn),受控主題詞每隔一段時間就會做一次修訂。在修訂過程中,大量新詞加進詞表,部分使用頻率較低的詞被替代。在選擇非控主題詞時,不應再使用被替代的主題詞作為非控主題詞。
例9:西餐烹調理論與實務
誤:6060#$a西式菜肴$x烹飪
6100#$a西餐
正:6060#$a西式菜肴$x烹飪
3.7 同一類型文獻選擇的非控主題詞形式不一致
對同一類文獻的非控主題詞形式的選擇,不同的編目人員往往會有不同的選擇側重點,即使同一編目人員不同編目時間也可能有不同的選擇。這使同一類型文獻非控主題詞形式多樣,不利于讀者對同類文獻檢索與使用。
例10:開放式WebGIS的理論與實踐
6060#$a互聯(lián)網(wǎng)絡$x應用$x地理信息系統(tǒng)$x研究
6100#$aWebGIS
Web GIS原理及其應用
6060#$a互聯(lián)網(wǎng)絡$x應用$x地理信息系統(tǒng)$x研究
6100#$aGIS
4.非控主題詞的選詞原則
雖然非控主題詞標引可以根據(jù)文獻主題,不受主題詞表約束,選擇專指度更高的詞,但并不意味著可以任意遣詞。在以主題詞標引為主要手段的前提下,非控主題詞標引必須是在詞表中主題詞對文獻的內容主題無法描述和表達,或者是描述和表達不清楚的情況下使用。非控主題詞的選取還應遵循一定的原則。
610字段就其揭示內容來看,大致可以分為兩類:一、揭示人名、地名、團體會議名稱;二、揭示文獻內容主題。這兩類非控主題詞選詞原則應各有側重。
4.1名稱非控主題詞的選詞原則
4.1.1揭示人名特征的非控主題詞,選擇最著稱的形式,并附生卒年。如果是女性、少數(shù)民族應相應標出,以示區(qū)分。外國人中譯名稱應使用最著稱、最常見或最新的中譯名形式,并盡量附國別、原名姓名全稱形式、生卒年。
例11:6100#$a張國榮(1956~2003)
例12:6100#$a杜拉斯(女,1914~1996,Duras ,Marguerite,法國)
4.1.2 揭示地名特征的非控主題詞,可根據(jù)文獻提示范圍,在610字段直接標引鄉(xiāng)、鎮(zhèn)、村,同時利用607字段進行說明與限制。
例13:厚街鎮(zhèn)志
607##$a東莞市$x鄉(xiāng)鎮(zhèn)$x地方志
6100#$a厚街鎮(zhèn)
例14:獵德村志
607##$a廣州市$x村史
6100#$a獵德村
4.1.3揭示團體會議特征的非控主題詞,選擇最著稱的形式。
例15:6100#$a海基會
4.2主題非控主題詞的選詞原則
4.2.1用詞規(guī)范。非控主題詞選擇一般不選用口語詞匯或新聞用語,而應該從文獻內容中提取對揭示文獻主題的名詞和名詞化的詞組術語。專業(yè)術語、專業(yè)詞匯不予分解。4.2.2應具有鮮明的主題性、前瞻性、簡明性和單一性。對能夠反映新學科、新理論、新技術、新材料、新工藝等概念的詞語應用非控主題詞反映。被選擇的非控主題詞應經(jīng)過推敲,應具有單一性,使概念和語詞達到一一對應,以避免產(chǎn)生歧義。
4.2.3 凡主題詞表中已收入的具有用代關系的主題詞,被代用的非正式主題詞不能作為非控制主題詞標引。
4.2.4注意選詞的專指度和適度性。選擇與文獻主題內容直接對應的、專指度高的詞,不必把文獻主題內容相關聯(lián)的主題也作為非控主題詞。
4.2.5非控主題詞一旦使用,應做好記錄。至少要保證同一編目機構文獻標引的一致性,從而提高書目數(shù)據(jù)的標引質量。如果該非控主題詞有多個同義詞,應在610字段重復$a子字段,以方便讀者從多個入口檢索數(shù)據(jù)。
例16:非典型肺炎預防與治療實用手冊
6100#$a非典型肺炎$aSARS$a非典
綜上所述,雖然610字段提供的是非控主題詞,但并非所有的自由詞都適用于該字段著錄。以上是筆者關于非控主題詞的選取原則的一點看法,歡迎廣大專家、同行批語、指正。
(作者單位:廣東省立中山圖書館)
參考文獻:
1.胡曉鷹. CNMARC中非控主題詞著錄現(xiàn)狀分析. 圖書館建設,2006(2)
2.許勇. CNMARC610字段與關鍵詞標引.上海高校圖書情報工作研究,2006(3)
3.鄧福泉.對使用CNMARC 610字段著錄自由詞的探討.國家圖書館學刊,2004(4)
4.竺曉嵐.談CNMARC非控主題詞的使用. 當代圖書館,2004(2)