朱秋霞
受控詞表索引的一致性概述
朱秋霞
通過對(duì)期刊論文使用受控詞表研究,用于檢查取得敘詞列表的穩(wěn)定性是否高于或等于標(biāo)準(zhǔn)主題分類詞匯表和擴(kuò)充主題分類詞匯表的一致性。用圖書情報(bào)學(xué)的專業(yè)方法,建立敘詞列表和標(biāo)準(zhǔn)主題分類詞匯表和擴(kuò)充主題分類詞匯表(所有的敘詞都做了范圍注釋)的等價(jià)關(guān)系。Hooper的研究會(huì)發(fā)現(xiàn)索引新手和引用專家之間的一致性。在這兩個(gè)群體中的敘詞列表更好反映了的索引的一致性,但需要更多的研究。
受控詞表 主題詞表
在組織和檢索信息的過程,受控詞越來越重要。在這一領(lǐng)域中做出最重要貢獻(xiàn)的是吉爾?萊瓦,此領(lǐng)域內(nèi)很多貢獻(xiàn)都是來自他。第一次貢獻(xiàn)的是Charles Ammi Cutter 1876年出版了著名的《Rules for a printed dictionary catalog》[1]。這一本關(guān)于規(guī)則的書對(duì)現(xiàn)在仍有影響,例如經(jīng)濟(jì)原理,對(duì)主題詞的使用都有定義,使用的地點(diǎn),方式,主題詞的同義詞和反義詞重現(xiàn),同音異義的問題,主題詞的結(jié)構(gòu)(簡(jiǎn)單和復(fù)雜),詞語倒置,語法(See, See also, etc.),標(biāo)點(diǎn)符號(hào)(逗號(hào),括號(hào)等)。
第二個(gè)貢獻(xiàn)是構(gòu)建主題詞列表。Cutter發(fā)表了他的作品后不久,美國(guó)圖書館協(xié)會(huì)(ALA)在1895年出版了《List of Subject Headings for Use in Dictionary Catalogs》,為沒有專業(yè)館藏的中小型圖書館提供了標(biāo)引工具。1909年,首次出版的《Subject Headings Used in the Dictionary Catalogs of the Library of Congress》主要參考了上述文獻(xiàn)[2]。雖然曾為美國(guó)國(guó)會(huì)圖書館的編目員內(nèi)部使用,但它很快成為用于大型公共圖書館和大學(xué)圖書館的索引參考工具,它被翻譯成其他語言,完全或部分應(yīng)用于其他的國(guó)家,例如,巴西(1948年),加拿大(1967年),希臘(1978年),南非(1992年)和埃及(1995年)等等。
第三個(gè)貢獻(xiàn)是來自Mooers,在20世紀(jì)50年代開始引進(jìn)“主題詞”的想法,所以長(zhǎng)時(shí)間在文檔中做特定術(shù)語的使用,在信息檢索方面作特定主題信息。隨后是構(gòu)建了第一個(gè)敘詞表和第一個(gè)主題詞表,如杜邦主題詞表(工程信息中心Du Dupont 1959),ASTIA主題分類詞表(美國(guó)國(guó)防部,1960),化學(xué)工程主題分類詞表(美國(guó)化學(xué)協(xié)會(huì),1961年)等等。
第四個(gè)貢獻(xiàn)是國(guó)家和國(guó)際準(zhǔn)則條例。此領(lǐng)域起源于法國(guó),1957年法國(guó)AFNOR?44-070提出了Catalogue alphabétique de matières,為建立和提供的主題詞的選擇和編排規(guī)則做出貢獻(xiàn)。規(guī)范敘詞表是法國(guó)的AFNOR Z 47-100-1973(標(biāo)準(zhǔn)檢驗(yàn)。Regles的ETABLISSEMENT敘詞表monolingues),ISO 2788-1974(文檔編目,單語敘詞表的建立和發(fā)展指南)和ANSI Z39.19-1974(美國(guó)國(guó)家主題詞結(jié)構(gòu),構(gòu)造和使用標(biāo)準(zhǔn)指南)。此后,其他國(guó)家和ISO本身都在致力于擴(kuò)展此項(xiàng)標(biāo)準(zhǔn),直到ISO 2788-1986 和 ISO 5964-1985統(tǒng)一成新的ISO/DIS 25964-1:2010(信息和文獻(xiàn)--敘詞表和其他詞匯互操作性的統(tǒng)一(第1部分:用于信息檢索的敘詞表,第2部分:與其他詞匯的互操作性)。
在此領(lǐng)域內(nèi),專業(yè)人員和研究人員非常重視受控詞的評(píng)定問題??梢愿鶕?jù)分析的目的和受控詞表本身進(jìn)行評(píng)定,從而研究它們的結(jié)構(gòu),專題領(lǐng)域或方面,范圍注釋,語義關(guān)系,特異性程度等(內(nèi)部評(píng)估),或研究索引和檢索的使用對(duì)信息系統(tǒng)的影響(外部評(píng)價(jià))。
在Cranfield項(xiàng)目中Cleverdon第一次引入評(píng)估(1956年,1960年等)。Cleverdon比較了一般的十進(jìn)制分類法,按字母順序排列的主題索引,刻面分類法體制, 和由三個(gè)索引器分析18000文檔的單元詞索引之間的效率。對(duì)評(píng)定限定詞匯,標(biāo)題和主題詞表有許多不同的后續(xù)研究。例如,菲德爾? 亨茨勒(1978年)(1991年和1992年),Betts和Marrable(1991),里貝羅(1996年),吉爾Urdiciaín(1998年)和格羅斯和泰勒(2005年),他們對(duì)自然語言和限定語言在索引和檢索文件的優(yōu)點(diǎn)和缺點(diǎn)做出研究。
評(píng)定受控詞的另一種方法是與主題詞相互比較。Kishida等研究者在1988年比較了MeSH(醫(yī)學(xué)主題詞表),的ERIC主題詞表,INSPEC和主題詞根表等等,并作為他們引用,構(gòu)建信息的準(zhǔn)則。與此相反,溫伯格和Cunningham(1985)研究的語義接近MeSH 和 Medline所研究的范疇,而Pozhariskii(1982)提出了量化的能力或語義強(qiáng)度在主題詞表方面的靈活性,經(jīng)濟(jì)性和普遍性。此外,拉爾森(1988年)分析了主題詞表在索引某一館藏文獻(xiàn)是發(fā)揮的力量。Soler Monreal(2009)評(píng)三大受控詞表(敘詞列表,標(biāo)準(zhǔn)的主題詞表和擴(kuò)充主題詞表,所有的敘詞進(jìn)行范圍注釋),如果敘詞列表獲得一致性的分?jǐn)?shù)高于標(biāo)準(zhǔn)主題詞表和擴(kuò)充主題詞表,則敘詞列表勝出。
索引的一致性,可以為研究一個(gè)或幾個(gè)索引作為參考。當(dāng)一個(gè)專業(yè)的指標(biāo)相同的文件在不同的時(shí)刻,我們講的是內(nèi)部一致性或索引器內(nèi)部的一致性。當(dāng)比較幾個(gè)人索引一個(gè)文件的結(jié)果或者比較兩個(gè)索引器索引一個(gè)文件的結(jié)果是時(shí),我們講的是索引間的一致性或索引器間的一致性。
自20世紀(jì)60年代以來,對(duì)索引的一致性已開展了多種多樣的調(diào)查。從這些測(cè)試中可以得出的主要結(jié)論是不一致性是是索引的固有特征,而不是偶然的異常。雖然他們進(jìn)行的測(cè)試的方法有很大不同,但是我們可以說,實(shí)現(xiàn)索引的一致性范圍大約是10%至60%。從1960年到現(xiàn)在為止,因?yàn)槭褂玫臏y(cè)試方法的多樣性,所以大量進(jìn)行實(shí)驗(yàn)不能同質(zhì)化。在以后的研究發(fā)現(xiàn)中,我們會(huì)找出更多阻礙他們的同質(zhì)化的變量和測(cè)試能夠進(jìn)行的樣品。
[1]Bertrand,A. & Cellier, J.M.Psychological approach to indexing: effects of the operartor’s expertise upon indexing behaviour[J]. Journal of Information Science, 1995,21(6):459~472.
[2]Fidel, R.Who needs controlled vocabulary?[J].Special Libraries,1992:83(1):1~9.
(作者單位:武警警種學(xué)院)
朱秋霞(1988-),女,河南周口人,碩士,助理館員,研究方向:圖書館信息化建設(shè)。