亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        國外敘詞表的應(yīng)用與發(fā)展趨勢探討*

        2012-10-23 05:16:30中國科學(xué)技術(shù)信息研究所北京100080
        圖書館建設(shè) 2012年3期
        關(guān)鍵詞:詞表檢索語言

        趙 捷 (中國科學(xué)技術(shù)信息研究所 北京 100080)

        司 莉 周李梅 柴 源 鄧伊婷 (武漢大學(xué)信息管理學(xué)院 湖北 武漢 430072)

        敘詞表作為信息組織的核心工具,是一種由術(shù)語與術(shù)語之間的各種關(guān)系組成的語義詞典。敘詞表自產(chǎn)生以來,主要用于文獻(xiàn)信息的主題標(biāo)引與檢索,并提高了文獻(xiàn)檢索的查準(zhǔn)率和查全率。現(xiàn)在敘詞表已經(jīng)成為成熟的語義工具。在新的環(huán)境下,敘詞表的編制方法由手工轉(zhuǎn)為機(jī)器輔助,網(wǎng)絡(luò)敘詞表也應(yīng)運(yùn)而生;敘詞表被用于網(wǎng)絡(luò)數(shù)據(jù)庫和搜索引擎的現(xiàn)象已較為普遍。當(dāng)前,國外有關(guān)敘詞表的編制與應(yīng)用的研究成果頗豐,對(duì)我國的相關(guān)研究具有借鑒意義。

        1 國外敘詞表的調(diào)查與分析

        筆者調(diào)查了網(wǎng)上免費(fèi)信息資源網(wǎng)站Taxonomy Warehouse[1]和國外一些收錄敘詞表的網(wǎng)站[2-3],共搜集了254部以英文為主的敘詞表。筆者統(tǒng)計(jì)并分析了其語種、編制單位、詞表結(jié)構(gòu)、學(xué)科分布、載體類型等基本信息,以提供國外以英文為主的敘詞表的概況,供業(yè)界同行參考。

        1.1 敘詞表規(guī)模與學(xué)科分布

        根據(jù)包含的敘詞的總數(shù)量可將敘詞表分為3種規(guī)模[4]:大型敘詞表(敘詞總量在10 000個(gè)及以上)、中型敘詞表(敘詞總量在1 000~10 000個(gè)之間)和小型敘詞表(敘詞總量在1 000個(gè)及以下)。在所調(diào)查的敘詞表中,大型敘詞表共62部,占總量的24.4%;中型敘詞表共119部,占總量的46.9%;小型敘詞表共73部,占總量的28.7%。

        依據(jù)《中華人民共和國學(xué)科分類與代碼國家標(biāo)準(zhǔn)》(GB/T 13745-92)的相關(guān)規(guī)定,并參考侯漢清對(duì)網(wǎng)絡(luò)敘詞表的調(diào)查結(jié)果(即將被調(diào)查的敘詞表分為理工農(nóng)醫(yī)類、人文社科類[4]),統(tǒng)計(jì)得出:這254部敘詞表中,理工農(nóng)醫(yī)類敘詞表共126部,占總量的49.6%;人文社科類敘詞表共128部,占總量的50.4%。侯漢清調(diào)查了國內(nèi)130部詞表[4],發(fā)現(xiàn)社會(huì)科學(xué)類占23.85%,自然科學(xué)類占58.46%,綜合科學(xué)類占17.69%??梢钥闯?,國內(nèi)自然科學(xué)類敘詞表所占比例較大,而國外理工農(nóng)醫(yī)類敘詞表與人文社科類敘詞表比例相近。

        通過本次調(diào)查發(fā)現(xiàn):學(xué)科范圍較小的敘詞表中的敘詞量偏小,但一些復(fù)雜科學(xué)(如地球科學(xué)和生物科學(xué))除外,如《Gale地球科學(xué)敘詞表》(Gale Earth Sciences Thesaurus)、《水產(chǎn)科學(xué)與漁業(yè)敘詞表》(Aquatic Sciences and Fisheries Thesaurus)的敘詞數(shù)量達(dá)百萬之多。

        1.2 敘詞表的語種情況

        在所調(diào)查的敘詞表中,英文單一語種敘詞表共209部,德文單一語種敘詞表僅1部,即德國哥根廷州立大學(xué)圖書館編制的《哥廷根在線分類》(Goettinger Online-Klassifikation),其余44部為雙語或多語種敘詞表(其中43部有英文版本)。單一語種敘詞表占總數(shù)的82.7%,雙語或多語種敘詞表占總數(shù)的17.3%。除單一語種敘詞表外,其他敘詞表的語種從兩種到十幾種不等,其中,擁有語種較多的敘詞表有《多語言地質(zhì)敘詞表》(Multilingual Thesaurus of Geosciences)與《職業(yè)培訓(xùn)多語言敘詞表》(Multilingual Thesaurus of Vocational Training),擁有英、法、德等7種語言;《歐洲財(cái)政瀏覽器敘詞表》(European Treasury Browser Thesaurus)擁有荷蘭、英、法、意大利等13種歐洲國家語言;《亞洲蔬菜敘詞表》(Asian Vegetables Thesaurus)擁有中、英、日、泰、德等16種語言;《綜合多語言環(huán)境敘詞表》(General Multilingual Environmental Thesaurus)則擁有挪威、希臘、捷克、葡萄牙、芬蘭、法語等18種語言。

        由于英語被作為全球的通用語言,并且本次調(diào)查主要以歐美國家的敘詞表為主,因此,大多數(shù)敘詞表在擁有本國語言版本的基礎(chǔ)上同時(shí)編制了相應(yīng)的英文版,如由德國的FIZ技術(shù)公司 (Fachinformationszentrum Technik)編制的《工程管理詞庫》(Thesaurus Technik und Management),在德文版的基礎(chǔ)上編有英文版。此外,由機(jī)構(gòu)編制的敘詞表一般均以英文版為主。例如,歐美國家的Gale公司、NASA(National Aeronautics and Space Administration,美國國家航空航天局)、English Heritage、大英博物館等機(jī)構(gòu)編制的敘詞表僅有英文版本;由聯(lián)合國相關(guān)機(jī)構(gòu)編制的《水產(chǎn)科學(xué)與漁業(yè)敘詞表》、《ENVOC多語種環(huán)境術(shù)語敘詞表》(ENVOC Multilingual Thesaurus of Environmental Terms)和《國際難民術(shù)語詞庫》(International Thesaurus of Refugee Terminology)等敘詞表,在英文版的基礎(chǔ)上,根據(jù)實(shí)際需要編制了相應(yīng)語種的版本。

        表1 敘詞表載體類型調(diào)查統(tǒng)計(jì)表

        1.3 敘詞表的載體類型

        敘詞表的載體經(jīng)歷了從印刷版到電子版再到網(wǎng)絡(luò)版的過程。當(dāng)今,以網(wǎng)絡(luò)為載體的敘詞表已成為主流。一部分?jǐn)⒃~表在紙質(zhì)版的基礎(chǔ)上開發(fā)了網(wǎng)絡(luò)版,另一部分?jǐn)⒃~表直接以電子版或網(wǎng)絡(luò)版發(fā)行(具體數(shù)據(jù)見表1)。

        在所調(diào)查的254部敘詞表中,僅有印刷版的敘詞表共11部。既有印刷版、也有其他版的敘詞表有107部。例如,劍橋科學(xué)文摘(Cambridge Science Abstract, 簡稱CSA)編制的《冶金術(shù)語敘詞表》(Thesaurus of Metallurgical Terms)以印刷版為主,而《國際原子能信息系統(tǒng)敘詞表》(International Nuclear Information System Thesaurus)在印刷版的基礎(chǔ)上制作了PDF版。

        以提供查詢功能的公共網(wǎng)站為載體的敘詞表有66部,包括《人文社科類電子敘詞表》(Humanities and Social Science Electronic Thesaurus,簡稱HASSET)、英國遺產(chǎn)委員會(huì)(English Heritage Commission)編制的《NMR貨船敘詞表》(National Monuments Record Cargo Thesaurus,簡稱NMR 貨船敘詞表),等等。

        此外,WAND公司編制的3部敘詞表及《教育、技能和兒童服務(wù)敘詞表》(Education, Skills and Children's Services Thesaurus)為單一、特定的電子版。Gale公司的69部敘詞表均為CSV/TXT、HTML、XML格式。部分?jǐn)⒃~表還有RDF/SKOS(資源描述框架/簡單知識(shí)組織系統(tǒng))、RDF/OWL(資源描述框架/網(wǎng)絡(luò)本體語言)、Word和Excel格式。由此可看出,受調(diào)查敘詞表的出版方式大多為HTML、XML和CSV/TXT。這一現(xiàn)象反映了敘詞表發(fā)展的網(wǎng)絡(luò)化趨勢。大部分編制敘詞表的機(jī)構(gòu)充分利用計(jì)算機(jī)等技術(shù),構(gòu)建利于檢索的敘詞表,并對(duì)敘詞表進(jìn)行全方位的改造和升級(jí),在進(jìn)行網(wǎng)絡(luò)化轉(zhuǎn)變的同時(shí),注重?cái)⒃~表的界面設(shè)計(jì)。

        1.4 敘詞表編制機(jī)構(gòu)的類型

        對(duì)所調(diào)查敘詞表的編制機(jī)構(gòu)進(jìn)行分類統(tǒng)計(jì),可將敘詞表的編制機(jī)構(gòu)分為聯(lián)合國等國際機(jī)構(gòu)、政府機(jī)構(gòu)、公司、學(xué)術(shù)團(tuán)體、圖書館、大學(xué)、個(gè)人、其他等類型。每種機(jī)構(gòu)編制的敘詞表數(shù)量如圖1所示。

        所調(diào)查的敘詞表中,由個(gè)人編制的為5部,由大學(xué)編制的為15部,以圖書館為單位編制的有19部,由聯(lián)合國等國際機(jī)構(gòu)編制的共19部,由學(xué)術(shù)團(tuán)體編制的有29部,由政府機(jī)構(gòu)編制的有54部,由公司編制的有100部。敘詞表最初產(chǎn)生于圖書情報(bào)領(lǐng)域,編制方法為將自然語言轉(zhuǎn)化為受控語言。而現(xiàn)在的敘詞表的編制不再限于圖書館等信息機(jī)構(gòu),商業(yè)性機(jī)構(gòu)所占比重較大。在所有被調(diào)查的敘詞表中,有100部是由商業(yè)機(jī)構(gòu)編制的,這類敘詞表占總數(shù)的39.4%,其中Gale公司編有69部敘詞表。屬于政府機(jī)構(gòu)編制的有54部敘詞表(占總數(shù)的21.3%),英國遺產(chǎn)委員會(huì)(English Heritage Commission)編有8部敘詞表,為政府機(jī)構(gòu)中編制敘詞表數(shù)量最多的機(jī)構(gòu)。聯(lián)合國等國際性機(jī)構(gòu),如國際天文協(xié)會(huì)(International Astronomical Union)、國際勞動(dòng)組織(International Labour Organization)、國際原子能機(jī)構(gòu)(International Atomic Energy Agency)和國際能源機(jī)構(gòu)(International Energy Agency)等也編制了與自身性質(zhì)相適應(yīng)的敘詞表,這類敘詞表共有19部,占總量的7.5%。將敘詞表嵌入到各種商業(yè)性機(jī)構(gòu)或政府機(jī)構(gòu)的檢索系統(tǒng)中,導(dǎo)致其編制機(jī)構(gòu)的范圍擴(kuò)大,這是敘詞表編制在網(wǎng)絡(luò)環(huán)境下的重要特征。

        1.5 敘詞表所屬的國家或地區(qū)(見圖2)

        多國聯(lián)合編制的敘詞表共有87部。美國獨(dú)立編制了80部敘詞表。并且美國還與其他國家合作編制敘詞表,如Gale公司是由美國牽頭的,其編制的69部敘詞表則屬于多國聯(lián)合編制,涉及天文、農(nóng)業(yè)、生物、化學(xué)、通信、計(jì)算機(jī)等各種學(xué)科。由此可看出,美國在編制敘詞表領(lǐng)域處于牢固的領(lǐng)軍地位。在所調(diào)查的國家或地區(qū)中,除美國外,其它國家按所編制的敘詞表數(shù)量由高到低的順序?yàn)橛?、澳大利亞、除英國之外的歐洲地區(qū)、加拿大,其編制敘詞表的數(shù)量分別是31部、21部、20部、10部。

        1.6 敘詞表的結(jié)構(gòu)

        敘詞表的結(jié)構(gòu)分為宏觀結(jié)構(gòu)和微觀結(jié)構(gòu),本文主要分析其微觀結(jié)構(gòu)。敘詞表的微觀結(jié)構(gòu)體現(xiàn)在詞間關(guān)系上。敘詞表中的詞間關(guān)系分為等級(jí)關(guān)系(Hierarchical relationship)、等同關(guān)系(Equivalence relationship)和相關(guān)關(guān)系(Associative relationship)。等級(jí)關(guān)系為顯示術(shù)語的上位概念和下位概念;等同關(guān)系為連接了術(shù)語的同義詞;相關(guān)關(guān)系為建立與術(shù)語相關(guān)的參照,結(jié)構(gòu)較為松散。被調(diào)查的敘詞表的等級(jí)結(jié)構(gòu)從2級(jí)到12級(jí)不等,其中《酒類和其他藥物敘詞表》(Alcohol and Other Drug Thesaurus,簡稱AOD)有12級(jí)。在所調(diào)查的敘詞表中,同時(shí)擁有等級(jí)關(guān)系、等同關(guān)系和相關(guān)關(guān)系的敘詞表共有215部,占到總量的84.6%。極少數(shù)敘詞表的詞間關(guān)系簡單,其主要為敘詞數(shù)量較少、非學(xué)術(shù)性的敘詞表。例如,《亞洲蔬菜敘詞表》僅以字順形式列出敘詞,詞間關(guān)系極為簡化,沒有等級(jí)關(guān)系、相關(guān)關(guān)系或等同關(guān)系。

        另外,網(wǎng)絡(luò)環(huán)境下的敘詞表顯示方式更加立體。傳統(tǒng)敘詞表以字順方式排列敘詞,以“用”、“代”、“屬”、“分”、“參”等表示敘詞之間的關(guān)系,用戶查閱不便。在所調(diào)查的敘詞表中,相當(dāng)一部分?jǐn)⒃~表中敘詞的上位詞、下位詞和相關(guān)詞都可通過超鏈接點(diǎn)擊查看,如《國際職業(yè)安全與健康信息中心敘詞表》(Occupational Safety and Health Thesaurus, 簡稱CIS)、《加拿大無線電視和通訊委員會(huì)敘詞表》(Canadian Radio-television and Telecommunications Commission Thesaurus,簡稱CRTC)、《弗羅里達(dá)環(huán)境網(wǎng)絡(luò)敘詞表》(Florida Environments Online Thesaurus)。

        1.7 敘詞表的特征

        部分網(wǎng)絡(luò)敘詞表面向大眾生活和商業(yè)貿(mào)易,如《廚師敘詞表》(Cook's Thesaurus)收納了有關(guān)廚房用品的敘詞,《亞洲蔬菜敘詞表》是為了亞洲蔬菜的出口,供外貿(mào)商查詢、檢索使用。這類敘詞表不僅沒有復(fù)雜的查詢方式,且附有圖片,能夠?yàn)橛脩籼峁┲庇^的瀏覽方式??梢姡瑪⒃~表的應(yīng)用領(lǐng)域更加廣泛。

        另外,當(dāng)前個(gè)人編制的敘詞表成為敘詞表家族中的新成員。其主要源自于特定領(lǐng)域的學(xué)者或從事某項(xiàng)事業(yè)多年的人員自身的經(jīng)驗(yàn)總結(jié)。在所調(diào)查的敘詞表中,由個(gè)人編制的5部分別為《廚師敘詞表》、《藥草敘詞表》(Thesaurus for the Herb)、《寄生蟲學(xué)敘詞表》(Thesaurus of Parasitology)、《液晶研究與應(yīng)用敘詞表》(Thesaurus for Liquid Crystal Research and Applications)和《哈利波特?cái)⒃~表》(Harry Potter Thesaurus)。個(gè)人編制敘詞表能夠?qū)€(gè)人的隱性知識(shí)顯性表示,并促進(jìn)個(gè)人知識(shí)的社會(huì)化。

        2 國外敘詞表在新環(huán)境下的應(yīng)用

        網(wǎng)絡(luò)環(huán)境下,敘詞表的應(yīng)用不再局限于傳統(tǒng)領(lǐng)域。聯(lián)機(jī)敘詞表是獨(dú)立于檢索系統(tǒng)而存在的網(wǎng)絡(luò)信息檢索工具,可同時(shí)供聯(lián)機(jī)編目人員和網(wǎng)絡(luò)信息用戶使用;網(wǎng)絡(luò)數(shù)據(jù)庫和搜索引擎也相繼使用敘詞表進(jìn)行詞匯控制和瀏覽檢索;此外,敘詞表也被應(yīng)用于本體構(gòu)建等領(lǐng)域,充分發(fā)揮其受控詞表的優(yōu)勢。

        2.1 利用敘詞表構(gòu)建本體(Ontology)

        當(dāng)前,本體是圖書情報(bào)領(lǐng)域的研究熱點(diǎn)。本體重在概念及其關(guān)系的體現(xiàn),它在術(shù)語表中定義了一系列有關(guān)對(duì)象和關(guān)系的類,其內(nèi)在的關(guān)系規(guī)則在表達(dá)不同詞匯之間的等同、從屬和相關(guān)關(guān)系的同時(shí),也提供一種推理的機(jī)制。而敘詞表提供的術(shù)語詞匯列表及參照系統(tǒng)顯示出的詞間關(guān)系能夠?yàn)闃?gòu)建本體提供一定的基礎(chǔ)。因此,應(yīng)充分利用敘詞表進(jìn)行本體的構(gòu)建,將敘詞表轉(zhuǎn)化為本體等在網(wǎng)絡(luò)時(shí)代知識(shí)組織系統(tǒng)中發(fā)揮作用。聯(lián)合國糧農(nóng)組織的AOS(Agricultural Ontology Service)項(xiàng)目以糧農(nóng)敘詞表AGROVOC為原型,構(gòu)建了農(nóng)業(yè)本體服務(wù),促進(jìn)了聯(lián)合國糧農(nóng)組織網(wǎng)站的電子資源信息檢索[5-6]。有學(xué)者比較了《國家農(nóng)業(yè)圖書館敘詞表》(National Agriculture Library Thesaurus)和一個(gè)“農(nóng)作物-昆蟲(crop-pest)”本體在國家農(nóng)業(yè)圖書館中的檢索效果,得出本體可以為領(lǐng)域知識(shí)提供更好的描述和基于知識(shí)描述的更深層次的邏輯推理,進(jìn)而提高檢索質(zhì)量[7]。

        2.2 利用敘詞表構(gòu)建知識(shí)分類表(Taxonomy)

        知識(shí)分類表是由等級(jí)結(jié)構(gòu)和主題詞兩個(gè)基本元素組成、具有多種用途的一種知識(shí)組織工具。它的主要功能是將資源對(duì)象類聚到一個(gè)特定的知識(shí)等級(jí)。知識(shí)分類表可用于自動(dòng)分類、鏈接資源、提供瀏覽等,也可用于優(yōu)化檢索提問和檢索結(jié)果。利用敘詞表分類法構(gòu)建知識(shí)分類表由來已久,如美國醫(yī)學(xué)協(xié)會(huì)(American Medical Association,簡稱AMA)利用MeSH(Medical Subject Headings,醫(yī)學(xué)主題詞表)建立了一個(gè)醫(yī)學(xué)知識(shí)分類表,該表在美國醫(yī)學(xué)協(xié)會(huì)網(wǎng)站上的應(yīng)用促進(jìn)了其網(wǎng)絡(luò)期刊文獻(xiàn)的獲?。籗aeed和Chaudhry兩位學(xué)者用DDC(Dewey Decimal Classification,杜威十進(jìn)分類法)和IEEE(Institute of Electrical and Electronics Engineers,美國電氣和電子工程師協(xié)會(huì))網(wǎng)頁敘詞表建立了知識(shí)分類表[8];王紅忠等用DDC和3個(gè)敘詞表建立了機(jī)構(gòu)知識(shí)分類表,這3個(gè)敘詞表分別為美國社會(huì)信息科學(xué)與技術(shù)敘詞表(American Society for Information Science and Technology,簡稱 ASIST&T)、圖書館與信息科學(xué)文摘詞表(Library and Information Science Abstracts, 簡稱LISA)及科教資源信息中心(Educational Resources Information Center, 簡稱ERIC)[9]。在構(gòu)建知識(shí)分類表的過程中,敘詞表的范疇索引可以用來構(gòu)建知識(shí)分類表的上位類目,其詞間等級(jí)關(guān)系可以用來確定下位類目,其詞間等同關(guān)系可以建立子目的代替關(guān)系,敘詞則可以提供子目的候選詞。

        2.3 敘詞表用于網(wǎng)絡(luò)信息組織的優(yōu)化

        敘詞表在知識(shí)組織方面的優(yōu)勢以及近年來網(wǎng)絡(luò)敘詞表的不斷發(fā)展,使得一些主題信息網(wǎng)關(guān)紛紛利用敘詞表對(duì)Web頁面和站點(diǎn)進(jìn)行標(biāo)引及檢索。例如,藝術(shù)、設(shè)計(jì)、建筑和媒介信息網(wǎng)關(guān)應(yīng)用《Getty藝術(shù)和建筑敘詞表》(Art and Architecture Thesaurus,簡稱AAT)進(jìn)行標(biāo)引,社會(huì)科學(xué)信息網(wǎng)關(guān)應(yīng)用《人文社會(huì)科學(xué)電子敘詞表》(Humanities and Social Science Electronic Thesaurus,簡稱HASSET)進(jìn)行標(biāo)引。敘詞表在網(wǎng)絡(luò)信息組織中的應(yīng)用也體現(xiàn)為嵌入到數(shù)據(jù)庫檢索系統(tǒng)中,如ETOH數(shù)據(jù)庫(The Alcohol and Alcohol Problems Science Database)應(yīng)用《酒類和其他藥物敘詞表》(Alcohol and Other Drug Thesaurus,簡稱AOD),使用戶可以直接選擇AOD敘詞表的敘詞進(jìn)行檢索。在提高專題性或?qū)W術(shù)性網(wǎng)絡(luò)資源搜索引擎的查準(zhǔn)率與查全率時(shí),應(yīng)充分認(rèn)識(shí)到敘詞表的重要作用。

        3 國外敘詞表的發(fā)展趨勢

        3.1 敘詞表的多語言化

        隨著擁有不同文化和語言背景的群體對(duì)各種信息需求量的增加,支持多語種的檢索工具變得越來越重要,多語言化成為敘詞表編制和發(fā)展的一種趨勢。敘詞表并非在編制之初就擁有多種語言版本,而是隨著信息組織的需要,通過翻譯原敘詞表的方式添加新的版本。如所調(diào)查的敘詞表中,《綜合多語言環(huán)境敘詞表》在1998年發(fā)布之初,只擁有荷蘭、芬蘭、法、德、意大利、挪威、葡萄牙、西班牙、丹麥和希臘語10種語言[10],截至2011年則發(fā)展至18種語言?!兜厍蚩茖W(xué)多語言敘詞表》(Multilingual Thesaurus of Geoscience)的編制委員會(huì)IUGS/COGEOINFO(International Union of Geological sciences/Commission on Management and Application of Geoscience Infomation,國際地質(zhì)科學(xué)聯(lián)合會(huì)/國際地學(xué)信息管理與應(yīng)用委員會(huì))宣稱,其目標(biāo)之一就是將該敘詞表翻譯為多種語言版本,目前該敘詞表已有7種語言版本[11]。

        3.2 敘詞表的互操作化

        被調(diào)查的敘詞表在學(xué)科范圍、詞表結(jié)構(gòu)和敘詞的選取等方面都存在著一定的差異,這些差異不利于資源的標(biāo)引與共享,因此,需要實(shí)現(xiàn)不同敘詞表之間的兼容和互操作。在這方面的研究已取得了一些成果,如許多國家已將MeSH譯為本國語言,目前MeSH有法、德、俄、西班牙等多種語言的譯本,可建立跨語言的醫(yī)學(xué)檢索系統(tǒng)。另外,不同類型的數(shù)據(jù)庫使用的情報(bào)檢索語言也不同,成為了用戶在檢索某一課題時(shí)的障礙。因此,情報(bào)檢索語言之間也必須實(shí)現(xiàn)兼容和互換,使一個(gè)檢索式適用于多個(gè)系統(tǒng)。如工程索引(Engineering Index,簡稱EI)分類主題一體化詞表的應(yīng)用在實(shí)質(zhì)上實(shí)現(xiàn)了分類語言和主題語言的兼容與互換,體現(xiàn)了分類、主題一體化的發(fā)展趨勢。

        3.3 敘詞表的可視化

        敘詞表須使用戶易于理解,通過提供定義、范圍注釋或簡介段落提高用戶檢索的查準(zhǔn)率與查全率。紙質(zhì)版敘詞表的詞間關(guān)系顯示和術(shù)語標(biāo)注都不足以幫助用戶理解。網(wǎng)絡(luò)環(huán)境下,敘詞表的編制和應(yīng)用可以采用相應(yīng)的技術(shù)實(shí)現(xiàn)可視化,從而提高用戶瀏覽和檢索的便利性。例如,由斯坦福大學(xué)醫(yī)學(xué)院的醫(yī)學(xué)情報(bào)學(xué)研究組開發(fā)的Protégé工具,可以用于實(shí)現(xiàn)詞間關(guān)系可視化?!犊梢暬瘮⒃~表》(Visual Thesaurus)應(yīng)用輻射圖顯示相關(guān)詞匯并可以點(diǎn)擊查詢?cè)~義。

        在圖3中,連線顯示詞與詞之間的聯(lián)系。鼠標(biāo)放置在結(jié)點(diǎn),則出現(xiàn)方框顯示該結(jié)點(diǎn)下詞的解釋和相關(guān)例句?!犊梢暬瘮⒃~表》并非是用于信息標(biāo)引和檢索的敘詞表,而是以學(xué)習(xí)工具的形式出現(xiàn),但這種可視化的應(yīng)用為敘詞表的未來發(fā)展提供了方向。

        3.4 敘詞表的分面化

        分面敘詞表是Aitchison等人于1969年提出的概念,表示將分面分類法和敘詞表相結(jié)合。他指出,分面在當(dāng)前的背景下表示一組基本的分類及類與類之間依據(jù)一定規(guī)則的結(jié)合。每一個(gè)基本分類本身可能是一個(gè)類層次結(jié)構(gòu)①,且絕大多數(shù)情況下不同的分面是相互排斥的,因此可以將不同分面中單個(gè)概念結(jié)合用以查詢或形成檢索式[12]。與傳統(tǒng)敘詞表相比,分面敘詞表引入了一個(gè)相當(dāng)于傳統(tǒng)敘詞表的范疇表和詞族表功能的分面分類表,從而更系統(tǒng)、更明確、更完整地顯示了敘詞表中敘詞間的關(guān)系。被調(diào)查的敘詞表中,大部分含有等級(jí)關(guān)系的敘詞表的編制沒有嚴(yán)格的分面分析過程,且等級(jí)結(jié)構(gòu)不能組合,因此為非分面敘詞表。一小部分?jǐn)⒃~表是分面敘詞表,如《酒類和其他藥物敘詞表》、《美國醫(yī)學(xué)主題詞表》、《Getty藝術(shù)和建筑敘詞表》、《UNESCO敘詞表》、《國際難民術(shù)語詞庫》,等等[12]。建立分面敘詞表既可以用于先組式系統(tǒng)②,也可以用于后組式系統(tǒng)③,從而提高信息檢索系統(tǒng)的查詢和瀏覽功能。

        4 結(jié) 語

        隨著新技術(shù)的出現(xiàn),國外對(duì)傳統(tǒng)敘詞表的改進(jìn)、創(chuàng)新和應(yīng)用不斷加深。敘詞表的編制機(jī)構(gòu)多樣化、數(shù)量的增長、語種的增加等,顯示了其作為成熟的語義工具依然在不斷地發(fā)展;敘詞表在本體構(gòu)建、知識(shí)分類表構(gòu)建、網(wǎng)絡(luò)信息組織優(yōu)化等方面的應(yīng)用,推動(dòng)著其研究的深化。新環(huán)境下,敘詞表對(duì)當(dāng)前的信息組織、知識(shí)組織有重大意義。國內(nèi)在敘詞表理論及應(yīng)用研究方面與國外存在著較大的差距。因此,加強(qiáng)敘詞表的理論研究和應(yīng)用研究勢在必行。

        注 釋:

        ①類層次結(jié)構(gòu)是由相互有關(guān)聯(lián)的若干個(gè)類以一定的關(guān)系構(gòu)成的。一個(gè)類層次結(jié)構(gòu)有兩種組成成分:類和類之間的關(guān)系。

        ②第一代 OPAC被稱為“詞組索引或先組式系統(tǒng)”。

        ③第二代OPAC被稱為“關(guān)鍵詞或后組式系統(tǒng)”。這類系統(tǒng)采納布爾、截?cái)?、限定(按年代、語種) 等檢索技術(shù),而且能夠按關(guān)鍵詞作后組式檢索。

        [1]Taxonomy Warehouse[EB/OL].[2011-03-15].http://www.taxonomywarehouse.com/.

        [2]Thesaurus.com[EB/OL].[2011-03-15].http://thesaurus.com/Roget-Alpha-Index.html.

        [3]Visualthesaurus[EB/OL].[2011-03-15].http://www.visualthesaurus.com/.

        [4]侯漢清.網(wǎng)絡(luò)時(shí)代的情報(bào)檢索語言:進(jìn)展及熱點(diǎn)[EB/OL].[2011-03-15].http://wenku.baidu.com/view/b42aed6eb84ae45c3b358c3b.html.

        [5]Eriksen L.From Thesaurus to Ontology: From AGROVOC to the Agricultural Ontology Service (AOS)[J].Synopsis, 2003 (1): 17-20.

        [6]聯(lián)合國糧農(nóng)組織AOS項(xiàng)目[EB/OL].[2011-03-15].http://www.fao.org/fishery/topic/18046/en.

        [7]Soonho K, Howard W B.A practical Comparison Between Thesaurus and Ontology Techniques as a Basis for Search Improvement[J].Journal of Agricultural & Food Information,2006 (4) :23-42.

        [8]Saeed H, Chaudhry A S.Using Dewey Decimal Classification Scheme(DDC) for Building Taxonomies for Knowledge Organization[J].Journal of Documentation,2002 (5):575-583.

        [9]Wang Zhonghong, Chaudhry A S, Christopher S G K.Using Classification Schemes and Thesauri to Build an Organizational Taxonomy for Organizing Content and Aiding Navigation[J].Journal of Documentation, 2008 (6): 842-876.

        [10]General Multilingual Environmental Thesaurus [EB/OL].[2011-03-15].http://uta.iia.cnr.it/GEMET.htm.

        [11]Multilingual Thesaurus of Geoscience[EB/OL].[2011-03-15].http://www.cgi-iugs.org/docs/Multilingual_thesaurus_of_geoscience.pdf.

        [12]Tudhope D, Binding C.Faceted Thesauri[J].Axiomathes, 2008 (18):211-222.

        猜你喜歡
        詞表檢索語言
        A Chinese-English List of the Sports Programmes in Winter Olympics 冬奧會(huì)項(xiàng)目名稱漢英對(duì)照詞表
        英語世界(2021年13期)2021-01-12 05:47:51
        語言是刀
        文苑(2020年4期)2020-05-30 12:35:30
        2019年第4-6期便捷檢索目錄
        讓語言描寫搖曳多姿
        累積動(dòng)態(tài)分析下的同聲傳譯語言壓縮
        敘詞表與其他詞表的互操作標(biāo)準(zhǔn)
        華語作為第一語言教學(xué)的常用分級(jí)詞表研制
        專利檢索中“語義”的表現(xiàn)
        專利代理(2016年1期)2016-05-17 06:14:36
        我有我語言
        常用聯(lián)綿詞表
        国产精品99精品一区二区三区∴| 亚洲一区二区三区av色婷婷| 亚洲天堂无码AV一二三四区| 国产91精品清纯白嫩| 亚洲国产精品成人av在线不卡| 国产精品久人妻精品老妇| 欧美黑人xxxx又粗又长| 国产一起色一起爱| 亚洲av无码乱码国产麻豆穿越| 国产码欧美日韩高清综合一区 | 亚洲国产综合久久精品| 国产精品国产自产自拍高清av| 无码专区亚洲综合另类| 熟女人妇交换俱乐部| 亚洲tv精品一区二区三区| 精品国产一品二品三品| 免费国产一区二区视频| 国产av天堂亚洲av刚刚碰| 午夜福利一区在线观看中文字幕| 免费a级毛片无码免费视频首页 | 亚洲精品av一区二区日韩| 精品少妇一区二区av免费观看 | 欧美大黑帍在线播放| 亚洲三区二区一区视频| 日本亚洲一级中文字幕| 男女打扑克视频在线看| 肉色丝袜足j视频国产| 亚洲性啪啪无码av天堂| 成人无码视频在线观看网站| 国内精品嫩模av私拍在线观看| 国产日产久久高清ww| 国产精品免费观看调教网| 国产在线精品成人一区二区三区| 亚洲地区一区二区三区| 国产视频一区二区三区免费| 草逼视频污的网站免费| 日本一道综合久久aⅴ免费| 国产成人无码一区二区三区在线 | 人妻无码一区二区在线影院| 台湾自拍偷区亚洲综合| 午夜国产视频一区二区三区|