亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        術(shù)語查重探討

        2016-11-19 08:41:24趙偉
        中國(guó)科技術(shù)語 2016年4期
        關(guān)鍵詞:符號(hào)數(shù)據(jù)庫

        趙偉

        摘要:對(duì)術(shù)語審定中的查重工作做了概述,并揭示和解決了術(shù)語查重工作中的幾個(gè)關(guān)鍵問題,對(duì)術(shù)語工作者,尤其是多語種術(shù)語數(shù)據(jù)庫工作者有一定幫助。

        關(guān)鍵詞:術(shù)語學(xué),數(shù)據(jù)庫,查重,文字串,符號(hào),集合

        中圖分類號(hào):N04;TP392文獻(xiàn)標(biāo)識(shí)碼:ADOI:10.3969/j.issn.1673-8578.2016.04.004

        Abstract: This paper outlines the term duplicate checking in term examination and approval. Several key problems in term duplicate checking are revealed and solved. We hope it is helpful to term workers, especially to workers engaged on multilingual terminology database.

        Keywords: terminology, database, duplicate checking, character string, symbol, set

        引言

        術(shù)語(中國(guó)習(xí)慣稱“科技名詞”)查重工作是術(shù)語審定工作中的必要環(huán)節(jié),對(duì)保證術(shù)語的單義性至關(guān)重要。筆者在全國(guó)科學(xué)技術(shù)名詞審定委員會(huì)(以下簡(jiǎn)稱“全國(guó)科技名詞委”)曾從事多年名詞審定工作,也曾多次參與國(guó)家電工術(shù)語標(biāo)準(zhǔn)的審定工作,對(duì)術(shù)語查重工作的重要性有切身體會(huì);術(shù)語查重工作也具有一定的復(fù)雜性——筆者從2003年開始從事術(shù)語審定工作,到目前為止,曾接觸或了解的術(shù)語查重程序至少已經(jīng)有3個(gè),這些查重程序的功能逐漸增強(qiáng),多年來,為規(guī)范科技名詞做出了重要貢獻(xiàn)。但“百尺竿頭,更進(jìn)一步”,術(shù)語查重程序還有待繼續(xù)完善。事實(shí)上,全國(guó)科技名詞委審定公布的科技名詞數(shù)據(jù)庫和國(guó)家術(shù)語標(biāo)準(zhǔn)中都有一些表示相同概念但定名卻不同的術(shù)語,一部分是文字錄入有誤或各學(xué)科已約定俗成、不宜統(tǒng)一所致,另一部分則與查重處理不夠完善有關(guān)。

        由此可見,術(shù)語查重工作在應(yīng)用上有其重要性和復(fù)雜性,還沒有得到妥善解決,因此,這是個(gè)值得認(rèn)真研究的課題。

        一術(shù)語名稱查重概述

        術(shù)語的名稱包括中文名和英文名(對(duì)多語種術(shù)語數(shù)據(jù)庫而言,則更有用多種語言表示的術(shù)語名稱)。中文名包括正名(規(guī)范名,有且僅有一個(gè))和異名(不一定都有)。異名包括全稱、簡(jiǎn)稱、又稱、俗稱、曾稱等[1]。英文名雖沒有正名和異名的說法,但也有與中文名相對(duì)應(yīng)的英文名(中文正名均有對(duì)應(yīng)的英文名,但中文異名不都有)。

        查重,顧名思義,是查找重復(fù)、相同之處。術(shù)語查重,從微觀上來講,自然就是查找兩個(gè)術(shù)語中各組成部分是否相同以便進(jìn)一步確定這兩個(gè)術(shù)語是否表示相同概念。因術(shù)語包括名稱和定義兩部分,所以術(shù)語查重自然就應(yīng)該包括術(shù)語名稱查重和定義查重兩部分。由于術(shù)語定義查重比較復(fù)雜,所以,目前大多數(shù)術(shù)語數(shù)據(jù)庫都沒有開展此項(xiàng)工作。

        術(shù)語名稱查重,具體而言,就是要對(duì)某個(gè)術(shù)語的每個(gè)中文名和英文名與另一個(gè)術(shù)語的每個(gè)中文名和英文名一一比較,看其是否相同。這里要強(qiáng)調(diào)的是:術(shù)語的每一個(gè)名稱(包括中文正名和所有中文異名以及對(duì)應(yīng)的英文名)都要參與查重。如果只查中文正名和相應(yīng)的英文名,就會(huì)漏掉很多重名的術(shù)語。如以下兩個(gè)例子:

        ①測(cè)量結(jié)果的計(jì)量可比性metrological comparability of measurement results簡(jiǎn)稱:計(jì)量可比性(metrological comparability)

        ②計(jì)量可比性metrological comparability

        這兩個(gè)術(shù)語,明顯能看出是表示同一概念。但如果查重程序只查中文正名和相應(yīng)的英文名就無法發(fā)現(xiàn),因?yàn)槎哌@兩項(xiàng)都是不同的,重名的是①的中文簡(jiǎn)稱和②的中文正名以及①的中文簡(jiǎn)稱對(duì)應(yīng)的英文名和②的中文正名對(duì)應(yīng)的英文名。所以,要強(qiáng)調(diào)術(shù)語的每一個(gè)名稱都要參與查重。另外,沒有編號(hào)而只在術(shù)語定義中出現(xiàn)的帶英文名的術(shù)語也要參與查重。

        如果兩個(gè)術(shù)語的所有中文名和所有英文名都不相同,就可以認(rèn)為這兩個(gè)術(shù)語是表示不同的概念;如果兩個(gè)術(shù)語的中文名或英文名中至少有一個(gè)相同,還要把這兩個(gè)術(shù)語放在一起繼續(xù)比較。以兩術(shù)語之間各中英文名異同的對(duì)應(yīng)關(guān)系來分類,具體還可再細(xì)分為以下幾種情況:①兩術(shù)語的中文正名和相應(yīng)英文名相同;②一術(shù)語的某個(gè)中文名和相應(yīng)英文名與另一術(shù)語的某個(gè)中文名和相應(yīng)英文名相同(不包含①的情況);③某個(gè)英文名相同,而對(duì)應(yīng)中文名不同;④某個(gè)中文名相同,而對(duì)應(yīng)英文名不同。當(dāng)然,以上只是單一的分類,實(shí)際情況更復(fù)雜,但也都是以上各種情況的組合。所以,討論這幾種情況就足夠了。

        以此為基礎(chǔ),要對(duì)每個(gè)學(xué)科所有術(shù)語一一進(jìn)行查重(即所謂“內(nèi)部查重”,這是為了保證該學(xué)科內(nèi)術(shù)語的單義性),以及對(duì)該學(xué)科所有術(shù)語與術(shù)語審定機(jī)構(gòu)已審定公布的所有學(xué)科術(shù)語一一進(jìn)行查重(即所謂“外部查重”,這是為了保證術(shù)語審定機(jī)構(gòu)審定的所有學(xué)科術(shù)語的數(shù)據(jù)庫內(nèi)術(shù)語的單義性)。

        以查重結(jié)果為基礎(chǔ),還要進(jìn)行協(xié)調(diào)處理。處理時(shí),對(duì)兩個(gè)術(shù)語的所有中文名和所有英文名都不相同的情況,可以認(rèn)為這兩個(gè)術(shù)語是表示不同的概念,無論“內(nèi)部查重”還是“外部查重”,都要收錄;而對(duì)兩個(gè)術(shù)語的中文名或英文名中至少有一個(gè)相同的情況,則還要分清它們是否表示同一概念。

        如果是表示不同的概念,則按照術(shù)語單義性的要求,盡量一詞一義,給這兩個(gè)術(shù)語分別賦予不同的名稱。如確有必要,則不管是“內(nèi)部查重”還是“外部查重”,也可維持現(xiàn)狀,各自保留。

        如果是表示相同的概念,則還要繼續(xù)細(xì)分:第①類情況,對(duì)內(nèi)部查重而言,只能保留一個(gè);對(duì)外部查重而言,可繼續(xù)保留。第②類情況,對(duì)“內(nèi)部查重”而言,只能保留一個(gè)術(shù)語,但要對(duì)術(shù)語的名稱進(jìn)行處理;對(duì)“外部查重”而言,要對(duì)該術(shù)語的名稱與術(shù)語數(shù)據(jù)庫內(nèi)的其他學(xué)科進(jìn)行協(xié)調(diào)處理,盡量保證“正名”對(duì)應(yīng)“正名”,“異名”對(duì)應(yīng)“異名”。第③類情況,對(duì)“內(nèi)部查重”而言,只能保留一個(gè)術(shù)語,但要處理術(shù)語的中文名稱;對(duì)“外部查重”而言,也要協(xié)調(diào)處理術(shù)語的中文名稱。第④類情況,對(duì)“內(nèi)部查重”而言,只能保留一個(gè)術(shù)語,但要分清這兩個(gè)英文名哪個(gè)更常用,更合適;對(duì)“外部查重”而言,也要分清這兩個(gè)英文名哪個(gè)更常用,更合適。

        據(jù)了解,這是到目前為止包括全國(guó)科技名詞委術(shù)語庫在內(nèi)的各術(shù)語庫開展術(shù)語查重工作的主要做法。這種做法能發(fā)現(xiàn)大部分有重名的術(shù)語,對(duì)保證術(shù)語的單義性功不可沒,但仍然有待改善。以下是具體分析。

        二術(shù)語文字(包括數(shù)字)串查重

        以術(shù)語名稱作為查重對(duì)象,看似合情合理,但深入分析,便可發(fā)現(xiàn),這種做法也有不完善之處:有些術(shù)語,雖然其名稱并不相同,但看起來非常相似,用術(shù)語名稱作為查重對(duì)象卻查不出來。這樣的例子參見表1。

        以上都是在審定過程中出現(xiàn)的術(shù)語,而不是已經(jīng)正式公布的術(shù)語,這些術(shù)語已經(jīng)由以術(shù)語名稱為比較對(duì)象的查重程序做過查重,查重結(jié)果顯示是不重復(fù)的術(shù)語。但由表1可見,編號(hào)為奇數(shù)和偶數(shù)的

        相鄰兩個(gè)術(shù)語,明顯能看出其中文名或英文名非常相似,很可能是表示相同概念的術(shù)語,但以術(shù)語名稱作為查重對(duì)象,卻無法發(fā)現(xiàn)其共性。這會(huì)造成以下兩個(gè)問題:一是對(duì)學(xué)科“內(nèi)部查重”而言,在查重階段用查重程序無法發(fā)現(xiàn)內(nèi)部重復(fù)的術(shù)語,只有在做按拼音排序的索引的時(shí)候才有可能發(fā)現(xiàn),這就要?jiǎng)h除其中一個(gè)重復(fù)的術(shù)語。這時(shí)要么在該被刪除的術(shù)語位置補(bǔ)充一個(gè)名稱、定義和字符數(shù)都相近的術(shù)語——但補(bǔ)充一個(gè)合適的術(shù)語并不容易,要么對(duì)該術(shù)語所在章節(jié)的術(shù)語重新編號(hào),重新排版——這會(huì)非常麻煩。而無論怎么補(bǔ)救,都會(huì)影響審定進(jìn)程。二是對(duì)外部查重而言,在查重階段用查重程序無法發(fā)現(xiàn)與已審定公布學(xué)科重復(fù)的術(shù)語,根據(jù)上文提及的查重處理原則,會(huì)被當(dāng)作新術(shù)語而收錄到術(shù)語數(shù)據(jù)庫中,但我們卻對(duì)此毫不知情,只有在用戶偶然用“包含”等條件在數(shù)據(jù)庫中搜索術(shù)語時(shí)才能發(fā)現(xiàn)。由此可見,以術(shù)語名稱作為查重對(duì)象,雖然看似合情合理,但其實(shí)并不妥當(dāng),而且會(huì)造成不良影響。

        既然以術(shù)語名稱作為查重對(duì)象有無法解決的矛盾,該以什么作為查重對(duì)象呢?先分析表1的術(shù)語。表1里編號(hào)為奇數(shù)和偶數(shù)的相鄰兩個(gè)術(shù)語,既然能看出來是表示相同概念的術(shù)語,說明它們的名稱必然有某種共性,而查重程序無法發(fā)現(xiàn)這種共性,說明它們的名稱也有一定的差異。正是這些術(shù)語名稱的共性和差異混在一起才導(dǎo)致查重程序無法發(fā)現(xiàn)其共性。如果能消除這些術(shù)語名稱的差異,而提煉出它們的共性,自然就可以發(fā)現(xiàn)它們是表示相同概念的術(shù)語了。這些術(shù)語有什么共性和差異呢?

        仔細(xì)觀察可發(fā)現(xiàn):編號(hào)為1和2的術(shù)語,其中文名稱都包含按“正仲轉(zhuǎn)換”順序排列的漢字,這是其共性。1的中文名稱比2多了一個(gè)符號(hào)“—”,這是其差異。編號(hào)為3和4的術(shù)語,其英文名稱里都包含按“transverseelectromagnetictransmissioncell”順序排列的英文字母,這是其共性。3的英文名稱比4多了一個(gè)符號(hào)“”,這是其差異。比較這兩對(duì)術(shù)語,可以發(fā)現(xiàn),這兩對(duì)術(shù)語的共性體現(xiàn)在:它們的中文或英文名稱都包含按照同樣順序排列的相同的文字串;其差異體現(xiàn)在:它們的中英文名稱都包含有不同位置和種類的空格和符號(hào)。而且,只要消除了這些術(shù)語名稱中不同位置和種類的空格和符號(hào),即消除其差異,其共性——相同的連續(xù)文字串就水落石出。由此可見,術(shù)語名稱可以再細(xì)分為兩部分,一部分是表示有實(shí)際意義的文字(包括各種數(shù)字,如阿拉伯?dāng)?shù)字、羅馬數(shù)字等),另一部分是無實(shí)際意義而只起間隔作用的空格和符號(hào)。在對(duì)術(shù)語查重時(shí),以消除術(shù)語名稱中的空格和符號(hào)(包括全角和半角)而形成的連續(xù)文字(包括數(shù)字)串為查重對(duì)象,就可以發(fā)現(xiàn)以術(shù)語名稱為查重對(duì)象時(shí)無法發(fā)現(xiàn)的看似相同的術(shù)語。

        實(shí)際上,表1這些術(shù)語中不同的空格和符號(hào)應(yīng)與術(shù)語提供者的使用習(xí)慣和文字錄入的失誤有關(guān),尤其是當(dāng)這些術(shù)語都分別處在各學(xué)科概念體系中相距較遠(yuǎn)位置的時(shí)候,再仔細(xì)的審定編輯也難以發(fā)現(xiàn)它們是僅在符號(hào)上有細(xì)微差異的同義術(shù)語。但以術(shù)語文字為比較對(duì)象進(jìn)行查重就可以把它們聚攏在一起,使其不受使用習(xí)慣差異和符號(hào)錄入失誤的影響,而得到正確的查重結(jié)果。

        這種方法的可行性如何呢?粗看起來,空格和符號(hào)的位置不確定,不好定位。但空格和符號(hào)的種類在各種語言和各種輸入法中都是有限的,所以只要按照類別查找、刪除即可,而無需考慮其具體位置。因此,這是適用于多語種術(shù)語數(shù)據(jù)庫的通用而可行的方法。

        能否對(duì)該方法加以拓展,以發(fā)現(xiàn)更廣泛的術(shù)語文字共性呢?例如,可否考慮把兩個(gè)術(shù)語的文字串的差異個(gè)數(shù)限定在一定范圍內(nèi)(一兩個(gè)字等等)?對(duì)中文來說,這就會(huì)查找到更多相去甚遠(yuǎn)的術(shù)語。如速度、角速度、加速度、相速度等,盡管它們只相差一個(gè)字,但卻是完全不同的術(shù)語。而英文更是詞形變化較多的語言,如名詞的單復(fù)數(shù),動(dòng)詞的原形、不定式、過去分詞、現(xiàn)在分詞等,再考慮到復(fù)合詞術(shù)語,則要想找到包含多種詞形變化而又是同義的術(shù)語,就要將文字串的差異個(gè)數(shù)擴(kuò)大得更多,而這將會(huì)導(dǎo)致查找到更多完全不同的術(shù)語。因此,以消除術(shù)語名稱中的空格和符號(hào)而形成的連續(xù)文字串為對(duì)象做查重不宜繼續(xù)拓展。

        另外,在實(shí)踐中還要注意一些特殊符號(hào)的處理,如括號(hào)(包括中括號(hào)、圓括號(hào),全角、半角都計(jì)在內(nèi))內(nèi)的文字通常是表示可以省略的,刪除括號(hào)時(shí)要把術(shù)語名稱分為兩個(gè)來查重處理,一個(gè)是帶括號(hào)內(nèi)的文字,一個(gè)是不帶括號(hào)內(nèi)的文字;有時(shí)括號(hào)內(nèi)的文字是表示另一個(gè)名稱或縮寫,有的在“,”“;”“/”后表示另一個(gè)名稱,那么這個(gè)名稱也要參與查重。目前表示所有格的英文有的在名詞后加“s”,有的只加“”,有的什么都不加,可統(tǒng)一刪除為不加,以方便查重。

        三文字的規(guī)范

        如同符號(hào)和空格的差異會(huì)影響查重的精確性一樣,文字的差異也會(huì)有影響。對(duì)英文名而言,因?yàn)橛卸喾N英語,最好統(tǒng)一用一種英語表示(如美國(guó)英語)。查重應(yīng)不區(qū)分外文大小寫,以消除文字錄入失誤的影響。外文除必須用復(fù)數(shù)者,一般用單數(shù)形式。對(duì)查重文件要進(jìn)行拼寫和語法檢查,以消除文字錯(cuò)誤。以上這些工作應(yīng)安排在消除符號(hào)和空格之前完成。

        四外部查重?cái)?shù)據(jù)庫的選擇

        如前所述,每個(gè)學(xué)科的術(shù)語除了要做內(nèi)部查重以外,還要對(duì)該學(xué)科所有名詞與全國(guó)科技名詞委已審定公布的術(shù)語數(shù)據(jù)庫內(nèi)所有學(xué)科名詞之間一一查重,即所謂“外部查重”。這也是全國(guó)科技名詞委自開展術(shù)語查重工作以來一直沿用的做法。這種做法對(duì)每次只審定公布一個(gè)學(xué)科名詞的理想狀況來說,是合情合理的。但實(shí)際的審定工作是復(fù)雜的,往往在一個(gè)學(xué)科審定公布到下一個(gè)學(xué)科審定公布期間,有多個(gè)學(xué)科在開展審定和查重工作,而已審定公布學(xué)科名詞的術(shù)語數(shù)據(jù)庫在此期間是不變的,這意味著在此期間多個(gè)學(xué)科都要與包含同樣數(shù)量和內(nèi)容的術(shù)語數(shù)據(jù)庫進(jìn)行查重。另外,由于單機(jī)版的查重程序一次只能對(duì)一個(gè)學(xué)科開展外部查重工作,因此,多個(gè)學(xué)科要開展外部查重時(shí),只能每個(gè)學(xué)科依次進(jìn)行,即在查重時(shí)間上是串行的,這就會(huì)耽誤很多學(xué)科的審定工作進(jìn)程。為解決這個(gè)矛盾,有人提出可以利用云計(jì)算的方法,同時(shí)開展多個(gè)學(xué)科的外部查重工作,即所謂“并行處理”,可以節(jié)省查重時(shí)間,加快審定進(jìn)程。這兩個(gè)做法是否正確、可行呢?為討論方便,以下用集合的原理進(jìn)行論述。

        為考慮方便,就以最簡(jiǎn)單的兩個(gè)學(xué)科開展外部查重工作為例,這兩個(gè)學(xué)科可分別表示為集合A和B,而已審定公布的術(shù)語數(shù)據(jù)庫則可表示為集合T,這些集合分別用圖1、2、3中的圓形區(qū)域來表示。顯然,學(xué)科A和已審定公布術(shù)語數(shù)據(jù)庫T的交集A∩T,就是它們之間有重復(fù)的術(shù)語,用圖1中豎線陰影的區(qū)域表示,按照第一節(jié)中介紹的外部查重處理原則,這部分術(shù)語需要進(jìn)行協(xié)調(diào)處理;而A-T則是它們之間沒有任何重復(fù)的術(shù)語,用圖1的圓A中除陰影部分之外的區(qū)域表示,這部分是要作為新術(shù)語而無需做任何處理就直接收錄到術(shù)語數(shù)據(jù)庫中,見圖1。當(dāng)對(duì)學(xué)科A進(jìn)行外部查重處理之后,也要對(duì)學(xué)科B進(jìn)行外部查重處理,同樣的含義和做法也適用于B∩T和B-T,見圖2。對(duì)這兩個(gè)學(xué)科進(jìn)行查重處理的流程可圖示為圖1→圖2。

        顯然,在對(duì)學(xué)科A和學(xué)科B先后分別進(jìn)行外部查重處理時(shí),我們目前并沒有考慮這兩個(gè)學(xué)科術(shù)語之間的關(guān)系。但既然考慮了A∩T、A-T和B∩T、B-T,我們不妨也考慮一下A∩B∩T和A∩B-T(用圖3中橫線陰影的區(qū)域表示)。(A∩B-T) (A∩B),而A∩B是表示學(xué)科A和學(xué)科B之間有交集、重復(fù)的術(shù)語集合,所以A∩B-T中就很有可能存在學(xué)科A中的英文名與學(xué)科B相同而中文名卻不同或這兩個(gè)學(xué)科的中文名相同而英文名卻不同的術(shù)語,按照術(shù)語單義性的要求,這兩個(gè)學(xué)科的這些術(shù)語顯然是需要進(jìn)行協(xié)調(diào)處理的。另一方面,A∩B-T是屬于與已審定公布術(shù)語數(shù)據(jù)庫T沒有任何交集的術(shù)語集合。按照前述外部查重的處理方式和原則,由于學(xué)科A與B是先后各自與已審定公布的術(shù)語數(shù)據(jù)庫T做的外部查重處理,所以,顯然這部分術(shù)語是要作為新術(shù)語而無需做任何處理就直接收錄到術(shù)語數(shù)據(jù)庫T中的。由此可見,在對(duì)學(xué)科術(shù)語做外部查重時(shí),每個(gè)學(xué)科都分別單獨(dú)與同一個(gè)已審定公布學(xué)科的術(shù)語數(shù)據(jù)庫查重,而沒有與已做過外部查重的其他學(xué)科再做查重,這會(huì)導(dǎo)致很多定名不同的同義術(shù)語沒有經(jīng)任何協(xié)調(diào)處理就直接流入已審定公布學(xué)科的術(shù)語數(shù)據(jù)庫中,而我們對(duì)此卻毫不知情。這是術(shù)語數(shù)據(jù)庫中存在許多定名不同的同義術(shù)語的重要原因。

        知道了這個(gè)原因,就可以明白想同時(shí)獨(dú)立開展多個(gè)學(xué)科的外部查重工作的并行處理方式是不可行的,因?yàn)檫@會(huì)導(dǎo)致術(shù)語數(shù)據(jù)庫中出現(xiàn)更多定名不同的同義術(shù)語。要想避免出現(xiàn)這種情況,就要改變目前外部查重的處理方式,即要把已審定公布學(xué)科的術(shù)語數(shù)據(jù)庫和之前已經(jīng)做過外部查重處理的所有學(xué)科合在一起作為一個(gè)外部查重?cái)?shù)據(jù)庫,需要進(jìn)行查重的學(xué)科要與這個(gè)數(shù)據(jù)庫做外部查重。每個(gè)學(xué)科處理完畢,就合并到外部查重?cái)?shù)據(jù)庫中,然后下一個(gè)學(xué)科才能與這個(gè)新的外部查重?cái)?shù)據(jù)庫開展查重和協(xié)調(diào)處理工作。其處理流程可圖示為圖1→圖3,顯然這是一個(gè)串行的處理方式。

        對(duì)短期內(nèi)有多個(gè)學(xué)科需要查重應(yīng)怎樣處理才能不耽誤工作進(jìn)程呢?其實(shí)很簡(jiǎn)單,只需要把這幾個(gè)學(xué)科的術(shù)語合在一起作為一個(gè)大學(xué)科,對(duì)這個(gè)大學(xué)科開展內(nèi)部查重和外部查重協(xié)調(diào)處理就可以了。

        五淺議術(shù)語定義查重

        前文所述都是與術(shù)語名稱有關(guān)的查重,而沒有提及術(shù)語定義查重,因術(shù)語定義查重確實(shí)比較復(fù)雜,全國(guó)科技名詞委目前還沒有開展此項(xiàng)工作。但在實(shí)際審定工作中,術(shù)語定義查重有時(shí)還是有必要的。筆者在從事計(jì)量學(xué)名詞內(nèi)部查重的工作中,就曾經(jīng)以刪除術(shù)語定義中的符號(hào)和空格形成的文字串為對(duì)象,做過定義查重。結(jié)果發(fā)現(xiàn)以下這兩個(gè)術(shù)語,即:

        定標(biāo)器scaler包含一個(gè)或幾個(gè)定標(biāo)電路的、對(duì)電脈沖進(jìn)行計(jì)數(shù)的裝置。

        計(jì)數(shù)器counter包含一個(gè)或幾個(gè)定標(biāo)電路的、對(duì)電脈沖進(jìn)行計(jì)數(shù)的裝置。

        在計(jì)量學(xué)名詞體系中,這兩個(gè)術(shù)語位置相距甚遠(yuǎn),其各自的中文名、英文名也都不相同,但其定義文字卻完全相同,這樣的兩個(gè)同義而完全異名的術(shù)語,如果不用定義查重,是不可能發(fā)現(xiàn)的。

        但術(shù)語定義查重,如果以術(shù)語定義的全部文字來做查重對(duì)象,也有其缺點(diǎn),畢竟兩個(gè)同義術(shù)語其定義文字一般情況下不可能完全相同,總會(huì)有一定的差異。那么要想用術(shù)語定義來查重就可以考慮以兩個(gè)術(shù)語定義文字的重復(fù)率為指標(biāo)進(jìn)行比較,重復(fù)率高者可以視為可能相同的術(shù)語。對(duì)同一個(gè)學(xué)科來說,本學(xué)科內(nèi)部同一上位概念下的幾個(gè)下位概念,可能由同一個(gè)作者撰寫,其術(shù)語定義可能只相差幾個(gè)字。但對(duì)不同學(xué)科來說,同一概念因作者行文風(fēng)格差異、是否有外延、公式等原因,其定義文字卻可能相差甚遠(yuǎn)。所以以兩個(gè)術(shù)語定義文字的重復(fù)率為指標(biāo)進(jìn)行比較,其結(jié)果也不一定可靠。

        既然以術(shù)語定義的全部文字來比較也不可靠,該怎么辦呢?術(shù)語定義文字很多,但其重要性卻各有不同,我們可以忽略其中次要的文字,而抓住其“關(guān)鍵詞”。除不言自明、無法定義的術(shù)語之外,任何一個(gè)術(shù)語都是由其他術(shù)語以及它們之間的關(guān)系來描述的。所以,術(shù)語定義還可以考慮用定義該術(shù)語的術(shù)語以及描述它們之間關(guān)系的術(shù)語(如果這種關(guān)系可以用術(shù)語來表示)來表示,這些術(shù)語就是術(shù)語定義中的“關(guān)鍵詞”。概念用術(shù)語來表示,大部分概念的術(shù)語名稱在術(shù)語數(shù)據(jù)庫中是唯一的,但也有一些表示相同概念但定名不唯一的術(shù)語,所以,再深入分析,就可以按照概念而不是按照術(shù)語來組織術(shù)語數(shù)據(jù)庫,把術(shù)語數(shù)據(jù)庫中各學(xué)科表示相同概念的所有不同術(shù)語名稱都給予相同的編號(hào)。在此基礎(chǔ)上,就可以把新術(shù)語的定義轉(zhuǎn)化為用定義該術(shù)語的術(shù)語所表示概念的編號(hào)的組合來代表,從而把術(shù)語定義查重轉(zhuǎn)換為概念編號(hào)的查重,就可以利用術(shù)語名稱查重的方法對(duì)概念編號(hào)進(jìn)行查重,進(jìn)而實(shí)現(xiàn)術(shù)語定義的查重。

        六建議及結(jié)語

        綜上所述,筆者建議以刪除術(shù)語名稱中的空格和符號(hào)而形成的連續(xù)文字串為對(duì)象進(jìn)行術(shù)語查重,這樣可以發(fā)現(xiàn)文字相同而空格和符號(hào)各異的術(shù)語,從而實(shí)現(xiàn)更精確的查重。對(duì)學(xué)科“內(nèi)部查重”而言,就可以在做索引之前就發(fā)現(xiàn)這些重復(fù)的術(shù)語,減少無效勞動(dòng),加快審定進(jìn)程。

        對(duì)學(xué)科“外部查重”而言,建議把已審定公布學(xué)科的術(shù)語數(shù)據(jù)庫和之前已經(jīng)做過外部查重處理的所有學(xué)科合在一起作為一個(gè)外部查重?cái)?shù)據(jù)庫,待查重的學(xué)科要與這個(gè)數(shù)據(jù)庫做外部查重。每個(gè)學(xué)科查重處理完畢,就合并到這個(gè)數(shù)據(jù)庫中,形成新的外部查重?cái)?shù)據(jù)庫,然后下一個(gè)學(xué)科才能與這個(gè)新的外部查重?cái)?shù)據(jù)庫開展查重和協(xié)調(diào)處理工作。

        這兩個(gè)建議都可以減少術(shù)語數(shù)據(jù)庫中同義異形的術(shù)語,維護(hù)術(shù)語審定工作的嚴(yán)謹(jǐn)性和權(quán)威性。

        另外,根據(jù)以上建議,尤其對(duì)目前已處于預(yù)公布階段的學(xué)科和已經(jīng)做過查重處理但尚未到預(yù)公布階段的其他學(xué)科,由于這些學(xué)科還是用術(shù)語名稱為對(duì)象做的查重,查重結(jié)果不夠精確,所以建議把這些學(xué)科的術(shù)語合在一起作為一個(gè)大學(xué)科,開展以術(shù)語名稱中的文字串為對(duì)象的內(nèi)部查重,并與已審定公布學(xué)科的術(shù)語數(shù)據(jù)庫開展以術(shù)語名稱中的文字串為對(duì)象的外部查重。

        以上是筆者對(duì)術(shù)語查重工作的淺見。對(duì)以術(shù)語名稱中的文字串為對(duì)象的查重思想也通過Microsoft Excel 2007予以實(shí)現(xiàn),并已在多個(gè)學(xué)科的內(nèi)部查重工作中得到證實(shí),可發(fā)現(xiàn)很多查重程序找不到的定名各異的同義術(shù)語。希望此文能對(duì)廣大術(shù)語工作者,尤其是多語種術(shù)語數(shù)據(jù)庫工作者有所幫助。

        參考文獻(xiàn)

        [1] 鄔江.科學(xué)技術(shù)名詞審定工作中的同義詞問題初探[J].中國(guó)科技術(shù)語,2011(6):31-33.

        猜你喜歡
        符號(hào)數(shù)據(jù)庫
        學(xué)符號(hào),比多少
        幼兒園(2021年6期)2021-07-28 07:42:14
        “+”“-”符號(hào)的由來
        數(shù)據(jù)庫
        變符號(hào)
        數(shù)據(jù)庫
        數(shù)據(jù)庫
        數(shù)據(jù)庫
        數(shù)據(jù)庫
        倍圖的全符號(hào)點(diǎn)控制數(shù)
        圖的有效符號(hào)邊控制數(shù)
        亚洲国产av自拍精选| 中文字幕av无码一区二区三区| 亚洲成在人线av| 尤物AV无码色AV无码麻豆| 精品蜜桃av免费观看| 男人的天堂av高清在线| 强行无套内谢大学生初次| 最新国产拍偷乱偷精品| 国产精品综合色区av| 亚洲一区二区三区高清在线观看| 天天碰免费上传视频| 中文字幕影片免费在线观看| 国产成人av综合色| 亚洲精品国产亚洲av| 久久精品国产亚洲av麻豆图片| 天天爽天天爽天天爽| 亚洲欧美日本人成在线观看| 精品少妇人妻av一区二区蜜桃 | 亚洲精品一区二区三区日韩 | 日韩中文字幕一区二十| 蜜桃18禁成人午夜免费网站| 日本老熟妇毛茸茸| 午夜精品一区二区三区无码不卡| 国产精品久久一区二区蜜桃| 无遮挡1000部拍拍拍免费| 亚洲av无码av日韩av网站| 久久老子午夜精品无码| 久久成人精品国产免费网站 | 亚洲一区二区三区99区| 国产熟女盗摄一区二区警花91| 国产乱码精品一区二区三区四川人| 最新国产在线精品91尤物| 日本在线一区二区三区四区| 精品无码久久久久久久久水蜜桃| 国产成人综合亚洲精品| 午夜无码片在线观看影院y| 亚洲av老熟女一区二区三区| 老太脱裤子让老头玩xxxxx| 国产成人国产在线观看| 久久婷婷国产色一区二区三区| 国产av天堂亚洲国产av天堂|