, ,,, ,
術(shù)語(yǔ)系統(tǒng)在國(guó)家信息化建設(shè)中的基礎(chǔ)性支撐作用以及在自然語(yǔ)言處理、知識(shí)圖譜、人工智能等前沿領(lǐng)域的廣泛應(yīng)用,受到了廣泛關(guān)注。國(guó)內(nèi)外非常重視領(lǐng)域術(shù)語(yǔ)系統(tǒng)的建設(shè),但由于版權(quán)、語(yǔ)種、語(yǔ)言習(xí)慣、編制目的的單一性和應(yīng)用領(lǐng)域的局限性等問(wèn)題,單部標(biāo)準(zhǔn)無(wú)法滿足多類型用戶的多樣化應(yīng)用需求。目前在領(lǐng)域術(shù)語(yǔ)系統(tǒng)的構(gòu)建中,面向具體應(yīng)用、現(xiàn)有成果的復(fù)用和集成、共建共享等方面的發(fā)展趨勢(shì)日益明顯。
然而,目前常用的詞表和本體構(gòu)建工具,如Protégé、OntoEdit、VocBench3、Term Tree2000、漢語(yǔ)主題詞表網(wǎng)絡(luò)編制平臺(tái)、軍用主題詞表應(yīng)用管理系統(tǒng)[1-6]等,多基于某種特定描述語(yǔ)言或面向特定詞表,雖然都實(shí)現(xiàn)了單一詞表或本體構(gòu)建的基礎(chǔ)功能,但詞表與本體間的快速轉(zhuǎn)換與復(fù)用、多表異構(gòu)集成、數(shù)據(jù)模型可擴(kuò)展的難度依舊很大,對(duì)不同用戶類型的工作流也缺乏靈活的控制。因此,本文在國(guó)內(nèi)外現(xiàn)有術(shù)語(yǔ)構(gòu)建工具建設(shè)經(jīng)驗(yàn)的基礎(chǔ)上,開(kāi)展了多語(yǔ)言領(lǐng)域術(shù)語(yǔ)系統(tǒng)構(gòu)建工具(Multilingual Domain Terminology System Workbench,TBench)的需求分析、功能設(shè)計(jì)和實(shí)現(xiàn),用以支持對(duì)多來(lái)源、多類型術(shù)語(yǔ)系統(tǒng)的管理與快速?gòu)?fù)用,利用集成詞表和本體的構(gòu)建模式,建立一個(gè)能夠快速融合、靈活復(fù)用與重構(gòu)的領(lǐng)域術(shù)語(yǔ)構(gòu)建工具,為團(tuán)體和個(gè)體用戶提供分布式的協(xié)同工作工具。
目前面向具體領(lǐng)域和應(yīng)用場(chǎng)景的術(shù)語(yǔ)系統(tǒng)日益增多,真正應(yīng)用到實(shí)際需求的術(shù)語(yǔ)系統(tǒng)更需持續(xù)更新與發(fā)展。由于用戶類型、構(gòu)建目的、學(xué)科領(lǐng)域的不同,用戶構(gòu)建的方式、描述框架、數(shù)據(jù)要求都不盡相同。因此如何滿足多類型的用戶構(gòu)建需求,實(shí)現(xiàn)術(shù)語(yǔ)系統(tǒng)建設(shè)中數(shù)據(jù)模型、工作流、窗口組件等的個(gè)性化定義與可擴(kuò)展,是TBench要解決的關(guān)鍵問(wèn)題。
詞表作為傳統(tǒng)的術(shù)語(yǔ)系統(tǒng)模式,語(yǔ)言規(guī)范、結(jié)構(gòu)嚴(yán)謹(jǐn)單一、顆粒度細(xì)、規(guī)模通常較大,已有一些成熟的成果可以復(fù)用。本體作為新型的知識(shí)組織系統(tǒng),可定義豐富的數(shù)據(jù)屬性和注釋屬性,支持智能推理,多為面向應(yīng)用的小型領(lǐng)域本體,易復(fù)用。另外,國(guó)家發(fā)布的方針政策、技術(shù)標(biāo)準(zhǔn)、行業(yè)規(guī)范等成果,也是可甄選、提取和再利用的成果之一。由于“零基礎(chǔ)”的人工構(gòu)建模式工程巨大、費(fèi)時(shí)費(fèi)力,因此為避免重復(fù)工作,如何實(shí)現(xiàn)這些多來(lái)源多格式的數(shù)據(jù)模型、概念、術(shù)語(yǔ)、語(yǔ)義關(guān)系成果在同一工具中的語(yǔ)義映射、靈活復(fù)用和重構(gòu),是TBench要解決的關(guān)鍵問(wèn)題。
傳統(tǒng)術(shù)語(yǔ)系統(tǒng)中多個(gè)語(yǔ)種并存時(shí),將其中一種語(yǔ)言作為源語(yǔ)言,使用源語(yǔ)言中的術(shù)語(yǔ)表達(dá)概念,其他語(yǔ)種的術(shù)語(yǔ)只能作為入口詞或?qū)傩灾嫡故?,這不利于多文化環(huán)境中的概念表達(dá)和利用。在多語(yǔ)種敘詞表中,所有語(yǔ)種地位是平等的。一般來(lái)講,特定科學(xué)領(lǐng)域的概念具有一定的穩(wěn)定性、是不分國(guó)界的,所以詞表中每個(gè)概念在每種語(yǔ)言中都應(yīng)有對(duì)應(yīng)的術(shù)語(yǔ)表達(dá)形式,這樣才能在使用任何一種語(yǔ)言表達(dá)該概念時(shí)都能夠達(dá)到相同的應(yīng)用效果。因此,如何制定多語(yǔ)言環(huán)境下的概念、術(shù)語(yǔ)、關(guān)系創(chuàng)建機(jī)制也是TBench要解決的關(guān)鍵問(wèn)題。
TBench整合了多來(lái)源、多類型的大規(guī)模資源,在新術(shù)語(yǔ)系統(tǒng)構(gòu)建的過(guò)程中,可能涉及多領(lǐng)域、多機(jī)構(gòu)、多類型的人員。因此如何針對(duì)不同類型的用戶,既要從功能、資源上進(jìn)行合理的權(quán)限控制,又要避免控制過(guò)于嚴(yán)格造成協(xié)同管理過(guò)于復(fù)雜、用戶體驗(yàn)差等問(wèn)題,是TBench要解決的關(guān)鍵問(wèn)題。
為了解決上述關(guān)鍵問(wèn)題,TBench主要借鑒“ISO 25964”構(gòu)建兼容SKOS、OWL、RDF等的數(shù)據(jù)模型,開(kāi)發(fā)支持?jǐn)?shù)據(jù)模型自定義擴(kuò)展,進(jìn)行多語(yǔ)言的概念、術(shù)語(yǔ)、關(guān)系靈活構(gòu)建和復(fù)用的輔助建設(shè)工具,為主題詞表、應(yīng)用本體等領(lǐng)域術(shù)語(yǔ)系統(tǒng)的內(nèi)容建設(shè)提供分布式協(xié)同加工工具,提高效率。
TBench的整體架構(gòu)如圖1所示。其核心業(yè)務(wù)功能模塊包括術(shù)語(yǔ)、概念、關(guān)系的數(shù)據(jù)模型定義與內(nèi)容加工,以及數(shù)據(jù)轉(zhuǎn)化、批量創(chuàng)建與復(fù)用、多語(yǔ)言機(jī)制等關(guān)鍵技術(shù),輔助工作流、用戶權(quán)限、訪問(wèn)沖突方面的協(xié)同管理與控制。
2.2.1 數(shù)據(jù)模型自定義擴(kuò)展
數(shù)據(jù)模型指術(shù)語(yǔ)系統(tǒng)內(nèi)容相關(guān)的描述與編碼數(shù)據(jù),用于詞表、術(shù)語(yǔ)、概念、關(guān)系等的定義、存儲(chǔ)與跟蹤,是支持整個(gè)術(shù)語(yǔ)系統(tǒng)應(yīng)用的基礎(chǔ)。根據(jù)國(guó)際敘詞表標(biāo)準(zhǔn),數(shù)據(jù)模型經(jīng)歷了“ISO 2788:1986”基于術(shù)語(yǔ)的數(shù)據(jù)模型、“BS8723-2:2005”基于概念的數(shù)據(jù)模型,“ISO 25964”進(jìn)一步擴(kuò)展成敘詞表、敘詞表列、概念組、概念、術(shù)語(yǔ)、注釋六大數(shù)據(jù)對(duì)象,完善了各對(duì)象的屬性特征及對(duì)象間關(guān)系,更加完備[7-8]。為滿足多類型用戶的個(gè)性化構(gòu)建需求,在借鑒“ISO 25964”數(shù)據(jù)模型的基礎(chǔ)上,TBench為所有數(shù)據(jù)對(duì)象設(shè)計(jì)了一套基礎(chǔ)的數(shù)據(jù)模型,支持按頂層概念、術(shù)語(yǔ)類型、語(yǔ)義類型分別進(jìn)行個(gè)性化定義,包括概念屬性、術(shù)語(yǔ)屬性、屬性描述、等級(jí)關(guān)系類型、語(yǔ)義關(guān)系描述與細(xì)化等方面。
如藥物類概念,術(shù)語(yǔ)類型可擴(kuò)展成商品名、通用名、化學(xué)名等,等級(jí)關(guān)系可擴(kuò)展成父子(is-a)、整部(part-of)、實(shí)例(instance-of)等,可根據(jù)概念子樹(shù)設(shè)置等級(jí)關(guān)系的類型,如“解剖學(xué)”概念樹(shù)多是part-of關(guān)系,“地理位置”多是instance-of關(guān)系。各類數(shù)據(jù)屬性可進(jìn)行自定義擴(kuò)展,如概念注釋可擴(kuò)展為范圍注釋、歷史注釋、定義等。為了改進(jìn)protégé數(shù)據(jù)屬性多個(gè)定義域和多個(gè)值域不能一對(duì)一的情況,采用術(shù)語(yǔ)系統(tǒng)的前幾級(jí)框架支持一對(duì)一、一對(duì)多或多對(duì)一定義語(yǔ)義關(guān)系的值域和定義域,以控制某類概念特有的語(yǔ)義關(guān)系類型。針對(duì)新建的術(shù)語(yǔ)系統(tǒng),可以直接采納已有的基礎(chǔ)數(shù)據(jù)模型,也可在此基礎(chǔ)上自主創(chuàng)建、配置與擴(kuò)展。針對(duì)已有的術(shù)語(yǔ)系統(tǒng)已存在較為完備的結(jié)構(gòu),可通過(guò)導(dǎo)入表結(jié)構(gòu)描述或術(shù)語(yǔ)數(shù)據(jù)的規(guī)范文件自動(dòng)解析生成數(shù)據(jù)模型,也可進(jìn)一步擴(kuò)展與優(yōu)化。
圖1 多語(yǔ)言領(lǐng)域術(shù)語(yǔ)系統(tǒng)構(gòu)建工具架構(gòu)
2.2.2 概念靈活復(fù)用與批量構(gòu)建
2.2.2.1 規(guī)范文本批量創(chuàng)建
概念是思想的單元,是構(gòu)成領(lǐng)域術(shù)語(yǔ)系統(tǒng)的核心要素。概念內(nèi)容加工是領(lǐng)域術(shù)語(yǔ)系統(tǒng)建設(shè)的核心過(guò)程,是建立科學(xué)、全面的術(shù)語(yǔ)系統(tǒng)的關(guān)鍵步驟。為避免大規(guī)模術(shù)語(yǔ)系統(tǒng)零基礎(chǔ)、人工構(gòu)建的弊端,TBench除支持零基礎(chǔ)新建概念外,在工作流中集中融入了概念靈活復(fù)用的思想,建立了由規(guī)范文本轉(zhuǎn)換為概念等級(jí)結(jié)構(gòu)、子概念、非優(yōu)選詞、語(yǔ)義關(guān)系的批量創(chuàng)建機(jī)制(圖2)。如圖2所示,規(guī)范文本中,換行表示多條記錄,通過(guò)TAB鍵控制概念間的等級(jí)關(guān)系;同一行中以豎線“|”分開(kāi)的多個(gè)術(shù)語(yǔ)表示一個(gè)概念,首個(gè)術(shù)語(yǔ)作為優(yōu)選詞,其他術(shù)語(yǔ)作為非優(yōu)選詞。轉(zhuǎn)換后自動(dòng)生成概念等級(jí)關(guān)系,如概念“丙戊酸鎂”含有一個(gè)非優(yōu)選術(shù)語(yǔ)“癲心寧”。
圖2 規(guī)范文本批量創(chuàng)建示例
2.2.2.2 表內(nèi)概念樹(shù)復(fù)制或位置調(diào)整
概念樹(shù)結(jié)構(gòu)主要指概念間等級(jí)關(guān)系與同位關(guān)系呈現(xiàn)的樹(shù)結(jié)構(gòu)位置信息。為提高內(nèi)容建設(shè)效率,TBench提供多種方式實(shí)現(xiàn)了概念樹(shù)復(fù)制與位置調(diào)整,進(jìn)行計(jì)算機(jī)的輔助構(gòu)建。一是子樹(shù)復(fù)制與刪除。術(shù)語(yǔ)系統(tǒng)面向計(jì)算機(jī)使用,為從多個(gè)維度充分揭示概念內(nèi)涵的不同方面,需與多個(gè)上位概念建立多重屬分關(guān)系(Polyhierarchical relationships)。為了降低重復(fù)構(gòu)建概念或子樹(shù)的難度,工具提供某一類概念或概念子樹(shù)的復(fù)制與粘貼的快捷操作,在概念屬性窗口定義多個(gè)上位概念等多種方式,實(shí)現(xiàn)多個(gè)位置下子樹(shù)的批量創(chuàng)建。如“病毒性疾病”的子概念“病毒性肝炎”,從其發(fā)病部位角度又可歸至“肝疾病”,即可通過(guò)復(fù)制概念“病毒性肝炎”子樹(shù)至“肝疾病”下,也可在“病毒性肝炎”屬性窗口新增“肝疾病”上位概念,實(shí)現(xiàn)“肝疾病”下“病毒性肝炎”子樹(shù)的創(chuàng)建。二是位置調(diào)整。在術(shù)語(yǔ)系統(tǒng)建設(shè)中,等級(jí)樹(shù)結(jié)構(gòu)中的位置調(diào)整是較常用的一個(gè)核心操作。為增加工具操作的靈活性、簡(jiǎn)化復(fù)雜的調(diào)整操作,TBench支持概念相對(duì)位置信息的自由拖動(dòng)。與子樹(shù)復(fù)制不同的是,位置調(diào)整涉及到is-a關(guān)系、樹(shù)結(jié)構(gòu)號(hào)的刪除與重建。
2.2.2.3 異構(gòu)成果表間復(fù)用構(gòu)建
零基礎(chǔ)構(gòu)建一部大規(guī)模的術(shù)語(yǔ)系統(tǒng),工程巨大、耗時(shí)耗力,復(fù)用國(guó)內(nèi)外已有的豐富術(shù)語(yǔ)成果,是共建共享的發(fā)展要求。TBench遵循在建術(shù)語(yǔ)系統(tǒng)的規(guī)范,可靈活復(fù)用異構(gòu)成果快速構(gòu)建,即在創(chuàng)建概念或等級(jí)樹(shù)結(jié)構(gòu)時(shí),將已有成果的單個(gè)概念、多個(gè)概念或其子樹(shù),通過(guò)數(shù)據(jù)復(fù)用、表間子樹(shù)復(fù)制等方式融合到正在構(gòu)建的術(shù)語(yǔ)系統(tǒng)中(圖3)。但這些已有的權(quán)威標(biāo)準(zhǔn)、科學(xué)名詞、行業(yè)規(guī)范,分別有word、pdf、txt、xml、owl等多種格式,結(jié)構(gòu)上也和常規(guī)的術(shù)語(yǔ)系統(tǒng)不同。TBench可經(jīng)過(guò)外部數(shù)據(jù)導(dǎo)入、結(jié)構(gòu)自動(dòng)解析、數(shù)據(jù)模型映射、質(zhì)量邏輯校驗(yàn)等重構(gòu)操作后,實(shí)現(xiàn)異構(gòu)數(shù)據(jù)的規(guī)范化,即可在工具中實(shí)現(xiàn)表間內(nèi)容的復(fù)用。通過(guò)表間復(fù)用批量創(chuàng)建概念時(shí),將繼承來(lái)源表的非優(yōu)選詞、定義、注釋及關(guān)系等信息,并自動(dòng)生成在建詞表與已有詞表概念間的等同映射關(guān)系。
圖3 異構(gòu)成果結(jié)構(gòu)映射與復(fù)用示例
2.2.3 關(guān)系批量創(chuàng)建與融合
關(guān)系實(shí)例建立在概念與概念間的語(yǔ)義關(guān)系對(duì)上,包括等級(jí)及其他語(yǔ)義關(guān)系類型,是描述現(xiàn)實(shí)世界的計(jì)算機(jī)表示方式,關(guān)系實(shí)例的規(guī)模是對(duì)語(yǔ)義關(guān)系豐富程度的具體體現(xiàn)。逐個(gè)創(chuàng)建關(guān)系實(shí)例較為繁瑣,TBench建立了批量創(chuàng)建與融合的工作機(jī)制,降低了操作難度。一是批量創(chuàng)建具有共同特征的語(yǔ)義關(guān)系。其中同一個(gè)概念可能與多個(gè)其他概念存在相同的語(yǔ)義關(guān)系,選擇多個(gè)概念作為值域批量可以創(chuàng)建同一類關(guān)系的實(shí)例。如藥物“氯沙坦鉀”可能治療多種疾病,所以“氯沙坦鉀”存在多條值域不同的“治療”關(guān)系,可為其“治療”關(guān)系選擇“2型糖尿病”“高血壓”“腎病”“卒中”4個(gè)值域,一次性創(chuàng)建“氯沙坦鉀 治療 2型糖尿病”“氯沙坦鉀 治療 高血壓”“氯沙坦鉀 治療 腎病”“氯沙坦鉀 治療 卒中”4條關(guān)系記錄。二是融合已有成果的關(guān)系實(shí)例?;诒黹g復(fù)用創(chuàng)建概念時(shí),可通過(guò)數(shù)據(jù)模型的映射結(jié)果繼承與融合已有成果的關(guān)系實(shí)例,輔助進(jìn)行等級(jí)關(guān)系鏈、關(guān)系值域與定義域是否完整等邏輯性檢測(cè)。如由于關(guān)系的定義域和值域均在樹(shù)結(jié)構(gòu)中嚴(yán)格控制了概念范圍,所以在定義了“藥物 <治療> 疾病”后,只有藥物及其下位概念可以定義“治療”關(guān)系,其他如檢查類概念就不能創(chuàng)建該關(guān)系。
2.2.4 多語(yǔ)言機(jī)制
為解決多語(yǔ)種并存的問(wèn)題,TBench不像傳統(tǒng)構(gòu)建工具對(duì)概念的優(yōu)選詞或非優(yōu)選詞進(jìn)行一對(duì)一的翻譯,而是按語(yǔ)種創(chuàng)建概念、關(guān)系及其屬性,基礎(chǔ)數(shù)據(jù)模型對(duì)概念、術(shù)語(yǔ)、關(guān)系及其他屬性均賦予了“語(yǔ)種”特征,以此聲明其合理存在的語(yǔ)言范圍。不同語(yǔ)種里都可設(shè)置一個(gè)優(yōu)選詞,通過(guò)建立多個(gè)優(yōu)選詞間的映射關(guān)系,揭示不同語(yǔ)言內(nèi)的概念內(nèi)涵差異。同一概念不同語(yǔ)種的優(yōu)選詞,在語(yǔ)義和文化方面具有完全相同的內(nèi)涵,能夠建立跨語(yǔ)言的精確等同映射關(guān)系。
多數(shù)情況下,由于文化、內(nèi)涵或價(jià)值的差異,不同語(yǔ)種間的術(shù)語(yǔ)表達(dá)的內(nèi)涵都會(huì)存在細(xì)微的差異,可能存在“近義等同”“部分等同”“包含”等情況。如“aircraft ”在不同語(yǔ)境中有“飛機(jī)”“航空器”之義,涵蓋了直升飛機(jī)、飛艇、滑翔機(jī)等,不能簡(jiǎn)單地與中文術(shù)語(yǔ)“飛機(jī)”直接對(duì)應(yīng)。因此,多語(yǔ)言環(huán)境下以概念為中心的屬性設(shè)置、優(yōu)選詞并存與關(guān)系處理,都有助于揭示多語(yǔ)言環(huán)境下的文化內(nèi)涵及差異。
2.2.5 協(xié)同控制
為了實(shí)現(xiàn)多用戶的分布式加工,打造極簡(jiǎn)、隨需應(yīng)變的業(yè)務(wù)工作流,TBench從訪問(wèn)沖突、邏輯性、質(zhì)量等方面進(jìn)行了實(shí)時(shí)監(jiān)測(cè)與控制,也從用戶、角色和權(quán)限等角度實(shí)現(xiàn)了協(xié)同管理。工具整合了多來(lái)源多類型的大規(guī)模資源,在新術(shù)語(yǔ)系統(tǒng)構(gòu)建的過(guò)程中可能涉及多種工作流需求的人員。
為實(shí)現(xiàn)不同類型人員的靈活管理,工具賦予用戶角色,從可訪問(wèn)的功能模塊、功能點(diǎn)、標(biāo)簽文字及可利用的術(shù)語(yǔ)系統(tǒng)資源(如某部詞表、某個(gè)子樹(shù)或范疇)等方面進(jìn)行權(quán)限的控制與管理,如用戶可以使用自然語(yǔ)言重新定義界面呈現(xiàn)的標(biāo)簽。通過(guò)多方面的靈活配置與分類控制,便于各層次用戶的術(shù)語(yǔ)系統(tǒng)共享、協(xié)同構(gòu)建與管理。
TBench的開(kāi)發(fā)平臺(tái)為Eclipse neon,JDK版本為1.8.0,應(yīng)用服務(wù)器為Tomcat 8.5。TBench自下向上分為數(shù)據(jù)層、功能層、界面層。在數(shù)據(jù)層,使用關(guān)系數(shù)據(jù)庫(kù)Oracle保存臨床醫(yī)學(xué)術(shù)語(yǔ)數(shù)據(jù)以及系統(tǒng)數(shù)據(jù),使用全文數(shù)據(jù)庫(kù)Elasticsearch保存臨床醫(yī)學(xué)術(shù)語(yǔ)的索引數(shù)據(jù),然后通過(guò)JDBC、Mybatis以及Elasticsearch提供的應(yīng)用程序接口與功能層進(jìn)行數(shù)據(jù)交互;在功能層,采用Spring MVC作為框架,運(yùn)用Java編程語(yǔ)言實(shí)現(xiàn)各個(gè)業(yè)務(wù)模塊,與用戶層通過(guò)Restful風(fēng)格的應(yīng)用程序接口進(jìn)行數(shù)據(jù)交換;在用戶層,采用HTML5、CSS、ReactJS、Ant Design等前端技術(shù)構(gòu)建與用戶交互的Web用戶界面,并通過(guò)AJAX技術(shù)調(diào)用功能層的Restful應(yīng)用程序接口,完成各種工作流。
目前TBench已基本完成了核心功能的開(kāi)發(fā),實(shí)現(xiàn)了已有術(shù)語(yǔ)系統(tǒng)的信息注冊(cè)、數(shù)據(jù)入庫(kù)、格式轉(zhuǎn)換、結(jié)構(gòu)解析與映射,新術(shù)語(yǔ)系統(tǒng)的創(chuàng)建、數(shù)據(jù)模型自定義、內(nèi)容的批量創(chuàng)建與表間復(fù)用、多種格式存儲(chǔ)等。主要功能及界面如圖4所示。TBench借鑒“ISO 25964數(shù)據(jù)模型”進(jìn)行自定義擴(kuò)展,與SKOS、RDF、OWL等語(yǔ)義描述模型能很好地兼容[9-10]。支持語(yǔ)義描述模型間、不同格式間(如TXT,JSON,XML,RDB)的數(shù)據(jù)轉(zhuǎn)換工具正在開(kāi)發(fā)中。
目前TBench已用于中文臨床醫(yī)學(xué)術(shù)語(yǔ)系統(tǒng)(Chinese Clinical Terminology System,CSCT)的構(gòu)建。CSCT基于TBench 完成了數(shù)據(jù)模型定義,自定義擴(kuò)展語(yǔ)義關(guān)系65個(gè),在14個(gè)頂層維度下初步組織了約75 300個(gè)概念、15萬(wàn)余條醫(yī)學(xué)術(shù)語(yǔ)。TBench根據(jù)不同用戶類型制定了清晰的工作流,整個(gè)構(gòu)建過(guò)程中貫穿復(fù)用和整合的理念,解決了多用戶個(gè)性化需求、異構(gòu)術(shù)語(yǔ)復(fù)用、多語(yǔ)言環(huán)境、協(xié)同管理等問(wèn)題,提高了術(shù)語(yǔ)系統(tǒng)建設(shè)的靈活性和效率。
圖4 多語(yǔ)言領(lǐng)域術(shù)語(yǔ)系統(tǒng)構(gòu)建工具核心界面
在智能技術(shù)和資源趨向共建共享的快速發(fā)展趨勢(shì)下,多語(yǔ)言領(lǐng)域術(shù)語(yǔ)系統(tǒng)構(gòu)建工具TBench是新技術(shù)環(huán)境下對(duì)領(lǐng)域術(shù)語(yǔ)系統(tǒng)靈活、快速構(gòu)建的一種新探索。TBench基于“ISO 25964”的數(shù)據(jù)模型自定義擴(kuò)展解決了多用戶的個(gè)性化構(gòu)建需求,通過(guò)概念與關(guān)系的復(fù)用、繼承與批量創(chuàng)建等方法提高了工作流的靈活性和效率,并支持建立以概念為中心的多語(yǔ)種術(shù)語(yǔ)系統(tǒng)。但TBench仍存在改進(jìn)空間,如復(fù)用多部成果時(shí)的語(yǔ)義關(guān)系融合與沖突控制、面向電子病歷等的新詞發(fā)現(xiàn)與補(bǔ)充。下一步我們將繼續(xù)探索與優(yōu)化,使工具更加高效和人性化。
中華醫(yī)學(xué)圖書(shū)情報(bào)雜志2018年9期