亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        術(shù)語詞典知識組織模型及輔助編纂系統(tǒng)設(shè)計

        2015-05-11 21:50:14宋培彥等
        辭書研究 2014年2期
        關(guān)鍵詞:數(shù)字出版

        宋培彥等

        摘 要 文章基于知識組織理論,提出了術(shù)語詞典知識表示的基本模型,作為術(shù)語詞典編纂系統(tǒng)的知識框架。對術(shù)語詞典輔助編纂的系統(tǒng)架構(gòu)進行設(shè)計,分解為三個核心功能模塊,將基于語料庫的術(shù)語計算、數(shù)據(jù)可視化、用戶交互模塊緊密結(jié)合,直接服務(wù)于術(shù)語詞典的編纂,提高知識生產(chǎn)效率。

        關(guān)鍵詞 術(shù)語詞典 知識組織 用戶交互 術(shù)語計算 數(shù)字出版

        一、引 言

        術(shù)語詞典是面向?qū)I(yè)領(lǐng)域提供知識服務(wù)的重要工具。然而,現(xiàn)有術(shù)語詞典的編纂還存在一些問題。例如,術(shù)語詞典的知識內(nèi)容大多較為簡略,主要提供釋義、英文翻譯等內(nèi)容,對于深層知識的組織和描述需要提高。術(shù)語詞典的編纂自動化程度偏低,不少術(shù)語詞典的編纂仍然沿用傳統(tǒng)的手工方式,術(shù)語搜集、整理、分類、排版、校對流程主要由人工完成,缺乏必要的自動化輔助工具。這些簡單重復(fù)的手工勞動極易出錯而且效率低下,導(dǎo)致術(shù)語詞典編纂滯后于科技的發(fā)展和語言事實的變化,且難以實現(xiàn)資源共享。(解海江,章黎平 2010;馮志偉 2006;趙剛 2011;張愛樸 2012)如何從知識組織的角度對術(shù)語知識進行深度描述,進而設(shè)計半自動化的術(shù)語詞典編纂系統(tǒng),是當(dāng)前術(shù)語詞典研究領(lǐng)域的重要課題,無疑具有十分重要的意義。(王惠臨,吳丹,石崇德 2006;賴茂生,屈鵬,謝靜 2009)

        從本質(zhì)上來說,術(shù)語詞典編纂是進行知識生產(chǎn)的重要環(huán)節(jié),是詞典學(xué)、術(shù)語學(xué)、圖書情報學(xué)、計算語言學(xué)等多個學(xué)科的前沿交叉領(lǐng)域。術(shù)語詞典編纂系統(tǒng)的設(shè)計首先要以知識組織為依據(jù),準(zhǔn)確揭示術(shù)語背后的各類知識,形成統(tǒng)一、規(guī)范的知識表示框架,這需要詞典學(xué)、術(shù)語學(xué)和知識組織理論的相關(guān)成果。其次,術(shù)語詞典實現(xiàn)半自動化編纂、提高知識生產(chǎn)的效率,需要積極吸收計算語言學(xué)在語料庫建設(shè)、新詞發(fā)現(xiàn)、術(shù)語計算等方面的成果。最后,術(shù)語詞典編纂帶有濃厚的知識工程特征,需要以工程管理的觀點,實現(xiàn)知識的共建共享、交互式協(xié)同與動態(tài)更新等。

        本文首先對術(shù)語的知識表示框架進行描述,突出知識組織的內(nèi)聚性和關(guān)聯(lián)性。再對術(shù)語詞典輔助編纂系統(tǒng)的功能模塊進行設(shè)計,借助知識組織科學(xué)、計算術(shù)語學(xué)、計算詞典學(xué)的成果,研究術(shù)語詞典編纂自動化的相關(guān)技術(shù),并對術(shù)語詞典編纂中的相關(guān)機制進行討論。

        二、相關(guān)研究

        知識組織 (Knowledge Organization,簡稱KO)是對人類知識進行有序化處理的過程,通過一定的描述方式揭示知識之間的邏輯關(guān)系。隨著人類知識的迅猛增長,人們吸收了圖書館學(xué)、情報學(xué)、計算機科學(xué)、知識工程學(xué)、現(xiàn)代語言學(xué)、認(rèn)知心理學(xué)等學(xué)科的成果,編制了百科全書、敘詞表、分類表、本體、術(shù)語列表等各種知識組織工具,為術(shù)語詞典的編纂提供了豐富的經(jīng)驗。在國際上,國際術(shù)語信息中心TermInfo(http:∥www.infoterm.info)、國際知識組織協(xié)會ISKO(http:∥www.isko.org)等將術(shù)語與知識組織緊密聯(lián)系,召開學(xué)術(shù)會議,使術(shù)語與知識組織的結(jié)合日益緊密。

        術(shù)語詞典編纂系統(tǒng)的設(shè)計要以知識組織為依托,形成較為規(guī)范的、半自動化的知識生產(chǎn)流程。術(shù)語詞典是提供專業(yè)知識服務(wù)的工具,需要對術(shù)語所指稱的客觀事物或知識內(nèi)容進行深度揭示。因此,術(shù)語詞典編纂要求編者不但要有語言知識,而且更重要的是要有專業(yè)知識。術(shù)語詞典注重的是術(shù)語的概念,且以語詞來表達(dá)這些概念,一般按照主題順序排序。術(shù)語的概念范疇、范疇成員之間的關(guān)系是術(shù)語詞典研究的一個重點,術(shù)語詞典編纂以術(shù)語學(xué)和詞典學(xué)為基礎(chǔ)理論,應(yīng)用知識組織、計算語言學(xué)的基本方法和技術(shù),經(jīng)過詞匯收集、術(shù)語規(guī)范、知識描述、知識鏈接等,形成人機兩用的知識資源。(Zeng Marcia Lei 2008;宋培彥 2012;傅愛平,吳杰,李蕓 2009)

        術(shù)語詞典編纂的研究在國內(nèi)外學(xué)術(shù)界得到了廣泛的關(guān)注,在理論研究和具體實踐方面取得了豐富的成果。西方國家已有大量術(shù)語詞典出版并熱銷,例如《美國國防部軍語及相關(guān)術(shù)語詞典》(U.S.Department of Defense Military Language and Related Terminology Dictionary)、《簡明牛津文學(xué)術(shù)語詞典》(The Concise Oxford Dictionary of Literary Terms)等。我國自20世紀(jì)90年代至今,已出版了《膜技術(shù)術(shù)語辭典》《涂料術(shù)語詞典》《新編美國軍事術(shù)語詞典》《英漢法律縮略語詞典》等。在此期間,還研制了一些雙語詞典輔助編纂工具,例如,商務(wù)印書館與南京大學(xué)聯(lián)合開發(fā)的“CONULEXID詞典編纂系統(tǒng)”、上海交通大學(xué)陸汝占教授等開發(fā)的“漢語詞典編纂一體化環(huán)境”、廣東外語外貿(mào)大學(xué)詞典學(xué)研究中心開發(fā)的“基于微觀數(shù)據(jù)結(jié)構(gòu)的雙語詞典生成系統(tǒng)”(簡稱DICTGenerator系統(tǒng))等,這些系統(tǒng)主要用于語文詞典的輔助編纂,一定程度上實現(xiàn)了編纂的半自動化,對于術(shù)語詞典的編纂也有較大的啟發(fā)意義。不過總體而言,術(shù)語詞典的知識組織架構(gòu)、編纂流程和相關(guān)技術(shù)有特殊之處,需要進行深入研究。(赫迎紅 2006;王際洲 2010)

        三、術(shù)語詞典知識組織結(jié)構(gòu)

        術(shù)語詞典的知識范圍較寬,具有較強的學(xué)科專業(yè)性特征。不同專業(yè)的術(shù)語詞典由于應(yīng)用領(lǐng)域、編制思路、技術(shù)手段不同,其知識描述方式也有較大的差異,歸納已經(jīng)出版的術(shù)語詞典可以發(fā)現(xiàn),術(shù)語詞典最重要的結(jié)構(gòu)元素是詞目詞及其釋義,圍繞詞目可以擴展到其他相關(guān)知識屬性。術(shù)語詞典知識組織結(jié)構(gòu)模型如圖1所示。

        本模型對術(shù)語知識進行結(jié)構(gòu)化處理。詞典由詞條構(gòu)成,詞條是詞典的基本單位。術(shù)語知識可分為五部分:詞目、同義詞、釋義、范疇和知識鏈接。下面對這些內(nèi)容分別進行介紹:

        (1)詞目。詞目的選擇必須覆蓋術(shù)語詞典的學(xué)科知識體系,選詞立目要受詞典的性質(zhì)、規(guī)模、預(yù)定的服務(wù)對象等多種因素制約,考慮收詞的均衡性和使用頻度,提供準(zhǔn)確、規(guī)范的專業(yè)術(shù)語。同時,術(shù)語詞典中的詞目具有語言學(xué)屬性,往往表現(xiàn)為詞、詞組(可以為固定搭配或自由搭配)或字符(例如:O代表氧、A72代表72號汽油)。(葉其松 2010;何瑞清 2011;亢世勇,王興隆,謝曉艷 2012)詞目是知識概念的載體,用于表示特定的專業(yè)概念。詞目一般選擇術(shù)語的規(guī)范名稱,對于部分容易引起歧義的術(shù)語可以通過注釋進行處理。為了便于使用術(shù)語,往往還需要加注外語翻譯(英語、日語、俄語、拉丁語等多個語種)。對于部分罕用的術(shù)語詞目,必要時需要注明拼音。

        (2)同義詞。同義詞是指向同一概念的多個術(shù)語的統(tǒng)稱,在術(shù)語詞典中用“亦稱”“又稱”“又名”“亦譯”“舊譯”等來標(biāo)注。一般術(shù)語詞典將縮略語也視為其同義詞。

        (3)范疇。綜合性的專業(yè)詞典中標(biāo)注該術(shù)語所屬的具體專業(yè)分類。例如,對于“層次分析法”這個術(shù)語,在運籌學(xué)、語言學(xué)中都有出現(xiàn),但意義差別很大,可以通過術(shù)語的范疇加以區(qū)分,消除歧義。

        (4)釋義。釋義是術(shù)語詞典的核心內(nèi)容之一,用于對術(shù)語知識進行深度的揭示和描述,如對其形狀、構(gòu)成、成分、特性、用途等進行詳細(xì)解釋。釋義主要是描述性的,通過下定義、舉例子、畫圖表等方式,對術(shù)語的內(nèi)涵和外延進行描述,幫助用戶了解術(shù)語的知識內(nèi)容。對于不便用語言描述的定義,可以通過圖片、表格等進行詮釋,幫助用戶掌握術(shù)語知識。

        (5)知識鏈接。在電子詞典和網(wǎng)絡(luò)詞典中,術(shù)語之間的相互鏈接更為便利,可以將具有相關(guān)性的各類知識點進行有效的關(guān)聯(lián),幫助用戶進行知識發(fā)現(xiàn)和查閱,例如圖片、圖表、公式、音頻、視頻等可以用更專業(yè)、更形象的方式進一步揭示術(shù)語知識。在網(wǎng)絡(luò)環(huán)境下,術(shù)語鏈接具有更強的動態(tài)性特征,基于語義實現(xiàn)跨領(lǐng)域、跨介質(zhì)的知識關(guān)聯(lián)。

        采用上述術(shù)語知識描述結(jié)構(gòu),可以形成人機兩用的知識資源。它將傳統(tǒng)的非結(jié)構(gòu)化的文本信息轉(zhuǎn)換為以詞條為核心的樹形結(jié)構(gòu),清晰顯示數(shù)據(jù)結(jié)構(gòu)各個部分的關(guān)系,為術(shù)語詞典的描述提供了一個相對統(tǒng)一的模型,這就為術(shù)語知識的共享和術(shù)語詞典輔助編纂系統(tǒng)的研制提供了相對穩(wěn)定的框架。例如《膜技術(shù)術(shù)語辭典》的詞條“鎳鐵蓄電池”:

        鎳鐵蓄電池 nickeliron accumulator;Edison accumulator

        又稱愛迪生蓄電池。堿性蓄電池的一種。負(fù)極為鐵,正極活性物質(zhì)為氧化高鎳,以金屬鎳為導(dǎo)電材料,30%氫氧化鉀水溶液為電解質(zhì)。電池中反應(yīng)為:

        Fe+Ni2O3+3H2OFe(OH)2+2Ni(OH)3

        工作電壓約為1.3V;實際能量密度10~20(W·h/kg)。廣泛應(yīng)用于汽車、電車和實驗室等方面和啟動、牽引動力。

        轉(zhuǎn)換為樹形結(jié)構(gòu)表示,如圖2所示。

        四、系統(tǒng)總體設(shè)計

        術(shù)語詞典輔助編纂系統(tǒng)是進行詞典編纂的技術(shù)平臺,包含了術(shù)語收集、審核發(fā)布、更新維護等傳統(tǒng)功能,實現(xiàn)無紙化的數(shù)字出版,提高術(shù)語詞典的質(zhì)量可控性。(章宜華 2004,2007;Landau 2001)借助網(wǎng)絡(luò)環(huán)境下的海量文獻資源和計算機自動處理技術(shù),實現(xiàn)術(shù)語的半自動挖掘、推薦和更新,有利于縮短詞典編纂周期、降低詞典編纂成本、減輕專家工作強度、提高術(shù)語詞典質(zhì)量。同時,采用用戶交互機制,使專家的主導(dǎo)作用與普通用戶的廣泛參與相結(jié)合,實現(xiàn)在線、實時的知識互動,將知識生產(chǎn)過程從封閉式的、少數(shù)精英模式擴展到開放的、普通大眾模式,有利于增強詞典的用戶體驗,形成良性的互動編制模式。

        系統(tǒng)以流程管理為主導(dǎo),以語料挖掘與術(shù)語計算、用戶協(xié)同與交互為支撐,主要包括詞條采集、詞條編審、詞典生成、詞典更新、語料管理、語料挖掘、工作管理、用戶協(xié)同與交互模塊等。如圖3所示。

        (1)流程管理。包括詞條采集、詞條編審、詞典生成和詞典更新四個模塊。系統(tǒng)中涉及詞條采集人員和各級編審人員、學(xué)科專家,可以根據(jù)權(quán)限進行控制。詞條采集主要是錄入詞條的所有信息,包括詞形確定、范疇、拼音、外文、釋義等,在詞條提交到一審之前,采集人員具有添加、刪除、修改詞條的權(quán)限。詞條編審包括一審、二審、三審,這三個級別是循環(huán)迭代的過程,本層次審核不合格的詞條可返回上一級修改,也可在本層自行修改,但是三審(三審人員具有專家級別)后的數(shù)據(jù)不允許任意修改,作為最終信息存入術(shù)語詞典數(shù)據(jù)庫中作為詞典腳本,經(jīng)過人工校驗合格后可自動生成術(shù)語詞典批量出版。

        (2)語料挖掘與術(shù)語計算。語料庫是以一定的標(biāo)準(zhǔn)存放真實存在的語言材料,可采用專業(yè)文獻數(shù)據(jù)庫、學(xué)術(shù)網(wǎng)站等為基礎(chǔ)制作語料庫,為術(shù)語詞典編纂提供資源。語料管理指對語料庫中的語篇文本、例證數(shù)據(jù)、聲音數(shù)據(jù)、圖形文件等進行系統(tǒng)管理,對語料文件進行導(dǎo)入、轉(zhuǎn)換、入庫、導(dǎo)出、瀏覽、查詢、編輯、備份存儲及更新等操作,由于在術(shù)語詞典數(shù)據(jù)庫中的正文均以句子為記錄單位,語料管理還可以對原始數(shù)據(jù)進行詞頻統(tǒng)計,為詞目的確立提供可量化的數(shù)據(jù)基礎(chǔ)。術(shù)語計算技術(shù)是術(shù)語詞典編纂的重要技術(shù)手段。例如,采用機器學(xué)習(xí)方法,從語料庫中自動發(fā)現(xiàn)新詞,為編纂人員推薦新的術(shù)語語詞;以可視化的手段監(jiān)測術(shù)語的流通度,通過統(tǒng)計詞頻及語詞的生命周期,推薦規(guī)范的術(shù)語語詞作為詞典立目參考,以可視化方式(縱軸為頻率,橫軸為使用生命周期)的形式顯示出術(shù)語的使用規(guī)律;利用計算同義詞模塊自動識別詞目詞的同義詞,供人工參考選取合適的同義詞。

        (3)用戶協(xié)同與交互模塊。術(shù)語詞典編纂是一項復(fù)雜的知識工程,需要眾多的專業(yè)人員參與。Web2.0技術(shù)為實現(xiàn)用戶之間的交互和協(xié)同工作提供了便利條件。用戶(專家用戶或一般用戶)可以為術(shù)語詞典補充新概念、新術(shù)語,或糾正詞典中的問題術(shù)語信息,經(jīng)由編審人員審核后及時修改。用戶協(xié)同與交互模塊為用戶提供了開放的平臺,將大眾智慧融入到詞典知識的生產(chǎn)過程中。

        五、結(jié) 語

        術(shù)語詞典編纂需要較為通用的知識組織模型,為詞典編纂系統(tǒng)的設(shè)計提供框架。進而,將知識組織研究中的用戶交互、動態(tài)更新、術(shù)語計算等理念引入到詞典編纂過程中,設(shè)計具有半自動化功能的術(shù)語詞典輔助編纂系統(tǒng)。這種設(shè)計將流程管理、術(shù)語計算、用戶交互等進行適度的融合,有助于提高術(shù)語詞典編纂的質(zhì)量和效率。將現(xiàn)有的專業(yè)文獻數(shù)據(jù)庫作為粗語料庫,方便編纂人員進行詞匯選擇、量化分析和知識抽取,提高工作效率。將詞典數(shù)據(jù)按照知識組織的語義結(jié)構(gòu)進行多維鏈接,形成多媒體表現(xiàn)形式,幫助用戶理解不同概念之間的關(guān)系,提高知識學(xué)習(xí)效率。加強術(shù)語計算、科技語料庫建設(shè)等方面的研究,形成面向術(shù)語的自動處理方法和技術(shù),是需要進一步加強研究的課題。(張東,王惠臨 2010;馮志偉 2008)

        參考文獻

        1.馮志偉. 術(shù)語學(xué)中的概念系統(tǒng)與知識本體. 術(shù)語標(biāo)準(zhǔn)化與信息技術(shù),2006(1).

        2.馮志偉. 一個新興的術(shù)語學(xué)科——計算術(shù)語學(xué). 術(shù)語標(biāo)準(zhǔn)化與信息技術(shù), 2008(4).

        3.傅愛平,吳杰,李蕓. 漢語語文詞典的詞條結(jié)構(gòu)模型. 辭書研究,2009(2).

        4.赫迎紅. 淺談大型漢英詞典的詞條和義項設(shè)立. 辭書研究,2006(2).

        5.何瑞清. 術(shù)語多元化、通俗化的限度與詞典編纂的對策——以“法人”英譯名為例. 北京:術(shù)語標(biāo)準(zhǔn)化與信息技術(shù),2011(4).

        6.亢世勇,王興隆,謝曉艷. 我國計算機輔助詞典編纂系統(tǒng)初步調(diào)查研究. 辭書研究,2012(3).

        7.賴茂生,屈鵬,謝靜. 知識組織最新研究與實踐進展. 圖書情報工作,2009(2).

        8.宋培彥. 術(shù)語知識表示模型研究. 情報理論與實踐, 2012(8).

        9.王惠臨, 吳丹, 石崇德. 語言技術(shù)和知識技術(shù)——知識服務(wù)的重要技術(shù)基礎(chǔ). 圖書情報工作,2006(9).

        10.王際洲. 專業(yè)術(shù)語詞典編輯的幾點思考——以軍事術(shù)語詞典為例. 科技信息,2010(32).

        11.解海江,章黎平.詞典編纂理念的二度轉(zhuǎn)向. 辭書研究, 2010(6).

        12.葉其松. 術(shù)語、專業(yè)詞匯與詞典. 辭書研究, 2010(2).

        13.張愛樸. 從《新編英漢語言學(xué)詞典》的編纂看專科詞典學(xué)的重要性. 辭書研究,2012(1).

        14.張東,王惠臨. 關(guān)于建立中國國家科學(xué)技術(shù)語料庫的思考. 圖書情報工作,2010(6).

        15.章宜華. 計算詞典學(xué)與新型詞典.上海:上海辭書出版社,2004.

        16.章宜華. 關(guān)于計算詞典學(xué)理論框架的探討. 辭書研究,2007(6).

        17.趙剛. 略論國內(nèi)大型漢英詞典編纂和出版中的一些問題. 編輯之友,2011(4).

        18.Landau S L.The Art and Craft of Lexicography. Oxford:Oxford University Press,2001.

        19.Zeng Marcia Lei. Knowledge Organization Systems. Knowledge Organization,2008(2—3).

        (宋培彥,李靜靜 中國科學(xué)技術(shù)信息研究所信息資源中心 北京 100038)

        (劉寧靜 上海交通大學(xué)圖書館 上海 200240)

        (暴二平 中國航天建設(shè)集團有限公司 北京 100071)

        (責(zé)任編輯 王慧敏)

        猜你喜歡
        數(shù)字出版
        數(shù)字出版授權(quán)的“結(jié)”與“解”
        出版廣角(2016年16期)2016-12-13 02:37:56
        傳承、變革與國際合作
        出版廣角(2016年16期)2016-12-13 02:30:42
        教輔出版在數(shù)字出版環(huán)境下的轉(zhuǎn)型發(fā)展
        我國傳統(tǒng)出版在數(shù)字出版沖擊下的生存與發(fā)展
        國外開放獲取平臺對我國科技期刊OA發(fā)展的啟示
        數(shù)字出版的著作權(quán)保護問題研究
        學(xué)術(shù)期刊數(shù)字出版的運行模式與市場結(jié)構(gòu)
        出版廣角(2016年15期)2016-10-18 00:24:33
        淺談新媒體在美術(shù)類圖書出版中的應(yīng)用
        今傳媒(2016年9期)2016-10-15 23:34:07
        做一個全民閱讀時代的“悅”讀人
        今傳媒(2016年9期)2016-10-15 23:11:36
        國際圖書出版市場現(xiàn)狀及趨勢分析
        今傳媒(2016年9期)2016-10-15 22:36:15
        亚洲国产精品日韩专区av| 亚洲欧美激情精品一区二区| 人人妻人人澡人人爽人人精品电影| 亚洲精品综合色区二区| 亚洲女同一区二区三区| 九九影院理论片私人影院| 伊伊人成亚洲综合人网香| 99热成人精品国产免国语的| 中文字幕久区久久中文字幕| 亚洲乱码中文字幕在线| 高潮迭起av乳颜射后入| 国产一区二区三区小说| 精品国产污黄网站在线观看| 久久无码潮喷a片无码高潮| 94久久国产乱子伦精品免费| 国产麻豆一精品一AV一免费软件| 日本精品啪啪一区二区| 精品卡一卡二乱码新区| 亚洲国产精品成人无码区| 亚洲一区二区欧美色妞影院| 国产一区二区三区18p| 久久精品国产99久久无毒不卡| 亚洲国产成人精品无码区99| 国产剧情无码中文字幕在线观看不卡视频 | 亚洲综合日韩中文字幕| 日本淫片一区二区三区| 亚洲第一最快av网站| 亚洲av之男人的天堂| 国产99久久精品一区| 日本av一区二区三区视频| 看全色黄大色大片免费久久| 春色成人在线一区av| av在线免费观看麻豆| 人妻少妇中文字幕乱码| 欧美黄色免费看| 亚洲一区二区三区最新视频| 男女18禁啪啪无遮挡激烈网站 | 天天做天天爱夜夜爽毛片毛片| 久久人人爽人人爽人人片av麻烦| 热re99久久精品国产66热6| 亚洲天堂av福利在线|