亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        漢彝雙語應(yīng)急語言資源智能查詢平臺的構(gòu)建與技術(shù)實現(xiàn)

        2022-01-15 07:54:08馬瑞祾王成平沙馬拉毅
        關(guān)鍵詞:資源庫語料雙語

        馬瑞祾,王成平,沙馬拉毅

        (1.西南民族大學(xué)中國語言文學(xué)學(xué)院,四川 成都 610041;2.西南民族大學(xué)民族語言文字信息處理重點實驗室,四川 成都 610041)

        突發(fā)公共事件的預(yù)防和處置是國家治理體系和治理能力現(xiàn)代化的重要標(biāo)志.語言在應(yīng)急和減災(zāi)中發(fā)揮著不容忽視的作用:第一,語言是信息傳遞的重要載體,信息是應(yīng)急決策和抗災(zāi)施救的必需基礎(chǔ)和核心要素[2].第二,語言是應(yīng)急必需的社會資源,防治災(zāi)害的各階段、各環(huán)節(jié)都離不開對語言資源的合理配置.第三,語言是處置災(zāi)害的特殊戰(zhàn)力,應(yīng)急語言服務(wù)及產(chǎn)品的有效供給能為災(zāi)害處置、安全維護和社會治理助力添翼[3].災(zāi)害的防治規(guī)劃、監(jiān)測預(yù)警、應(yīng)急救援、恢復(fù)重建均需要高效率和高質(zhì)量的應(yīng)急語言服務(wù)撐持.國家、團體、個人在應(yīng)對和處置公共突發(fā)事件時應(yīng)積極樹立“語言減災(zāi)”的觀念[4-8].

        和諧穩(wěn)定的社會生活有助于促進各民族的交往交流交融,增強各族人民的凝聚力、向心力,鑄牢中華民族共同體意識.中國少數(shù)民族聚居的西部地區(qū)往往呈現(xiàn)出地形特征復(fù)雜、災(zāi)害疾病頻發(fā)、公共設(shè)施薄弱、語言類型多樣的特點.在多次突發(fā)公共事件的處置過程中,各民族的語言差異和信息屏障是造成應(yīng)急救援困難的重要因素.為打破現(xiàn)實窘境,除了堅定不移地在民族地區(qū)深化普及國家通用語言文字外,還應(yīng)為民族同胞提供符合其語言能力和需求的應(yīng)急語言服務(wù).

        在國家2021年頒布的“十四五”規(guī)劃中明確指出:“強化數(shù)字技術(shù)在公共衛(wèi)生、自然災(zāi)害、事故災(zāi)難、社會安全等突發(fā)公共事件應(yīng)對中的運用,全面提升預(yù)警和應(yīng)急處置能力”[1].隨著現(xiàn)代信息技術(shù)的不斷發(fā)展和對人類社會的持續(xù)賦能,探索語言技術(shù)在民族地區(qū)應(yīng)急管理實踐中的應(yīng)用路徑和實施方案具有重要意義.通過構(gòu)建漢彝雙語應(yīng)急語言資源智能查詢平臺能為以涼山州為代表的民族地區(qū)在應(yīng)對各類災(zāi)害時的醫(yī)患溝通、信息檢索、智能翻譯等提供語言技術(shù)和資源的支持,助推民族地區(qū)提升應(yīng)對和處置突發(fā)公共事件的現(xiàn)代化能力和水平.

        1 漢彝雙語應(yīng)急語言資源智能查詢平臺的構(gòu)建思路

        1.1 需求分析

        用戶需求分析能明晰平臺的搭建目的、服務(wù)內(nèi)容和主體功能.漢彝雙語應(yīng)急語言資源智能查詢平臺是為滿足不同應(yīng)急主體在處置突發(fā)公共事件時產(chǎn)生的雙語資源需求.根據(jù)突發(fā)事件的不同階段具體需求如下:

        第一,“備急”需求:為制定應(yīng)急語言規(guī)劃與政策提供參考,特別是為研制《簡明漢語(彝語版)》提供語料參考.助力地方政府、學(xué)校開展雙語防災(zāi)知識教育,普及和推廣國家通用語言文字,規(guī)范公共空間語言景觀(應(yīng)急標(biāo)識)的語言文字使用.擴容現(xiàn)有雙語資源庫的語料數(shù)據(jù)規(guī)模,推動彝語言文字信息處理走向精細化、專業(yè)化.

        第二,“應(yīng)急”需求:滿足地方政府編制應(yīng)急手冊、視頻、橫幅、掛圖等應(yīng)急產(chǎn)品的翻譯需求;為地方的雙語媒體報道、語言輿情監(jiān)測提供語料支撐;解決漢、彝語際溝通障礙造成的醫(yī)患會話問題;為災(zāi)害處置和救援提供一批召之即來、素質(zhì)過硬的雙語志愿者.

        第三,“善后”需求:為災(zāi)后開展心理診療咨詢、語言康復(fù)訓(xùn)練、救援物資輸送等環(huán)節(jié)中的雙語翻譯提供技術(shù)輔助.

        1.2 技術(shù)路線

        為滿足多元的應(yīng)急語言服務(wù)需求,需研發(fā)一個具有信息檢索、結(jié)果可視化、數(shù)據(jù)下載、智能翻譯、動態(tài)管理多功能為一體的智能查詢平臺,并依托Web網(wǎng)絡(luò)服務(wù)端實現(xiàn)應(yīng)急語言服務(wù)資源的發(fā)布、檢索、管理,提高應(yīng)急語言資源的共享性和使用率.

        查詢平臺的構(gòu)建分為七個主要步驟:第一,確定應(yīng)急語言資源庫所需的語言數(shù)據(jù)類型、規(guī)模和獲取渠道.第二,從多源異構(gòu)數(shù)據(jù)中獲取所需的語言資源.第三,通過數(shù)據(jù)清洗、文本聚類、數(shù)據(jù)挖掘等方式獲取各類應(yīng)急領(lǐng)域、應(yīng)急事件的詞語、句子、語篇、標(biāo)識等漢語資源數(shù)據(jù).第四,將獲取的漢語數(shù)據(jù)對照翻譯為彝語,得到彝語數(shù)據(jù),并將二者存儲到MySQL數(shù)據(jù)庫中.第五,基于本體建模的方式將資源庫中的詞匯術(shù)語數(shù)據(jù)生成動態(tài)知識圖譜,存儲到Neo4j數(shù)據(jù)庫中.第六,基于MySQL和Neo4j兩個數(shù)據(jù)庫中的語言資源構(gòu)建智能查詢平臺.第七,將智能平臺的不同功能應(yīng)用于處置突發(fā)公共事件的各類場景中.平臺構(gòu)建的技術(shù)路線見圖1.

        圖1 智能查詢平臺構(gòu)建的技術(shù)路線Fig.1 The technical route of the intelligent query platform construction

        2 漢彝雙語應(yīng)急語言資源庫的設(shè)計與構(gòu)建

        2.1 資源庫概念結(jié)構(gòu)設(shè)計

        實現(xiàn)智能化查詢需依靠大規(guī)模、高質(zhì)量、廣領(lǐng)域的語言資源和語言數(shù)據(jù).由此,構(gòu)建應(yīng)急語言資源庫是先導(dǎo)性、基礎(chǔ)性的工作.漢彝雙語應(yīng)急語言資源庫的設(shè)計遵循概念單一化原則[9].為提升不同語言資源應(yīng)用的針對性和管理維護工作的便捷性,在設(shè)計資源庫時根據(jù)用戶需求和數(shù)據(jù)類型將不同語言資源分置于五個不同子庫中,即“詞匯術(shù)語庫”“診療語句庫”“政務(wù)語篇庫”“應(yīng)急標(biāo)識庫”“雙語志愿者服務(wù)團庫”.

        ER模型是最為通用的“實體關(guān)系”概念模型,運用ER圖(實體關(guān)系圖)展示資源庫與5個子庫(實體)間的聯(lián)系,以及各子庫包含的不同鍵值屬性.通過建立資源庫的整體概念結(jié)構(gòu)模型,完成資源庫結(jié)構(gòu)關(guān)系的抽象,模型結(jié)構(gòu)如圖2所示.

        圖2 漢彝雙語資源庫組織結(jié)構(gòu)ER圖Fig.2 ER diagram of the organization structure of the Chinese-Yi bilingual resource database

        2.2 資源庫數(shù)據(jù)表結(jié)構(gòu)設(shè)計

        MySQL相較于大型數(shù)據(jù)庫管理系統(tǒng),雖數(shù)據(jù)存儲規(guī)模有限,但又具有運行速度快、可移植性強、易于學(xué)習(xí)、接口豐富、共享性高等優(yōu)勢.另外,MySQL不僅提供了多種編程語言的API,且其網(wǎng)絡(luò)化的特點大大提高了數(shù)據(jù)在因特網(wǎng)中的共享效率.因此,該資源庫的搭建采用MySQL的數(shù)據(jù)關(guān)系管理系統(tǒng).

        數(shù)據(jù)表(Table)是數(shù)據(jù)庫的基礎(chǔ)和核心.數(shù)據(jù)庫表是系列二位數(shù)組的集合,是存儲數(shù)據(jù)和操作數(shù)據(jù)的邏輯結(jié)構(gòu);表通常由表結(jié)構(gòu)和表內(nèi)容(記錄)兩個部分組成,建立存儲數(shù)據(jù)的基本表結(jié)構(gòu)是實現(xiàn)應(yīng)急漢彝雙語資源的數(shù)據(jù)庫化的最終環(huán)節(jié).首先,根據(jù)“一事一地”的原則確定該資源庫中共含7張數(shù)據(jù)表,即不同表描述不同實體(詞匯、句子、語篇、標(biāo)識、志愿者),且表內(nèi)只包含與該主題相關(guān)的信息,不包含重復(fù)信息.其次,根據(jù)概念設(shè)計確定各表中的相應(yīng)字段.最后,選定主鍵和外鍵字段,建立表與表間的關(guān)系.本庫不同語料要素的數(shù)據(jù)類型如表1所示.

        表1 資源庫語料要素數(shù)據(jù)表結(jié)構(gòu)Table 1 Table structure of the corpus elements of the resource database

        2.3 數(shù)據(jù)庫構(gòu)建的關(guān)鍵技術(shù)

        2.3.1 漢語數(shù)據(jù)獲取

        應(yīng)急領(lǐng)域資源庫的數(shù)據(jù)源十分多樣,呈現(xiàn)出復(fù)雜的多源異構(gòu)特征.主要包括以下三類:應(yīng)急領(lǐng)域的已有數(shù)據(jù)庫等結(jié)構(gòu)化數(shù)據(jù),應(yīng)急管理部門官方網(wǎng)站中發(fā)布的文件信息等半結(jié)構(gòu)化數(shù)據(jù),以及《抗擊疫情湖北方言通》《疫情防控外語通》等相關(guān)專業(yè)書籍、手冊等文本類非結(jié)構(gòu)化數(shù)據(jù).首先,通過Python語言對應(yīng)急管理部、國家減災(zāi)委辦公室、涼山州衛(wèi)健委等政府部門的官方網(wǎng)站公開發(fā)布的信息(標(biāo)題和正文)進行批量爬取,再將爬取的半結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換為文本(txt.)格式.其次,通過文字識別的方式將文獻、書籍、讀物中的文字轉(zhuǎn)換為文本信息,共獲取各類語料來源文本2 833篇,含1 678 228字符.最后,將其存儲到生語料庫中,作為構(gòu)建資源庫的數(shù)據(jù)源.

        2.3.2 數(shù)據(jù)清洗

        對獲取的生語料進行預(yù)處理:第一,運用Editplus工具對文本進行降噪(Emeditor),刪除回車和空格.第二,使用Jieba分詞軟件對文本進行詞語切分,對分詞結(jié)果進行人工校對.將機構(gòu)名稱、專業(yè)術(shù)語處理為一個分詞單位,如“發(fā)熱門診”“傳染病”“傳染源”等.第三,在分詞過程中會出現(xiàn)部分質(zhì)量低、不準(zhǔn)確、不完整的噪聲數(shù)據(jù),需要剔除數(shù)據(jù)集中的殘缺、重復(fù)、無用、冗余、錯誤數(shù)據(jù)以及停用詞.

        2.3.3 文本聚類

        文本聚類是將數(shù)據(jù)集中主題相同或相似的文本分為若干個不相交的子集,各子集是一個簇(cluster).調(diào)用CountVectorizer()函數(shù)對清洗后的數(shù)據(jù)進行特征提取,生成詞頻矩陣X,計算出詞匯的TFIDF值,公式如下:

        TF-IDF(X)=TF(X)*IDF(X). (1)

        公式(1)中,TF(X)指詞X在當(dāng)前文本中的詞頻,IDF(X)表示詞X的逆文檔率.應(yīng)用K-means聚類方法對文本進行主題聚類,在聚類參數(shù)上參考文獻提出的分類標(biāo)準(zhǔn)[10],首先劃分自然災(zāi)害和人為災(zāi)害兩大災(zāi)害領(lǐng)域,根據(jù)不同致災(zāi)因子將自然災(zāi)害細分地質(zhì)、海洋、生物等5種災(zāi)害類型;再根據(jù)不同災(zāi)害源將人為災(zāi)害細分為生態(tài)環(huán)境災(zāi)害、公共衛(wèi)生事件等4種災(zāi)害類型,故將聚類簇數(shù)n_clusters設(shè)為9.最后,對文本進行降維處理,繪制可視化的聚類圖形[11].

        2.3.4 漢語數(shù)據(jù)入庫

        第一,“詞匯術(shù)語庫”的數(shù)據(jù)處理:基于文本聚類結(jié)果,分類統(tǒng)計出各應(yīng)急事件詞語的詞頻和詞次,將各災(zāi)類中的前100個高頻詞導(dǎo)入excel表格,并人工篩選出各災(zāi)類中的通用詞.如“公共衛(wèi)生事件”中“病史、處方、病例”等均為該災(zāi)類的通用詞.根據(jù)分類疊合和詞頻計算,統(tǒng)計出自然、人為災(zāi)害均可通用的詞匯.最后,將語料按類分裝于應(yīng)急通用詞表、自然災(zāi)害詞表、人為災(zāi)害詞表3個數(shù)據(jù)表中,共計收錄2 000條應(yīng)急詞匯術(shù)語.不同詞表中的詞條數(shù)目情況如表2所示.每個詞條均由普通話水平等級為一乙的發(fā)音人錄制音頻文件.

        表2 應(yīng)急詞匯術(shù)語庫中的詞條分布情況統(tǒng)計Table 2 Distribution of entries in the Emergency Vocabulary Database

        第二,“診療語句庫”的數(shù)據(jù)處理:確定醫(yī)患溝通常用話題,如“病情描述”“處方建議”“病情診斷”等,再以《抗擊疫情湖北方言通》和《疫情防控外語通》中的語句為參照,從數(shù)據(jù)集中統(tǒng)計出200句高頻醫(yī)患診療會話語句.語句盡量涵蓋各類常用的醫(yī)患交際話題.

        第三,“政務(wù)語篇庫”的數(shù)據(jù)處理:首先,根據(jù)不同主體部門和語篇主題將文本分為“通知公告類”“新聞報道”“健康須知”“知識科普”四類,分類遴選出典型的政務(wù)語篇文本.對語篇進行文本簡化,簡化標(biāo)準(zhǔn)參照《疫情防控“簡明漢語”》中的標(biāo)準(zhǔn)和實例,結(jié)合《新HSK大綱詞匯(1-6級)》,建立“簡化詞表”和“語句簡化規(guī)則”.對照詞表和規(guī)則對語篇中的專業(yè)術(shù)語和繁難句子進行人工標(biāo)注和降級處理.過程中調(diào)用同義詞在線檢索平臺和電子詞典進行詞語的等義替換.

        第四,“應(yīng)急標(biāo)識庫”的數(shù)據(jù)處理:從國家應(yīng)急廣播網(wǎng)中下載應(yīng)急標(biāo)識104個,包括“氣象預(yù)警”44個、“求救信號”7個、“應(yīng)急避難場所標(biāo)識”16個、“警示標(biāo)識”22個和“指令標(biāo)識”15個,將標(biāo)識的圖片和內(nèi)容儲存到標(biāo)識庫中.

        第五,“雙語志愿者庫”的數(shù)據(jù)處理:依托高校和地方相關(guān)窗口部門、公益組織招募漢彝雙語志愿者325名,對志愿者信息(姓名、民族、專業(yè)等)進行統(tǒng)計和入庫.

        2.3.5 彝語語料翻譯

        彝語語料采用Unicode進行統(tǒng)一編碼與處理,使資源庫更具平臺和應(yīng)用程序的兼容性和共享性.Unicode突破了傳統(tǒng)的字符編碼方案的局限,對不同語言的不同字符均設(shè)有統(tǒng)一且唯一的二進制編碼,較好地實現(xiàn)了跨語言、跨平臺的文本信息處理.語料標(biāo)注采用JSON這種輕量級的數(shù)據(jù)交換格式.

        由于在現(xiàn)有的漢彝雙語資源庫中收錄的應(yīng)急領(lǐng)域的數(shù)據(jù)相對匱乏,難以實現(xiàn)機器自動翻譯.因此,語料的對照翻譯工作由彝語言和彝藥專業(yè)的研究生按照彝語新詞術(shù)語規(guī)范進行人工標(biāo)注,再請相關(guān)專業(yè)的專家教授進行校審.對部分彝語中尚無對應(yīng)詞語的術(shù)語采用“暫時空缺”或“新造詞語”的方式進行翻譯.每條彝語詞匯都配有母語者錄制的規(guī)范彝語音頻文件.最后,將標(biāo)注好的語料導(dǎo)入數(shù)據(jù)庫中,再交由相關(guān)專業(yè)領(lǐng)域的專家進行最終校審.

        3 基于知識圖譜的漢彝雙語應(yīng)急詞匯術(shù)語可視化

        3.1 知識圖譜概說

        知識圖譜(Knowledge Graphs)于2012年由Google提出,隨著人工智能技術(shù)的發(fā)展,知識圖譜以其強大的語義處理和互聯(lián)組織能力,廣泛應(yīng)用于搜索引擎、智能問答、個性化推薦等領(lǐng)域.知識圖譜的特點是結(jié)構(gòu)化,通常采取符號化(SPO三元組,S:頭實體,P:關(guān)系,O:尾實體)的知識表示方式,并以有向圖的形式進行呈現(xiàn)和存儲.因此,知識圖譜具有語義豐富、結(jié)構(gòu)友好、易于理解等優(yōu)點.為更好地存儲和利用結(jié)構(gòu)知識,人類分別構(gòu)建了面向開放領(lǐng)域的通用型知識圖譜和面向垂直領(lǐng)域型知識圖譜[12].

        3.2 漢彝雙語應(yīng)急領(lǐng)域詞匯術(shù)語知識圖譜的構(gòu)建方式

        本文所構(gòu)建的是用以表示特定領(lǐng)域(應(yīng)急)的語言知識圖譜,需要憑借行業(yè)專家知識.因此,主要采用自頂向下的方式來構(gòu)建知識本體.本體構(gòu)建是為在獲取某一領(lǐng)域的知識時,通過對該領(lǐng)域知識達成的共識來明晰概念間的關(guān)系,進而來描述概念的語義.本體模型的構(gòu)建工具較為多樣,本文主要使用斯坦福大學(xué)開發(fā)的本體編輯工具Protégé.該平臺具有安裝便捷、操作便利、功能強大的特點,且可以滿足不同復(fù)雜程度圖譜的構(gòu)建需求.該圖譜的節(jié)點與關(guān)系模型如表3所示,本體的可視化如圖3所示.

        圖3 應(yīng)急領(lǐng)域詞匯術(shù)語知識圖譜本體的可視化Fig.3 Visualization of the knowledge graph ontology of vocabulary terms in the emergency field

        表3 詞匯知識實體、關(guān)系模型Table 3 Vocabulary knowledge entity and relationship model

        上圖僅展示了部分詞條(節(jié)點)的本體模型.圖中藍色(實線)線段表示Subclass(包含關(guān)系)的對象屬性,黃色(虛線)線段表示Translate(翻譯關(guān)系).

        3.3 漢彝雙語應(yīng)急領(lǐng)域詞匯術(shù)語關(guān)系的自動構(gòu)建

        通過Python實現(xiàn)(災(zāi)害領(lǐng)域,包括,災(zāi)害類型),(災(zāi)害類型,包括,漢語詞匯),(漢語詞匯,翻譯,彝語詞匯)三元組的自動構(gòu)建系.以漢語實體和彝語實體為例,其自動構(gòu)建的核心代碼如下所示:

        4 漢彝雙語應(yīng)急語言資源智能查詢平臺的應(yīng)用

        在完成對資源庫的實驗調(diào)試后,可將資源庫投放至網(wǎng)絡(luò)平臺,分類向政府部門、公益組織、學(xué)術(shù)團體、個人志愿者等不同用戶開放,功能系統(tǒng)如圖4所示.

        圖4 應(yīng)急語言資源查詢平臺的多功能系統(tǒng)Fig.4 Multifunctional system of bilingual emergency language resource database

        4.1 智能信息檢索

        平臺為用戶提供了三種適需的智能檢索路徑:第一,用戶可通過Web前端常用的交互方式對1至4子庫中的文本數(shù)據(jù)(漢彝對照)進行檢索.在查詢平臺的功能欄目中選中信息檢索,輸入“地震”,單擊“查詢”按鈕,即可獲得與該詞條相關(guān)的標(biāo)注信息和圖譜(見圖5).第二,用戶可根據(jù)具體的災(zāi)害類型和服務(wù)內(nèi)容,按需對深度加工的音頻、圖像、視頻數(shù)據(jù)進行檢索.第三,為保護志愿者的個人隱私,在子庫5中添加隱藏項目設(shè)置,僅對政府相關(guān)部門的工作人員開放,并與政府部門簽訂保密協(xié)議.

        圖5 查詢平臺“地震”一詞的檢索結(jié)果展示Fig.5 Display of the search results of the word"earthquake"on the query platform

        此外,該平臺支持多種檢索方式,包括字符串檢索、標(biāo)注檢索、通配符檢索、正則表達式檢索、漢語語音輸入檢索、應(yīng)急標(biāo)識圖片識別檢索6種方式.多樣化的方式為用戶提供了較大的檢索便利和良好的用戶體驗.

        4.2 結(jié)果可視化

        有別于傳統(tǒng)的搜索引擎,用戶使用平臺檢索不同災(zāi)害領(lǐng)域、類型漢彝雙語詞匯術(shù)語時能夠生成相應(yīng)的知識圖譜.以“公共衛(wèi)生”類災(zāi)害中的“傳染病”領(lǐng)域的詞條為例,其知識圖譜如圖6.查詢結(jié)果可視化是將查詢結(jié)果生成為相應(yīng)詞條的知識卡片,以“鼠疫”一詞為例,知識卡片見圖7.

        圖7 “鼠疫”一詞的知識卡片F(xiàn)ig.7 Knowledge card of the"Plague"node

        4.3 資料下載

        為提升資源庫中數(shù)據(jù)的適需性,根據(jù)用戶的不同身份和需求對語料數(shù)據(jù)進行分類、分級拆分.根據(jù)與數(shù)據(jù)對應(yīng)的不同用戶類別,對5個子庫定義不同的視圖,視圖里只有用戶所在權(quán)限內(nèi)的語料數(shù)據(jù);子庫1至4面向一般檢索用戶查詢和下載,而子庫5僅面向政府有特殊需求的政府窗口部門開放.對查詢子庫5信息的用戶進行不同的管理與授權(quán),用戶需先通過身份認(rèn)證,才能按相應(yīng)的檢索方式從后臺數(shù)據(jù)庫中調(diào)用相關(guān)信息.面向不同身份用戶的數(shù)據(jù)下載方案如圖8所示:

        圖8 面向不同用戶視圖的語料數(shù)據(jù)下載方案Fig.8 Corpus data download scheme for different user views

        4.4 智能雙語翻譯

        相較于文本詞典和在線翻譯軟件,該平臺是基于一定規(guī)模的詞語、句子、篇章對齊的語料資源庫,能夠較好地實現(xiàn)漢語和彝語的機器翻譯.此外,隨著深度學(xué)習(xí)和知識圖譜的普及,大規(guī)模的知識庫是實現(xiàn)人機交互、智能翻譯、智能問答的基礎(chǔ).該平臺通過調(diào)用外部接口,實現(xiàn)漢語語音和圖片的輸入識別;并首次嘗試將知識圖譜概念引入彝文信息處理領(lǐng)域,為基于詞向量和語義信息的智能化機器翻譯奠定基礎(chǔ).

        4.5 數(shù)據(jù)動態(tài)管理

        為適配不斷迭變的應(yīng)急服務(wù)需求,該資源庫采用動態(tài)管理的方式實現(xiàn)數(shù)據(jù)的存儲和更新;當(dāng)新的疾病名稱術(shù)語出現(xiàn)或新的信息發(fā)布時,需要對資源庫中的語料進行及時更新,其實現(xiàn)路徑有兩種:一是管理員定期進行維護,以人工的方式增刪或修改語料數(shù)據(jù);二是調(diào)用SQL Server 2019管理中的觸發(fā)器功能,對各子庫的數(shù)據(jù)表定義插入、刪除和更新的觸發(fā)器并預(yù)先設(shè)定事件,實現(xiàn)記錄的自動更新或過濾.資源庫的動態(tài)管理可以確保庫中數(shù)據(jù)的時效性和真實性,提高雙語應(yīng)急語言資源庫的實際價值.

        5 總結(jié)與展望

        在應(yīng)對和處置突發(fā)公共事件時應(yīng)急語言服務(wù)不能缺位,需得到充分地重視[13].語言技術(shù)是國家語言能力的重要衡量指標(biāo),語言技術(shù)的儲備和語言資源的建設(shè)是應(yīng)急語言服務(wù)的必需內(nèi)容[14-16].未來,我們將進一步研發(fā)以國家通用語言文字為主體,多民族語言對照的“多語種應(yīng)急語言資源庫及智能查詢平臺”,并建立和完善資源庫構(gòu)建及管理規(guī)范,發(fā)揮語言智能技術(shù)在提升我國民族地區(qū)災(zāi)害防治能力的現(xiàn)代化、數(shù)字化水平的積極作用,維護國家安全、社會穩(wěn)定,推進構(gòu)筑中華民族共有精神家園,鑄牢中華民族共同體意識.

        猜你喜歡
        資源庫語料雙語
        健身氣功開放課程資源庫建設(shè)研究
        貴州●石斛種質(zhì)資源庫
        基于語料調(diào)查的“連……都(也)……”出現(xiàn)的語義背景分析
        高中歷史信息化教育資源庫應(yīng)用探索
        福建基礎(chǔ)教育教學(xué)資源庫建設(shè)研究——以福建基礎(chǔ)教育網(wǎng)資源庫為例
        華語電影作為真實語料在翻譯教學(xué)中的應(yīng)用
        《苗防備覽》中的湘西語料
        快樂雙語
        新晨(2013年7期)2014-09-29 06:19:50
        快樂雙語
        新晨(2013年5期)2014-09-29 06:19:50
        快樂雙語
        新晨(2013年10期)2014-09-29 02:50:54
        国产精品高清免费在线| 国产精品毛片无码| 国产美女精品aⅴ在线| 成年毛片18成年毛片| 亚洲精品第四页中文字幕| 亚洲综合av永久无码精品一区二区| 人妻中文字幕一区二区视频| 风韵丰满熟妇啪啪区老熟熟女| 18分钟处破好疼哭视频在线观看| 99久久久精品免费香蕉| 国产一区二区毛片视频| 国产精品午夜夜伦鲁鲁| 久久婷婷人人澡人人喊人人爽 | 国产精品久人妻精品老妇| 中文字幕日本特黄aa毛片| 国内精品久久久久久无码不卡| 无码AV午夜福利一区| 成人av资源在线播放| 99久久免费只有精品国产| 亚洲的天堂av无码| 久久久国产精品粉嫩av| 亚洲中文字幕久久在线| 久久99精品九九九久久婷婷| 伊人22综合| 东京热东京道日韩av| 亚洲熟妇av一区二区三区| 亚洲av无码av制服丝袜在线| 亚洲无AV码一区二区三区| 亚洲一区二区三区重口另类| 成年女人a毛片免费视频| 最近日韩激情中文字幕| 日韩高清av一区二区| 99e99精选视频在线观看| 99精品国产99久久久久久97| 国内精品久久久久久久亚洲| 一区二区三区观看视频在线| 香蕉免费一区二区三区| 日本免费人成视频播放| 日韩精品一区二区三区免费观影| 色又黄又爽18禁免费网站现观看| 亚洲国产成人va在线观看天堂 |