亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        信息化語言基礎設施系統(tǒng)建設研究

        2023-04-29 23:48:10吳聰聰
        信息系統(tǒng)工程 2023年1期
        關鍵詞:建設策略

        吳聰聰

        摘要:信息化語言基礎設施系統(tǒng)是促進社會與國家發(fā)展的語言資源系統(tǒng),是社會公共服務體系的重要組成部分,也是國家語言實力的體現(xiàn),具有系統(tǒng)要素多元性、互操作性、智能化、數據形態(tài)多樣性及資源共享性的特點。構建信息化語言基礎設施系統(tǒng),關鍵在于因時、因地制宜,即基于我國語言基礎設施的發(fā)展現(xiàn)狀,制定并落實相應的建設策略,以實現(xiàn)對信息化時代語言資源的優(yōu)化整合與深度管理,進而在語言服務、科學研究、教育培訓及對外傳播方面給予信息與技術支持。

        關鍵詞:信息化語言基礎設施系統(tǒng);語言資源;建設策略

        一、前言

        國務院于2021年頒布了“十四五”規(guī)劃綱要,要求在向第二個百年目標進軍的新時期,全面統(tǒng)籌推進現(xiàn)代化基礎設施體系建設,其重心在于以信息智能技術為支撐,改造傳統(tǒng)基礎設施、構建新型基礎設施。語言基礎設施系統(tǒng)作為現(xiàn)代化基礎設施體系的分支,自然也需要依托信息技術,實現(xiàn)數字化轉型與智能化升級。

        再者,語言基礎設施系統(tǒng)是匡助經濟發(fā)展、政治建設、知識生產、文化傳播、科技創(chuàng)新和國際交往的寶貴資源,也是提升語言實力的基本保障。構建語言基礎設施系統(tǒng),需要立足于當代的技術環(huán)境,在當今以計算機、互聯(lián)網為基本標志的信息化時代,數據挖掘、數據加工、人工智能、數字傳播等信息技術的興起與廣泛應用在給社會生產和居民生活帶來便利的同時,也改變了人們的思維認知模式。信息的獲取途徑已由過去的平面媒體轉至電子化、數字化、網絡化媒體,信息的表征形式呈現(xiàn)數據化和多模態(tài)化,信息處理與管理的方式也隨之演進。在此背景下,建設信息化語言基礎設施系統(tǒng)既是適應國家發(fā)展的需要,亦是順應時代潮流的舉措[1]。

        二、信息化語言基礎設施系統(tǒng)的定義與特點

        信息化語言基礎設施系統(tǒng)是基于網絡傳播環(huán)境的語言資源[本文中的語言資源指的是適用于計算機處理系統(tǒng)的各類“語言知識、語言產品和語言技術”[2]]系統(tǒng),屬于社會公共服務體系。它通過信息技術對各類語言資源進行優(yōu)化整合與深度管理,經由互聯(lián)網平臺為國家、地區(qū)及企事業(yè)單位的生產活動、科學研究、教育培訓及對外傳播等提供與語言相關的各種服務。

        據此,信息化語言基礎設施系統(tǒng)應具備如下特點:

        系統(tǒng)要素多元化:信息化語言基礎設施系統(tǒng)由多種不同功用的要素構成,包括網絡詞典、語料庫、術語庫、術語知識庫、網絡百科知識庫、機器翻譯工具、機輔翻譯工具、語言工具等,滿足了用戶的不同需求。

        互操作性:互操作性是指不同的網絡、系統(tǒng)平臺和應用程序之間共享數據和協(xié)同工作的能力。信息化語言基礎設施系統(tǒng)的內部構成紛繁復雜,各部分在保持獨立運作的同時,還應可互操作或互用,使資源彼此融通。

        智能化:信息化語言基礎設施系統(tǒng)的“智能化”特性源于現(xiàn)代信息智能技術的支持。在這類技術的助力下,設計者可建立智能化的處理系統(tǒng)和人機交互機制,從而為用戶提供更為便捷、高效的服務。

        數據形態(tài)多樣性:數據形態(tài)多樣是網絡傳播的特征,亦是信息化語言基礎設施系統(tǒng)的特點。信息化語言基礎設施系統(tǒng)中的數據不僅指文字模態(tài)數據,還包括音頻、圖像、視頻等其它模態(tài)數據,可為用戶提供多維度、立體化的知識資源,以迎合當今數字化傳播時代廣大受眾的信息需求與認知方式。

        資源共享性:信息化語言基礎設施系統(tǒng)是社會公共資產,資源共享正是其最高價值的體現(xiàn)。面向社會開放系統(tǒng)資源,有益于提高資源利用率,縮小信息差距與技術鴻溝,促進良性競爭和共同發(fā)展。

        三、我國信息化語言基礎設施建設的現(xiàn)狀

        我國的信息化語言基礎設施建設工作在網絡詞典、語料庫、術語庫、網絡百科知識庫、翻譯技術及語言技術的研發(fā)方面成績斐然。但對標高質量的發(fā)展要求,當前的信息化語言基礎設施仍未成體系,服務能力與服務品質差強人意,整體發(fā)展水平不高,具體有以下幾方面缺陷:

        1.網絡詞典所支持的語言種類依然有限,僅能滿足常見語種的語言工作者和語言學習者的需求。

        2.多數語料庫所涉語種不多,僅支持基本的信息檢索。此外,現(xiàn)有的語料庫多為文字模態(tài)語料庫,缺少音頻語料庫和視頻語料庫。

        3.術語庫的功能較為單一,所涵蓋的語種有限,且由于不同建庫者對同一領域的知識有著不同的認知水平和認知視角,所以在一些服務于相同領域的不同術語庫中,部分相同概念的術語信息有別,術語同義、多義現(xiàn)象頻發(fā)。

        4.缺少完備的術語知識庫。術語知識庫可用于管理專業(yè)領域的術語知識資源,服務于翻譯實踐,較之術語庫,它更能明示專業(yè)領域的知識脈絡與知識結構。現(xiàn)今世界知名的術語知識庫均來自歐美國家。相比之下,我國的術語知識庫研發(fā)工作相對滯后,“仍處于基礎理論構建、應用規(guī)劃和實驗室設計階段”[5]。

        5.目前國內使用率最高的網絡百科知識庫僅有中文版;庫中內容相對主觀,即便未引用權威佐證或佐證不嚴謹,也可能成功創(chuàng)建詞條;唯注冊用戶有編輯詞條的權限,部分詞條的編輯權限僅歸一定信用等級的用戶所有,這在理論上有利于確保內容的準確性與真實度,但實際上也制約了百科知識庫的發(fā)展,況且用戶的信用等級未必能反映其真實的知識水平;在內容審核方面,多數網絡百科知識庫,如百度百科實行的是機器和人工共同審核的機制,內容在創(chuàng)建并提交后,先由機器進行初篩,再由內部人員復核。但機器無法識別真?zhèn)危斯徍藙t可能受審核員自身客觀條件(如知識儲備、專業(yè)程度等)與主觀偏好的影響。

        6.與歐美國家相比,我國的翻譯工具在性能和翻譯質量方面仍存在不小差距。以谷歌翻譯與百度翻譯的對比為例,二者均采用最新的神經網絡翻譯技術。谷歌翻譯的神經網絡算法可以較好地學習語序模式,使長句翻譯更流暢,而百度翻譯的神經網絡算法則以句子作為單獨序列,無論單詞或短語是否正確,都會生成句子[3],故譯文容易出現(xiàn)歧義和語法問題。

        7.自主研發(fā)的語言工具仍無法自給自足,性能優(yōu)越的語言工具多來自國外,且由于缺乏集中管理,許多軟件與應用程序不便于用戶獲取和使用。

        8.現(xiàn)有的語言基礎設施大都由不同機構或單位獨立構建而成,缺乏自上而下的規(guī)劃管理和協(xié)作調配,故資源分散、不成體系。多數語言基礎設施間無法實現(xiàn)數據互通或系統(tǒng)互操作,這無益于資源的復用與共享。

        四、信息化語言基礎設施系統(tǒng)的建設策略

        信息化語言基礎設施系統(tǒng)的建設策略包括基本建設模式和建設措施,前者是貫穿建設全過程的宏觀方略,后者是針對現(xiàn)存問題和實際需求而采取的解決辦法,二者缺一不可。

        (一)信息化語言基礎設施系統(tǒng)的基本建設模式

        信息化語言基礎設施系統(tǒng)是服務于中國特色社會主義現(xiàn)代化建設的基礎性資源,關乎社會與國家發(fā)展,應采取自上而下的基本建設模式,任何建設措施都必須在該模式下施行。所謂自上而下的基本建設模式,即以國家相關部門為主管單位,由其發(fā)起并從國家戰(zhàn)略高度主導信息化語言基礎設施系統(tǒng)建設的全過程——統(tǒng)籌規(guī)劃,組織以相關院校和科研機構為主力的人員力量進行分工協(xié)作,提供經費,配備物資,跟蹤工程進度,控制工程質量,以充分發(fā)揮人才與技術優(yōu)勢、整合分散資源、避免重復建設。

        (二)信息化語言基礎設施系統(tǒng)的建設措施

        在確定基本建設模式的基礎上,可通過以下若干建議性措施,建設信息化語言基礎設施系統(tǒng):

        1.對原有設施進行升級改造,填補空缺。具體包括:(1)踐行“多語主義”理念,擴充網絡詞典的語言種類,以滿足更多用戶的需求。(2)改進文字模態(tài)語料庫,增建視頻語料庫和音頻語料庫。(3)加強全國科學技術名詞審定委員會對術語庫的管理。以全國科學技術名詞審定委員會為首,協(xié)同術語學家、領域專家、翻譯專家及詞典編纂專家,開展術語庫建設工作:改進現(xiàn)有術語庫,包括規(guī)范其術語信息,補充其它語種的術語資源,嵌入處理術語數據的語言工具;按照統(tǒng)一標準創(chuàng)建“術語規(guī)范化、語種多元化、多功能一體化”的新術語庫。(4)構建不同領域的多語術語知識庫。建立術語知識庫的關鍵在于根據特定領域概念系統(tǒng)的特點,劃分概念范疇,組織知識資源,從而創(chuàng)建形象表征該領域知識體系的知識本體。(5)完善網絡百科知識庫的建設??蓞⒖季S基百科的做法:基于現(xiàn)有的中文版網絡百科知識庫,構建其它語言版本的網絡百科知識庫;放寬詞條、內容的編輯權限,鼓勵更多用戶參與網絡百科知識庫的建設工作;提高編發(fā)要求,任何詞條、內容的創(chuàng)建、編輯和發(fā)布都須援引權威且嚴謹的佐證,以彌補人機共審機制的缺陷。(6)搭建高性能的網絡翻譯平臺。此舉的關鍵是在平臺中裝置性能卓越的翻譯管理系統(tǒng)(翻譯管理系統(tǒng)是多種翻譯工具的結合體)。目前作業(yè)能力出色的翻譯工具主要來自歐美國家,我國的翻譯技術雖與日俱進,但仍無法與之比肩,若要在短期內有所突破,顯然不切實際。鑒于此,可與國際上主流翻譯技術的開發(fā)商或研發(fā)機構合作,充分利用其出品的翻譯工具,將之作為驅動網絡翻譯平臺運轉的內核。與此同時,應繼續(xù)加大本土翻譯技術的研發(fā)力度,以提升本土翻譯工具的性能。(7)完善語言工具范疇。首先,加快本土語言技術研發(fā)工作,并與國外相關機構合作,引進緊缺的和最新型的語言工具,以滿足用戶多樣的技術需求。其次,對語言工具進行合理化管理:一則,構建集中管理各類語言工具的開放性資源庫,允許用戶入庫下載;二則,將相關的語言工具分別集成于語料庫、術語庫、術語知識庫、網絡翻譯平臺中,以拓展其功能。

        2.建立信息化語言基礎設施系統(tǒng)平臺,以集中管理語言資源。首先需要對信息化語言基礎設施進行分類。根據屬性與用途的不同,可將信息化語言基礎設施分為三大類,即語言數據庫、網絡翻譯平臺、語言工具。語言數據庫包括網絡詞典、語料庫、術語庫、術語知識庫及網絡百科知識庫,其作用是向用戶提供帶有信息和知識性質的語言數據資源;網絡翻譯平臺搭載著不同功用的翻譯工具,可應用于翻譯實踐、翻譯教學、翻譯學研究;語言工具是用于語言數據處理的技術資源,包括各類文字處理軟件、建庫軟件、詞性標注工具、分詞工具、雙語對齊軟件、術語提取工具、本體編輯器、推理機、語音識別工具等。在完成類別劃分后,根據分類結果建立以語言數據中心、翻譯中心和語言技術中心為基本架構的信息化語言基礎設施系統(tǒng)平臺。然后將改進后的語言基礎設施分別置于各中心內,對于不便移位的數據庫或軟件,可在中心內插入其所在官網的鏈接,以便用戶登入官網進行下載或在線使用。并在此基礎上,持續(xù)更新信息化語言基礎設施系統(tǒng),如在系統(tǒng)中植入新軟件、構建新數據庫、添加新鏈接等。

        3.建立互操作機制。應在信息化語言基礎設施系統(tǒng)中的各數據庫、平臺、應用軟件或程序之間,以及系統(tǒng)與外部資源之間建立交互機制,使之得以互操作,即打通系統(tǒng)內部的聯(lián)通渠道,并發(fā)掘系統(tǒng)外部的資源通道,以促進知識資源的循環(huán)與技術資源的共享,進而提升信息化語言基礎設施系統(tǒng)的服務水平。實現(xiàn)互操作的基本原則是“使用標準定義和通用的數據元素來表示數據”[4],使不同系統(tǒng)在語法和語義層面具備協(xié)同工作的能力,這有助于融通數據和提高資源復用率。

        4.利用云技術搭建信息化語言基礎設施系統(tǒng)云平臺。將云技術應用于信息化語言基礎設施系統(tǒng)建設,即將語言數據庫、網絡翻譯平臺、語言工具等語言資源置于云中,為用戶提供云端服務。其優(yōu)勢在于:(1)云技術擁有強大的存儲能力??赏ㄟ^無限擴容將網絡詞典、語料庫、術語庫、術語知識庫、網絡百科知識庫、翻譯記憶庫中持續(xù)增長的語言數據儲存于云端,且云存儲技術的穩(wěn)定性高,開發(fā)者與用戶無需擔心數據的安全問題。(2)云虛擬化技術支持用戶隨時隨地登云操作。語言基礎設施在云中運行,無論用戶身處何方,只需借助終端設備便可輕松訪問,這也有助于整合人力資源。例如,在翻譯項目中,即便項目成員各處異地,也可通過翻譯技術云平臺實時溝通、協(xié)作,實現(xiàn)資源共享。(3)可將信息化語言基礎設施系統(tǒng)云平臺建設為混合云平臺。混合云即私有云與公有云的結合體,其中的私有云部分僅為系統(tǒng)的研發(fā)者與管理者所用,他們可通過專有權限對語言基礎設施系統(tǒng)進行更改、管理和維護,而公有云部分則對外開放,以社會大眾為服務對象,允許用戶通過注冊私人賬號申請使用權限。

        五、結語

        信息化語言基礎設施系統(tǒng)依托于信息技術,支持網絡化、數字化環(huán)境中的信息傳播與知識生產,是現(xiàn)代化基礎設施體系的一大分支。同歐美國家相比,我國的信息化語言基礎設施建設工作發(fā)展相對遲緩,且存在資源分散、不成體系、性能較弱等問題,從而制約了語言基礎設施的服務效能。對此,需要由國家頂層機構主導并組織人員力量,通過“對現(xiàn)有語言基礎設施進行查缺補漏、升級改造,搭建整合語言資源的系統(tǒng)平臺,建立平臺內外的互操作機制,以及實現(xiàn)資源的云端化管理”等措施,構建信息化語言基礎設施系統(tǒng),以助推社會進步與國家發(fā)展。信息化語言基礎設施系統(tǒng)建設是一項復雜的長期工程,本研究旨在拋磚引玉,今后仍需學界與業(yè)界共同努力,積極開展進一步的理論研究與實踐探索。

        參考文獻

        [1]León-Araúz P, Reimerink A, Faber P.EcoLexicon and by-products: integrating and reusing terminological resources [J]. Terminology, 2019,25(2): 222-258.

        [2]李宇明.語言也是“硬實力”[J].華中師范大學學報(人文社會科學版),2011,50(5):68-72.

        [3]施雪琴,吳蘭香,魯明易.國內外機器翻譯比較研究-基于百度和谷歌在線翻譯調查[J].卷宗,2018(8):168-170.

        [4]宋佳,溫亮明,李洋.科學數據共享FAIR原則:背景、內容及實踐[J].情報資料工作,2021,42(1):57-68.

        [5]王傳英,崔啟亮,朱恬恬.“一帶一路”走出去的國家語言服務基礎設施建設構想[J].中國翻譯,2017(6):62-67.

        (作者單位:南開大學外國語學院)

        猜你喜歡
        建設策略
        小學班主任要如何做好班級的文化建設
        亞太教育(2016年36期)2017-01-17 17:41:55
        論高職院校保衛(wèi)工作信息化建設
        東方教育(2016年14期)2017-01-16 01:17:42
        高校醫(yī)學科研機構綜合管理系統(tǒng)建設策略
        東方教育(2016年13期)2017-01-12 20:22:16
        網絡環(huán)境下公共圖書館文獻資源建設的思考與探索
        青年時代(2016年20期)2016-12-08 17:51:38
        關于中小型數字圖書館數字化建設策略探討
        數字化時代下國有大型企業(yè)媒體傳播體系建設策略
        高職室內設計專業(yè)課程標準建設的方法探討
        我國政府公共管理中存在的問題及優(yōu)化策略探析
        求知導刊(2016年14期)2016-07-11 14:03:29
        鄉(xiāng)鎮(zhèn)中心幼兒園校園文化建設略探
        農村特殊教育學校職業(yè)教育師資隊伍建設策略探究
        考試周刊(2016年9期)2016-03-12 06:21:57
        久久夜色精品国产亚洲av动态图 | 在线不卡av片免费观看| 久久麻豆精品国产99国产精| 国产精品亚洲专区无码不卡| 日本加勒比精品一区二区视频| 国产精品爽爽ⅴa在线观看| 国产无遮挡a片又黄又爽| 亚洲AV无码成人精品区日韩密殿 | 精品人妻少妇av中文字幕| 免费少妇a级毛片人成网| 国产精品理人伦国色天香一区二区 | 国产精品自在线拍国产| 最新国产精品亚洲二区| 成年男女免费视频网站点播| 欧美奶涨边摸边做爰视频| 天天摸日日摸狠狠添| 国产精品久久久亚洲第一牛牛| 亚洲精品在线97中文字幕| 粗大的内捧猛烈进出看视频| 国产又黄又猛又粗又爽的a片动漫| 成激情人妻视频| 偷拍一区二区三区高清视频| 亚洲春色在线视频| 96精品在线| 精品亚洲国产亚洲国产| 人妻少妇精品久久久久久| 无码精品黑人一区二区三区| 久久国产精品男人的天堂av| 成年人干逼视频水好多| 国产成人无码免费视频在线| 国模无码视频专区一区| 中文字幕人妻被公喝醉在线| 久久精品国产清自在天天线| 国产精品露脸视频观看| 亚洲精品国产一区av| 久久综合九色欧美综合狠狠| 久久久精品人妻一区二区三区四 | 啪啪视频一区二区三区入囗| 国产在线观看一区二区三区av| 成人一区二区三区蜜桃| 亚洲av综合国产av日韩|