敖登巴拉,馬愷,陳琦
(內蒙古自治區(qū)地方語言文字研究應用中心,內蒙古呼和浩特 010010)
語言文字是人類社會生活中重要的交際工具,是鑄牢中華民族共同體意識的重要載體。語言的多樣性是人類社會發(fā)展的重要遺產(chǎn),每一種語言文字都蘊藏著一個民族或群體的獨特文化智慧。語言文字是一種重要的文化資源,我們應當對其加以積極保護和科學建設,并進行合理開發(fā)和有效利用,保證語言資源的健康、持續(xù)發(fā)展和長期有效利用[1]。在推廣國家通用語言文字的同時,國家還在科學保護各民族的語言文字。在信息時代,我們利用信息技術加強少數(shù)民族語言數(shù)字資源建設與推廣應用,對于保護、傳承和開發(fā)優(yōu)秀的少數(shù)民族語言資源具有非常重要的現(xiàn)實意義。
語言數(shù)字資源是一種語言文字信息的表現(xiàn)形式,是將計算機技術、通信技術及多媒體技術相互融合而形成的,以數(shù)字形式發(fā)布、存取、利用的信息資源。語言數(shù)字資源的優(yōu)勢在于不受物理時間的限制。我們能快速、便捷地獲取海量豐富的語言資源。語言資源庫是語言資源的一種具體呈現(xiàn),是利用、開發(fā)語言資源的一種途徑,也是實現(xiàn)語言資源功能的基礎設施[2]。通常情況下,按照語言資源庫中存儲內容的不同,我們可以將語言資源庫分為詞語庫、句子庫、語料庫、音視頻庫、多語句子對齊的平行語料庫等。
歷年來,國家非常重視少數(shù)民族語言資源的建設與研究工作。據(jù)相關文獻記載,在2011年,新疆維吾爾自治區(qū)圖書館申報實施了國家文化科技提升計劃中的少數(shù)民族語言數(shù)字資源建設與檢索平臺項目。少數(shù)民族語言數(shù)字資源建設與檢索平臺是在新疆維吾爾自治區(qū)圖書館豐富的少數(shù)民族館藏資源的基礎上搭建起來的多語種電子資源加工和發(fā)布的管理平臺,建設了新農村社會主義文明建設資源庫(維語)、新疆農牧區(qū)實用技術資源庫(維語)、新疆影視資源庫(維哈語)、新疆紅色資源庫、新疆舞臺藝術資源庫、新疆非物質文化遺產(chǎn)資源庫、新疆少數(shù)民族少兒“雙語”及基礎教育資源庫(維漢雙語)、新疆風光資源庫等多個資源庫,實現(xiàn)了新疆少數(shù)民族語言文獻的加工、錄入、存儲、檢索、管理、發(fā)布與查看等功能[3]。在2012年,西藏大學依托大學數(shù)字圖書館國際合作計劃(CADAL)建設了中國藏文文獻資源網(wǎng)。該網(wǎng)站已系統(tǒng)地完成近4 000種藏文現(xiàn)代圖書、45種國內藏文期刊、6萬余頁藏文學位論文的掃描和上線工作,成果廣泛應用于各大高等院校和藏學研究領域。2016年,青海海南藏族自治州藏文信息技術研究中心負責研發(fā)的藏文搜索引擎“云藏”是各大藏文網(wǎng)站的統(tǒng)一入口和藏文文獻的資源共享中心,涵蓋了新聞、圖片、視頻、音頻、百科、文庫等功能版塊,打破了藏文搜索引擎匱乏的困境,為藏文文獻資源在互聯(lián)網(wǎng)領域的使用提供了個性化檢索平臺[4]。自2016年以來,內蒙古自治區(qū)民委啟動實施了蒙古語言文字數(shù)字資源建設與共享工程項目,主要建設以蒙古語言文字為載體、以數(shù)字資源開發(fā)整合為基礎、以信息技術規(guī)范化標準化為支撐、以數(shù)字資源推廣應用為目的的蒙古語言文字數(shù)字資源共享平臺,建設了“蒙古語資源網(wǎng)”和“智路搜索引擎”[5]?!懊晒耪Z資源網(wǎng)”收集整合了民族教育、民族文化、民族科技等與少數(shù)民族干部群眾生產(chǎn)生活息息相關的數(shù)字化資源,包括圖書、圖片、視頻、音頻、文庫等功能版塊,為學習使用蒙古語言文字的各族干部群眾提供了更加便捷、優(yōu)質、高效的公共服務?!爸锹匪阉饕妗本哂小鞍醋中螜z索”“忽略控制符檢索”“唇元音模糊檢索”“按詞根檢索”等檢索選項,能提供網(wǎng)頁搜索、圖片搜索、音頻搜索、視頻搜索、文檔搜索、新聞搜索等搜索服務,實現(xiàn)了對蒙古文數(shù)字內容的全文索引,包括資源門戶和其他網(wǎng)站,為廣大用戶在互聯(lián)網(wǎng)上獲取相關信息提供了更加便捷、個性化的檢索服務。
蒙古語數(shù)字資源建設與推廣工作是一項長期的系統(tǒng)工程,我們應從整體、長遠、全局的角度去謀劃,從保存民族文化遺產(chǎn)、傳承中華文明的高度做好民族語言數(shù)字資源建設的頂層設計,以確保民族語言數(shù)字資源建設、開發(fā)和保存的可持續(xù)性,促進各民族交往交流交融,推進中華民族共有精神家園建設。
制定統(tǒng)一的數(shù)字化規(guī)范標準是建設高質量的蒙古語數(shù)字資源的基礎支撐,它不僅保證了蒙古語數(shù)字資源的可擴展性和兼容性,而且有利于蒙古語數(shù)字資源的整合,為促進蒙古語數(shù)字資源的共建共享提供了基礎保障。在信息技術標準和數(shù)字資源加工規(guī)范標準方面,蒙古語言文字數(shù)字資源建設與共享工程項目的成員制定了《傳統(tǒng)蒙古文名義字符到變形顯現(xiàn)字符的轉換補充規(guī)則》《蒙古文數(shù)字對象唯一標識符規(guī)范》《蒙古文數(shù)字資源加工質量規(guī)范》《蒙古文數(shù)字資源元數(shù)據(jù)規(guī)范》等26項信息技術標準和數(shù)字資源加工規(guī)范項目標準,并在五十多個蒙古語言文字信息化建設項目中推廣實施,以此使各蒙古文字體企業(yè)之間的字體互相兼容,有效地解決了編碼不統(tǒng)一的問題。目前,濰坊北大青鳥華光照排有限公司等字體企業(yè)在蒙古文字庫、蒙古文輸入法、蒙古文排版軟件、蒙古文移動客戶端等各個應用層面全面實施這些標準,有效地促進蒙古語信息交流和資源共享[6]。
建立有效的數(shù)字資源評估機制是數(shù)字資源建設的重要環(huán)節(jié),其目的在于對數(shù)字資源建設進行質量上的把關控制。在大數(shù)據(jù)時代,用戶對數(shù)字資源的要求越來越高,對數(shù)字資源的內容和質量方面的要求也越來越嚴格。對于用戶而言,內容豐富且具有知識增值的數(shù)字資源具有很強的吸引力和傳播力。內容枯燥、質量不高的數(shù)字資源不能吸引用戶的注意力,點擊量和傳播量會受到影響。我們開展數(shù)字資源評估,其目的在于甄別數(shù)字資源的優(yōu)劣,挖掘優(yōu)質的數(shù)字資源,淘汰劣質的數(shù)字資源,提高數(shù)字資源的建設質量。我們在開展數(shù)字資源評估時,應當從數(shù)字資源的內容、檢索系統(tǒng)的功能、讀者使用情況、成本價值等方面著手,采用定性或者定量的評估方法,構建一套由一系列相互聯(lián)系的統(tǒng)計指標所形成的、用于分析和評價的指標總和[7]。我們建立健全蒙古語數(shù)字資源評估機制有利于蒙古語數(shù)字資源的質量保障。就蒙古語數(shù)字資源建設而言,在入庫前,我們采用專家評審法對數(shù)字資源的內容進行評估,例如,某個圖片資源是否符合相關審核要求,符合則通過,不符合則不通過,從而確保數(shù)字資源內容的安全性、完整性和可用性。在驗證蒙古語數(shù)字資源文字編碼的統(tǒng)一性方面,我們采用標準符合性檢測方法,對數(shù)字資源的文字編碼進行標準符合性測評,制定測試方案,設計測試用例,實施檢測,確保數(shù)字資源的文字編碼符合相關信息技術標準。在蒙古語數(shù)字資源入庫后,即向廣大用戶提供資源共享服務后,我們可以根據(jù)數(shù)字資源的點擊量、瀏覽時長、用戶評價意見等指標進行統(tǒng)計分析,為資源建設方在優(yōu)化數(shù)字資源內容和功能模塊方面提供參考依據(jù)。蒙古語數(shù)字資源評估機制如圖1所示。
圖1 蒙古語數(shù)字資源評估機制
有效的數(shù)字資源評估機制能夠幫助我們甄別數(shù)字資源的優(yōu)劣,調整數(shù)字資源的學科分布,優(yōu)化內容比例[8]。此外,有效的數(shù)字資源評估機制能夠合理優(yōu)化數(shù)字資源,更好地滿足用戶的學習使用需求,有助于提高數(shù)字資源的使用價值,為用戶提供知識增值服務,充分發(fā)揮其社會效益。
建設高質量的蒙古語數(shù)字資源需要由既掌握數(shù)字資源開發(fā)和計算機軟件應用的相關知識,又熱愛蒙古語數(shù)字化建設、勇于創(chuàng)新的專業(yè)技術人員來完成。蒙古語數(shù)字資源建設過程涉及素材采集,編目上傳、審核、發(fā)布等流程,每一個環(huán)節(jié)都需要精通業(yè)務的專業(yè)技術人員來操作。蒙古語數(shù)字資源平臺也需要精通計算機應用、數(shù)據(jù)庫技術及網(wǎng)絡技術的專業(yè)人員來運行和維護。因此,培養(yǎng)高素質的專業(yè)技術人才隊伍是我們做好蒙古語數(shù)字資源建設推廣的保障。
我們探索多渠道的宣傳推廣方式能夠讓更多用戶群體了解并使用蒙古語數(shù)字資源平臺,是提高蒙古語數(shù)字資源的社會共享價值的有力途徑。蒙古語數(shù)字資源建設完成后,我們通過多種渠道進行宣傳推廣,讓更多的用戶群體了解、熟悉和應用數(shù)字資源,實現(xiàn)數(shù)字資源的社會價值。根據(jù)蒙古語數(shù)字資源的內容和類型,我們可以對使用用戶進行分類,進行有針對性和實效性的宣傳推廣,從而提高宣傳實效。針對不同的用戶群體,我們組織開展蒙古語數(shù)字資源進學校、進社區(qū)、進機關、進旗縣、進牧區(qū)等系列宣傳推廣活動。我們通過開展講座和培訓、張貼宣傳海報等方式宣傳推廣蒙古語數(shù)字資源平臺,讓更多的用戶群體了解該平臺,提高蒙古語數(shù)字資源平臺的影響力。我們通過充分利用網(wǎng)站、微信公眾號、微博、抖音等新興媒體,發(fā)布蒙古語數(shù)字資源平臺的相關介紹信息、資源的建設情況,如文字介紹、短視頻、圖片信息等方式,使更多的用戶關注、了解、熟悉蒙古語數(shù)字資源平臺,更加廣泛地提高蒙古語數(shù)字資源的共享性。相關部門可以聯(lián)合電視臺、廣播臺、報社等媒體單位,在社會范圍內開展蒙古語數(shù)字資源采集活動、數(shù)字資源評比活動,讓更多的用戶群體參與其中,提高蒙古語數(shù)字資源的活力,讓數(shù)字資源活起來。我們定期舉辦蒙古語數(shù)字資源建設學術交流會,邀請相關領域的專家學者研討數(shù)字資源的相關學術研究,交流經(jīng)驗做法,討論未來發(fā)展規(guī)劃??傊?,蒙古語數(shù)字資源在建設完成后,我們通過多種渠道加以宣傳推廣,力求做到蒙古語數(shù)字資源的社會價值最大化,滿足用戶不同的數(shù)字資源獲取需求,提供有效的知識增值服務,更加高效地惠及各族人民群眾,促進各民族交往交流交融,為鑄牢中華民族共同體意識提供珍貴的文化資源,積極推進中華民族共有精神家園建設。
在蒙古語數(shù)字資源建設過程中,持續(xù)且可靠的經(jīng)費投入是不可缺少的關鍵要素。有了經(jīng)費支持,蒙古語數(shù)字資源建設與推廣工作才能健康、持續(xù)地開展下去,才能持續(xù)地為用戶群體提供優(yōu)質的資源共享服務。無論是前期蒙古語數(shù)字資源的采集和制作,還是后期數(shù)字資源平臺的運行和維護,都需要消耗相當多的經(jīng)費投入。單靠某一個工作機構短期內的經(jīng)費投入是無法支撐蒙古語數(shù)字資源建設持續(xù)有效地開展下去的。目前,蒙古語數(shù)字資源建設的主要經(jīng)費是由政府專項經(jīng)費提供的,隨著蒙古語數(shù)字資源建設的不斷發(fā)展,相關部門可以探索其他創(chuàng)新的經(jīng)費資助模式,如個人資助、企業(yè)資助、政府+企業(yè)資助等,持續(xù)資助蒙古語數(shù)字資源的建設和推廣工作,從而保障蒙古語數(shù)字資源建設的持續(xù)有效發(fā)展。
蒙古語數(shù)字資源建設與推廣工作是保護和傳承少數(shù)民族優(yōu)秀文化資源的一項重要工作,是堅定中華文化自信的一項重要舉措。蒙古語數(shù)字資源建設相關單位應堅持以鑄牢中華民族共同體意識為主線,從整體、長遠、全局的角度去謀劃,制定統(tǒng)一的數(shù)字化規(guī)范標準作為基礎支撐,建立有效的數(shù)字資源評估機制作為質量保障,培養(yǎng)高素質的專業(yè)技術人才隊伍作為人力保障,形成多渠道的宣傳推廣方式,提高數(shù)字資源的社會共享價值,探索持續(xù)的經(jīng)費投入模式,從而確保蒙古語數(shù)字資源建設的持續(xù)有效發(fā)展,惠及各民族群眾,推進中華民族共有精神家園建設,為新時代黨的民族工作高質量發(fā)展貢獻力量。