亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        中國(guó)少數(shù)民族語(yǔ)言資源開(kāi)發(fā)應(yīng)用芻議

        2019-06-25 03:59:45丁石慶
        語(yǔ)言戰(zhàn)略研究 2019年3期
        關(guān)鍵詞:開(kāi)發(fā)應(yīng)用統(tǒng)一分類

        提 要 “中國(guó)語(yǔ)言資源保護(hù)工程”以其空前規(guī)模及統(tǒng)一規(guī)范方法實(shí)施調(diào)研所采集的活態(tài)語(yǔ)料資源,兼具真實(shí)性、可靠性和科學(xué)性,并為語(yǔ)言資源的精準(zhǔn)保護(hù)和合理開(kāi)發(fā)應(yīng)用提供了科學(xué)依據(jù)。語(yǔ)保工程實(shí)現(xiàn)了新時(shí)期對(duì)中國(guó)境內(nèi)的少數(shù)民族語(yǔ)言及方言與土語(yǔ)情況較為全面的摸底與排查,調(diào)查數(shù)據(jù)和相關(guān)材料同時(shí)也提供了少數(shù)民族語(yǔ)言資源保護(hù)及開(kāi)發(fā)應(yīng)用的諸多信息。本文以5年來(lái)民語(yǔ)專項(xiàng)調(diào)研任務(wù)語(yǔ)料資源數(shù)據(jù)及任務(wù)進(jìn)程中發(fā)音合作人遴選時(shí)透露的語(yǔ)言資源保持類型存在的層次差異等為問(wèn)題導(dǎo)向,對(duì)中國(guó)少數(shù)民族語(yǔ)言資源的開(kāi)發(fā)應(yīng)用及相關(guān)論題進(jìn)行初步探討。本文認(rèn)為,基于語(yǔ)保工程民語(yǔ)調(diào)研專項(xiàng)任務(wù)所獲大量語(yǔ)料資源數(shù)據(jù),中國(guó)少數(shù)民族語(yǔ)言資源的開(kāi)發(fā)應(yīng)用可實(shí)施整體統(tǒng)一開(kāi)發(fā)應(yīng)用與分類開(kāi)發(fā)應(yīng)用兩種推進(jìn)思路。整體統(tǒng)一開(kāi)發(fā)應(yīng)用思路包括大數(shù)據(jù)研究、語(yǔ)言服務(wù)、政策咨詢等內(nèi)容;分類開(kāi)發(fā)應(yīng)用思路則包括深度開(kāi)發(fā)應(yīng)用、深度規(guī)范性開(kāi)發(fā)應(yīng)用、深度保護(hù)性開(kāi)發(fā)應(yīng)用及深度典藏性開(kāi)發(fā)應(yīng)用等內(nèi)容。

        關(guān)鍵詞 語(yǔ)保工程;少數(shù)民族語(yǔ)言資源;開(kāi)發(fā)應(yīng)用;統(tǒng)一;分類

        中圖分類號(hào) H002 文獻(xiàn)標(biāo)識(shí)碼 A 文章編號(hào) 2096-1014(2019)03-0038-07

        Abstract The National Project of Chinese Language Resource Preservation (hereinafter Preservation Project) is an unprecedented megaproject with a unified standard and framework. The live linguistic resources it contains are featured as authentic, reliable and scientific, thus providing a scientific ground for precise preservation of minority language resource and controlled development and utilization. The implementation of the Preservation Project enables a thorough survey and rectification of minority languages, regionalects, and colloquialisms. The data collected provide abundant information for language resource preservation and utilization. Over the past five years, the Project team has obtained rich information form the native speakers of minority languages during special focused tasks. Guided by the hierarchical differences in need of protection as revealed by these minority languages, this study attempts to make a preliminary proposal on the development and utilization of the data from the project. I argue that, based on the big data, the development and utilization of minority language resources in China should be implemented with a scheme of unified development and utilization and a scheme of categorized development and utilization. The former includes big-data study, language service, policy consultancy, and the latter contains in-depth development and utilization, in-depth standardized development and utilization, in-depth controlled development and utilization and in-depth archived development and utilization for individual languages. In short, more considerations should be given to post-project preservation and utilization.

        Key words Preservation Project; minority language resource; development and utilization; unified scheme; categorized scheme

        “中國(guó)語(yǔ)言資源保護(hù)工程”(以下簡(jiǎn)稱語(yǔ)保工程)經(jīng)5年的建設(shè),已進(jìn)入一期的攻堅(jiān)收官階段。目前,語(yǔ)保工程正面臨如何開(kāi)展在語(yǔ)言資源保護(hù)條件下的開(kāi)發(fā)應(yīng)用等后續(xù)任務(wù)。相較于漢語(yǔ)方言資源,中國(guó)少數(shù)民族語(yǔ)言資源的開(kāi)發(fā)應(yīng)用面臨語(yǔ)種多、類型雜、差異大的形勢(shì),需解決的問(wèn)題也極其特殊,難以一刀切。本文結(jié)合語(yǔ)保工程民語(yǔ)調(diào)研專項(xiàng)任務(wù)實(shí)施以來(lái)的實(shí)踐,就中國(guó)少數(shù)民族語(yǔ)言資源及其開(kāi)發(fā)應(yīng)用的相關(guān)論題予以初步探討,以期獲得拋磚引玉之效。

        一、論題緣起

        語(yǔ)保工程兼具史無(wú)前例的開(kāi)創(chuàng)性和重大的現(xiàn)實(shí)意義,其投入的經(jīng)費(fèi)、人力、持續(xù)的時(shí)間以及獲得的語(yǔ)言資源容量,是空前的。尤其首次采用統(tǒng)一的規(guī)范標(biāo)準(zhǔn)所收集的國(guó)內(nèi)漢語(yǔ)方言與少數(shù)民族語(yǔ)料資源兼具真實(shí)性、可靠性和科學(xué)性。調(diào)查所獲相關(guān)數(shù)據(jù)提供了中國(guó)語(yǔ)言資源的分布地域、密度、類型,各語(yǔ)系、各語(yǔ)族、各語(yǔ)支、各語(yǔ)言及其方言土語(yǔ)資源等多種最新信息,也為我們進(jìn)行語(yǔ)言資源保護(hù)與語(yǔ)言資源開(kāi)發(fā)應(yīng)用規(guī)劃提供了科學(xué)依據(jù)。

        (一)語(yǔ)保工程民語(yǔ)調(diào)研任務(wù)所獲語(yǔ)料數(shù)據(jù)

        語(yǔ)保工程實(shí)現(xiàn)了新時(shí)期對(duì)中國(guó)境內(nèi)的少數(shù)民族語(yǔ)言及方言與土語(yǔ)情況較為全面的摸底與排查。據(jù)語(yǔ)保工程民語(yǔ)調(diào)研專項(xiàng)任務(wù)相關(guān)數(shù)據(jù)統(tǒng)計(jì),2015至2019年的5年內(nèi),共計(jì)立項(xiàng)410個(gè)點(diǎn)。其中,一般點(diǎn)立項(xiàng)323個(gè),已結(jié)項(xiàng)255個(gè);瀕危點(diǎn)87個(gè),已結(jié)項(xiàng)74個(gè)。立項(xiàng)與已完成任務(wù)的調(diào)研點(diǎn)涵蓋了分布于中國(guó)大陸和臺(tái)灣的56個(gè)民族使用的130余種語(yǔ)言及新發(fā)現(xiàn)的若干語(yǔ)言。各語(yǔ)系語(yǔ)言點(diǎn)分布情況如表1所示。各語(yǔ)族設(shè)點(diǎn)情況如表2所示。

        以上數(shù)據(jù)中包括需待確認(rèn)的若干種新發(fā)現(xiàn)語(yǔ)言,還包括30~50余種跨境語(yǔ)言(戴慶廈1993;黃行,許峰2013;周慶生2013;朱艷華2016)。

        (二)民語(yǔ)“發(fā)音合作人”遴選中透露的相關(guān)信息

        在語(yǔ)保工程實(shí)施過(guò)程中,每個(gè)調(diào)研點(diǎn)提供各種語(yǔ)料資源的發(fā)音合作人無(wú)疑是最重要的角色,而其中尤為關(guān)鍵的是主要發(fā)音合作人。語(yǔ)保工程民語(yǔ)調(diào)研專項(xiàng)任務(wù)實(shí)施進(jìn)程中不同語(yǔ)言及方言調(diào)研點(diǎn)發(fā)音合作人遴選條件存在一定的差異,大致可分為以下幾類情況:

        A.發(fā)音合作人的遴選有較為充分的選擇余地,甚至在某些調(diào)研點(diǎn)可海選;具體來(lái)說(shuō),除了少量借詞和絕對(duì)缺失詞匯外,可圓滿完成詞匯采集任務(wù);尤其是口頭文化語(yǔ)料采集方面的發(fā)音合作人的遴選可做到精選,提供的語(yǔ)料內(nèi)容異常豐富,樣式齊全且多樣,音像攝錄過(guò)程十分順利。

        B.有較多符合條件的發(fā)音合作人,也有一定的選擇余地,但稍需花費(fèi)一些時(shí)間與精力;上述幾個(gè)環(huán)節(jié)的語(yǔ)料采集和音像攝錄工作一般也較為順利。

        C.符合條件的主要發(fā)音合作人有限,且某些調(diào)研點(diǎn)需要適當(dāng)放寬諸如年齡、性別或文化程度等條件;上述幾個(gè)環(huán)節(jié)中,詞匯部分有一部分抽象詞匯缺失現(xiàn)象,口頭文化部分提供的語(yǔ)料內(nèi)容和形式都有一定局限性。有些調(diào)研點(diǎn)課題組與發(fā)音合作人的音像攝錄磨合過(guò)程較長(zhǎng)。

        D.符合部分條件的發(fā)音合作人很有限,且單人無(wú)法承擔(dān)主要發(fā)音合作人需完成的全部任務(wù),需要數(shù)個(gè)人合作才能完成部分任務(wù);因詞匯缺失現(xiàn)象較為嚴(yán)重,口頭文化材料內(nèi)容和形式較為單一,無(wú)法采集到足量的語(yǔ)料;音像攝錄也困難重重。

        E.符合部分條件的發(fā)音合作人也很難覓,僅存的數(shù)量有限的自然母語(yǔ)人也或因年事已高、身體多病、發(fā)音器官患病及其他原因無(wú)法配合課題組的音像攝錄工作,課題組不得已在部分“學(xué)得”母語(yǔ)人中尋找到符合部分條件的發(fā)音合作人,所提供的各類語(yǔ)料在各方面都存在一定局限性。

        另外,諸如崩如、蘇龍等數(shù)種瀕危語(yǔ)言因無(wú)法尋覓到符合條件的發(fā)音合作人,無(wú)條件立項(xiàng);臺(tái)灣語(yǔ)群除阿美語(yǔ)和鄒語(yǔ)外的10余種瀕危語(yǔ)言也因各種原因未能列入語(yǔ)保工程一期調(diào)研計(jì)劃。

        上述發(fā)音人遴選過(guò)程中出現(xiàn)的情況分別涵蓋了不同的語(yǔ)言:其中,A類一般可涵蓋蒙古、藏、維吾爾、哈薩克、朝鮮、壯、傣等數(shù)個(gè)具有傳統(tǒng)文字或布依、哈尼、白等幾個(gè)新創(chuàng)文字且人口數(shù)量較多民族的語(yǔ)言;B類包括彝、苗、侗、拉祜、傈僳、黎、水等人口數(shù)量較多、方言分歧較大的民族語(yǔ)言;C類絕大多數(shù)是人口較少民族中仍保持一定活力的語(yǔ)言,其中僅有錫伯、柯?tīng)柨俗?、景頗、土族等幾種語(yǔ)言有文字,其余全部是無(wú)文字語(yǔ)言;D類大多是有一定瀕危跡象的語(yǔ)言,如烏孜別克、塔塔爾、圖瓦、東部裕固、西部裕固、保安、康加、鄂倫春、鄂溫克、俄羅斯、門(mén)巴等民族的語(yǔ)言,也包括臺(tái)灣絕大多數(shù)南島語(yǔ)系的語(yǔ)言;E類則涵蓋了滿、土家、赫哲等語(yǔ)言,也包括一部分南島語(yǔ)系臺(tái)灣語(yǔ)群的羿、卡那卡那富、沙阿魯阿、巴則海、邵等語(yǔ)言。

        由于不同語(yǔ)言因各種情況存在的許多差異,以上歸類具有一定相對(duì)性。因每一種語(yǔ)言甚至方言土語(yǔ)間內(nèi)部也存在著各種不平衡現(xiàn)象,某些語(yǔ)言的下位分類還需參照相關(guān)條件有待進(jìn)一步確認(rèn)。

        (三)相關(guān)分析

        語(yǔ)保工程民語(yǔ)調(diào)研專項(xiàng)任務(wù)相關(guān)數(shù)據(jù)統(tǒng)計(jì)顯示,漢藏語(yǔ)系約占設(shè)點(diǎn)總數(shù)的73.66%,是中國(guó)語(yǔ)言數(shù)量最多的語(yǔ)系。其次是阿爾泰語(yǔ)系,約占設(shè)點(diǎn)總數(shù)的16.83%。兩個(gè)語(yǔ)系設(shè)點(diǎn)約占總數(shù)的90.49%。而各語(yǔ)族設(shè)點(diǎn)數(shù)據(jù)統(tǒng)計(jì)顯示,各語(yǔ)族占比依序?yàn)椋簼h藏語(yǔ)系藏緬語(yǔ)族、壯侗語(yǔ)族、苗瑤語(yǔ)族,阿爾泰語(yǔ)系突厥語(yǔ)族與蒙古語(yǔ)族、南亞語(yǔ)系孟高棉語(yǔ)族、阿爾泰語(yǔ)系滿-通古斯語(yǔ)族。以上統(tǒng)計(jì)數(shù)據(jù)同時(shí)也反映了中國(guó)少數(shù)民族語(yǔ)言分布的基本情況。從總體上看,北方民族語(yǔ)言中除了蒙古語(yǔ)、維吾爾語(yǔ)等個(gè)別語(yǔ)言外,其他語(yǔ)言基本完成了規(guī)劃的布點(diǎn)任務(wù)。漢藏語(yǔ)系中,藏緬語(yǔ)族、苗瑤語(yǔ)族等因方言、次方言、土語(yǔ)間分歧較大,尤其是藏緬語(yǔ)族中彝緬語(yǔ)支的彝語(yǔ)分六大方言,數(shù)十種次方言,還有諸多土語(yǔ),目前布點(diǎn)密度仍顯不足。苗語(yǔ)和瑤語(yǔ)的情況則較為復(fù)雜,除了語(yǔ)言內(nèi)部方言分歧大導(dǎo)致無(wú)法交流外,苗族與瑤族內(nèi)部不同支系間甚至語(yǔ)言兼用,瑤族內(nèi)部不同支系還使用不同的語(yǔ)言。盡管如此,語(yǔ)保工程民語(yǔ)調(diào)研專項(xiàng)任務(wù)所獲語(yǔ)料資源已形成了龐大的數(shù)據(jù)信息,基于補(bǔ)充采集相關(guān)語(yǔ)料的基礎(chǔ)上進(jìn)行統(tǒng)一開(kāi)發(fā)應(yīng)用的條件業(yè)已成熟。

        另外,從發(fā)音合作人遴選過(guò)程中透露的語(yǔ)言資源保持類型的差異給我們提供了少數(shù)民族語(yǔ)言資源進(jìn)行開(kāi)發(fā)應(yīng)用的重要依據(jù)。我們將各調(diào)研點(diǎn)發(fā)音合作人遴選的具體情況和各類語(yǔ)言資源的情況綜合分析如下:A類語(yǔ)言因人口數(shù)量較大,普遍具有悠久的傳統(tǒng)文字或新創(chuàng)文字,積累了大量的歷史文獻(xiàn),有較早的母語(yǔ)教育史或雙語(yǔ)教育體系,加之國(guó)家長(zhǎng)期的推進(jìn)和整體的建設(shè),其本體規(guī)范化程度已達(dá)到很高的水平。B類語(yǔ)言多為新創(chuàng)文字語(yǔ)言,部分因其內(nèi)部方言或土語(yǔ)差異較大,各語(yǔ)言間規(guī)范化程度不一,無(wú)法對(duì)同一種語(yǔ)言甚至不同方言實(shí)施統(tǒng)一的開(kāi)發(fā)應(yīng)用方案。C類包括大部分人口較少民族的語(yǔ)言,因人口數(shù)量少、居住分散、多數(shù)沒(méi)有文字等多種原因,尤其是內(nèi)部民族內(nèi)部母語(yǔ)實(shí)際使用人數(shù)較少,各語(yǔ)言保護(hù)及本體化程度差強(qiáng)人意,有一定母語(yǔ)資源開(kāi)發(fā)應(yīng)用的潛力及空間,但需考慮人口居住分散等情況應(yīng)實(shí)施先保護(hù)、后開(kāi)發(fā)應(yīng)用的方案。D類和E類包括了所有瀕危語(yǔ)言,因普遍處于嚴(yán)重的衰變狀態(tài),當(dāng)務(wù)之急是語(yǔ)言資源的搶救性保護(hù)。從以上相關(guān)數(shù)據(jù)和材料來(lái)推斷,A類語(yǔ)言資源具備深度開(kāi)發(fā)應(yīng)用的基本條件,且極具產(chǎn)業(yè)化的潛力。B類語(yǔ)言資源中有一部分也具有深度開(kāi)發(fā)應(yīng)用的條件,但可能還存在不足,如方言間需進(jìn)一步深度規(guī)范化。另一部分語(yǔ)言則需要解決方言間無(wú)法溝通交流的問(wèn)題后實(shí)施不同的開(kāi)發(fā)應(yīng)用方案。C類語(yǔ)言資源開(kāi)發(fā)基礎(chǔ)較為薄弱,還需要繼續(xù)打造和夯實(shí)基礎(chǔ)之后再將開(kāi)發(fā)應(yīng)用的問(wèn)題提到議事日程上。對(duì)此類中有文字的數(shù)種語(yǔ)言則可以采取邊積累邊開(kāi)發(fā)的辦法。D、E類語(yǔ)言資源則亟待深度典藏性保護(hù)。由此,我們認(rèn)為,在中國(guó)少數(shù)民族資源的統(tǒng)一開(kāi)發(fā)的基礎(chǔ)上,針對(duì)不同語(yǔ)言資源保持類型的少數(shù)民族語(yǔ)言的開(kāi)發(fā)應(yīng)用還應(yīng)同時(shí)實(shí)施分類梯次開(kāi)發(fā)方案。

        二、關(guān)于整體統(tǒng)一開(kāi)發(fā)應(yīng)用的問(wèn)題

        (一)大數(shù)據(jù)研發(fā)及應(yīng)用

        語(yǔ)保工程民語(yǔ)語(yǔ)料資源具有大數(shù)據(jù)研究的多元可比性、應(yīng)用開(kāi)發(fā)性、可持續(xù)性(丁石慶2018),這將成為少數(shù)民族語(yǔ)言資源開(kāi)發(fā)應(yīng)用最核心的,也是極具潛力的挖掘重點(diǎn)。雖然目前的語(yǔ)料資源在大數(shù)據(jù)的學(xué)術(shù)研究方面還存在一定的局限性,如縱向性的歷史比較對(duì)比方面條件還不甚成熟,但橫向的共時(shí)比較或?qū)Ρ妊芯窟€是有很大空間的。如1200條通用詞可開(kāi)展同語(yǔ)系的詞匯比較研究或不同語(yǔ)系間的對(duì)比研究;以語(yǔ)族為單位的1800條擴(kuò)展詞加上1200條通用詞共計(jì)3000條詞匯可為同語(yǔ)族少數(shù)民族語(yǔ)言之間的初步比較研究提供可能。此外,經(jīng)過(guò)擴(kuò)展后的語(yǔ)料資源也可為在線詞典、在線教材、語(yǔ)言地圖集的編制提供基礎(chǔ)。經(jīng)長(zhǎng)期建設(shè)的語(yǔ)保工程民語(yǔ)語(yǔ)料資源還可持續(xù)地為語(yǔ)言學(xué)及相關(guān)專業(yè)的本科生、碩士生、博士生撰寫(xiě)學(xué)位論文提供選題,并同時(shí)為少數(shù)民族語(yǔ)言資源的深度開(kāi)發(fā)和應(yīng)用貢獻(xiàn)力量。

        中國(guó)少數(shù)民族語(yǔ)言的識(shí)別和方言、土語(yǔ)的劃分等雖然經(jīng)過(guò)近百年數(shù)代人的努力,取得了目前的成就,但仍存在一些遺留問(wèn)題,甚至還因語(yǔ)言的系屬定位、語(yǔ)言身份定性等方面在國(guó)內(nèi)外語(yǔ)言學(xué)界始終存在著較大分歧(孫宏開(kāi)2005,2013;黃行2018)。少數(shù)民族語(yǔ)言資源的深度開(kāi)發(fā)應(yīng)用將為此提供大數(shù)據(jù)支持,也將有極大的可能通過(guò)大量有力的佐證而達(dá)成國(guó)內(nèi)外語(yǔ)言學(xué)界的共識(shí)。極具特殊的學(xué)術(shù)研究?jī)r(jià)值的混合語(yǔ)一直也是國(guó)內(nèi)外語(yǔ)言學(xué)界長(zhǎng)期爭(zhēng)論的焦點(diǎn),主要涉及其概念、性質(zhì)、特征等內(nèi)容。民語(yǔ)語(yǔ)料資源中的6種混合語(yǔ)樣本將為此提供個(gè)案及對(duì)比樣本,也將為學(xué)界進(jìn)行充分甄別、定性、定位等研究提供相關(guān)數(shù)據(jù)和語(yǔ)料支持。

        (二)智能化軟件與文創(chuàng)產(chǎn)品研發(fā)及應(yīng)用

        少數(shù)民族語(yǔ)言資源的開(kāi)發(fā)應(yīng)用是一項(xiàng)極其繁重的工作,僅語(yǔ)料的標(biāo)音、翻譯、標(biāo)注等工作,就需要耗費(fèi)大量時(shí)間、精力。由于語(yǔ)保工程一期相關(guān)軟件開(kāi)發(fā)應(yīng)用的滯后,許多語(yǔ)保人在模板整理的工作中耗費(fèi)了大量時(shí)間和精力,苦不堪言。雖然目前情況有很大改善,但某些軟件仍存在各種不太適合民語(yǔ)語(yǔ)料資源的整理和開(kāi)發(fā)應(yīng)用的問(wèn)題,還需進(jìn)行改進(jìn)和磨合。因此,語(yǔ)保工程尤其是“后語(yǔ)?!睍r(shí)期,少數(shù)民族語(yǔ)言資源的保護(hù)及開(kāi)發(fā)應(yīng)用迫切需要相關(guān)的各種軟件,以節(jié)省大量的人力與時(shí)間。

        簡(jiǎn)言之,語(yǔ)言資源的開(kāi)發(fā)利用應(yīng)“與時(shí)俱進(jìn)”地共享現(xiàn)代科技和互聯(lián)網(wǎng)經(jīng)濟(jì)帶來(lái)的各種便利條件和先進(jìn)手段,如通過(guò)各種新媒體形式、網(wǎng)絡(luò)、手機(jī)APP應(yīng)用軟件等助力語(yǔ)言資源的開(kāi)發(fā)利用。編撰各種音像同步,圖文聲并茂的教材、數(shù)字詞典、APP詞典等,詞典也應(yīng)努力開(kāi)發(fā)為多種語(yǔ)言對(duì)照,并附上音頻或視頻例句,也可在新媒體平臺(tái)上將目標(biāo)語(yǔ)言的數(shù)字化信息及音視頻資料予以開(kāi)放,為需求方提供各種服務(wù)。構(gòu)建內(nèi)容涵蓋民族學(xué)、人類學(xué)、語(yǔ)言學(xué)、宗教學(xué)、教育學(xué)、文化學(xué)、旅游學(xué)等多行業(yè)的領(lǐng)域知識(shí)圖譜,實(shí)現(xiàn)多領(lǐng)域多學(xué)科知識(shí)的多維度關(guān)聯(lián)與信息共享,滿足相關(guān)領(lǐng)域的不同需求。開(kāi)展諸如自然語(yǔ)言理解、人工智能、智慧系統(tǒng)建設(shè)等特定語(yǔ)言服務(wù)產(chǎn)品的研發(fā),其成果也將反哺少數(shù)民族語(yǔ)言資源的開(kāi)發(fā)應(yīng)用事業(yè)。

        另外,中國(guó)少數(shù)民族語(yǔ)言資源復(fù)雜多樣的特征決定了少數(shù)民族語(yǔ)言資源開(kāi)發(fā)后的應(yīng)用也具有多元性。其中,少數(shù)民族語(yǔ)言資源開(kāi)發(fā)應(yīng)用的語(yǔ)言服務(wù)領(lǐng)域十分廣闊,也極具發(fā)展前景,同時(shí)兼具社會(huì)效益與經(jīng)濟(jì)效益,最易形成語(yǔ)言產(chǎn)業(yè)。而最具潛力的是民族語(yǔ)言資源的翻譯,這也是目前在開(kāi)發(fā)上取得初步規(guī)模并在應(yīng)用上已初見(jiàn)成效的一個(gè)領(lǐng)域。此外,面向國(guó)家和社會(huì)安全領(lǐng)域,國(guó)家安全需求的公安刑偵語(yǔ)言系統(tǒng)、語(yǔ)言特征鑒別系統(tǒng)的少數(shù)民族語(yǔ)言資源的應(yīng)用也具有極大空間,并將在維護(hù)國(guó)家和社會(huì)安全等方面做出應(yīng)有的貢獻(xiàn)。

        少數(shù)民族語(yǔ)言資源的開(kāi)發(fā)應(yīng)用還可為國(guó)家民族語(yǔ)文政策、中國(guó)語(yǔ)言國(guó)情、國(guó)家語(yǔ)言安全等多個(gè)領(lǐng)域提供咨詢服務(wù)。如對(duì)近年來(lái)國(guó)家的語(yǔ)言政策發(fā)生的變化予以大力宣傳和科學(xué)解讀,尤其是通用語(yǔ)與少數(shù)民族的關(guān)系問(wèn)題和民族地區(qū)的雙語(yǔ)教育問(wèn)題等,亟待基于少數(shù)民族語(yǔ)言資源保護(hù)及開(kāi)發(fā)應(yīng)用的成果提供更多的科學(xué)依據(jù)。

        三、關(guān)于分類開(kāi)發(fā)應(yīng)用的問(wèn)題

        (一) A類語(yǔ)言

        語(yǔ)言翻譯層面上的開(kāi)發(fā)應(yīng)用在A類及部分B類少數(shù)民族語(yǔ)言資源中可謂獨(dú)占鰲頭。尤其是數(shù)種具有傳統(tǒng)通用文字的民族語(yǔ)言,因已有雄厚的資源積累及開(kāi)發(fā)基礎(chǔ),極具廣闊的深度開(kāi)發(fā)應(yīng)用前景。其中,“中國(guó)民族語(yǔ)文翻譯局(中心)”作為國(guó)家級(jí)民族語(yǔ)文翻譯機(jī)構(gòu),一直致力于民族語(yǔ)文軟件的研發(fā)與推廣應(yīng)用工作,已陸續(xù)完成了蒙古文、藏文、維吾爾文、哈薩克文、朝鮮文、彝文、壯文(新創(chuàng)文字)等7種民族語(yǔ)文電子詞典及輔助翻譯軟件。目前,蒙古、藏、維吾爾、哈薩克、朝鮮、彝、傣、壯等數(shù)種具有文字傳統(tǒng)的民族語(yǔ)言資源已經(jīng)在標(biāo)準(zhǔn)化、規(guī)范化、信息化等“三化”方面取得了較好的業(yè)績(jī),并在翻譯、編輯、出版等方面積累了大量的資源,有的已經(jīng)出現(xiàn)了大量相關(guān)的語(yǔ)言資源衍生品。民族語(yǔ)文智能翻譯,特別是智能語(yǔ)音翻譯的深入研發(fā),也已列入“十三五”期間國(guó)家語(yǔ)言文字工作、民族工作、信息化工作的重點(diǎn)內(nèi)容。近期,已有蒙古、藏、維吾爾、哈薩克、朝鮮、彝、壯等7種民族語(yǔ)文近40款機(jī)器翻譯軟件相繼研發(fā)成功并推廣應(yīng)用,受到社會(huì)各界廣泛好評(píng)(江白2018)。近期,中國(guó)民族語(yǔ)文翻譯中心與內(nèi)蒙古蒙科立蒙古文化股份有限公司舉行了戰(zhàn)略合作簽約儀式,蒙古語(yǔ)文人工智能技術(shù)也已經(jīng)提到議事日程上來(lái)。其中涉及蒙古語(yǔ)文人工智能技術(shù)合作及產(chǎn)品研制推廣等相關(guān)內(nèi)容。語(yǔ)言翻譯的產(chǎn)業(yè)化過(guò)程也將帶動(dòng)諸如民族語(yǔ)言教育、民族語(yǔ)言出版、民族語(yǔ)言測(cè)試等領(lǐng)域資源的開(kāi)發(fā)和應(yīng)用。

        (二) B類語(yǔ)言

        B類語(yǔ)言中包括部分人口數(shù)量較多的民族,也包括了部分人口數(shù)量不多但有新創(chuàng)文字的民族,如布依族、苗族、侗族、哈尼族、傈僳族等使用的是中華人民共和國(guó)成立后新創(chuàng)制的拉丁字母文字。另外,因考慮到某些語(yǔ)言的內(nèi)部方言甚至土語(yǔ)間分歧較大,根據(jù)不同的語(yǔ)言的情況還創(chuàng)制了多種文字,如苗族有黔東苗文、湘西苗文、川黔滇苗文、滇東北苗文共4種文字。新創(chuàng)文字為上述民族的語(yǔ)言資源傳承和保護(hù)起到了重要作用。但鑒于上述情況,該類語(yǔ)言適宜以不同方言為單位實(shí)施個(gè)性化開(kāi)發(fā)應(yīng)用方案。

        (三) C類語(yǔ)言

        此類語(yǔ)言中,包括了部分有傳統(tǒng)文字的民族,如柯?tīng)柨俗巫?、錫伯族、俄羅斯族;也包括部分擁有新創(chuàng)文字的民族,如土族、景頗族。也有部分不屬于人口較少民族的東鄉(xiāng)族、仡佬族、拉祜族、佤族、水族、納西族等。這幾個(gè)民族的人口數(shù)量在31萬(wàn)至70萬(wàn)之間,整體仍顯人口偏少。其語(yǔ)言因使用人口較少,大多數(shù)都主要在家庭語(yǔ)言環(huán)境中使用,缺少社區(qū)這樣的語(yǔ)言強(qiáng)化群體氛圍,導(dǎo)致傳承進(jìn)程中出現(xiàn)各種缺失或磨蝕現(xiàn)象。母語(yǔ)個(gè)體僅在家庭環(huán)境中熏陶和成長(zhǎng),可能會(huì)獲得并鞏固其母語(yǔ)能力,但從語(yǔ)言能力發(fā)展來(lái)說(shuō)還需要一個(gè)重要環(huán)節(jié),就是母語(yǔ)能力的強(qiáng)化過(guò)程。母語(yǔ)的強(qiáng)化有多種途徑,包括社區(qū)母語(yǔ)環(huán)境、母語(yǔ)的書(shū)面形式——文字、學(xué)校母語(yǔ)文教育、使用母語(yǔ)的各種媒體形式等。就個(gè)體成長(zhǎng)的單一的家庭母語(yǔ)環(huán)境來(lái)說(shuō),社區(qū)環(huán)境無(wú)疑是母語(yǔ)個(gè)體更大的語(yǔ)言操練課堂。在這個(gè)更大的母語(yǔ)環(huán)境中,母語(yǔ)個(gè)體的口語(yǔ)能力會(huì)得到進(jìn)一步的實(shí)質(zhì)性提升和拓展。一般來(lái)說(shuō),享有一定社會(huì)地位且母語(yǔ)個(gè)體數(shù)量占優(yōu)勢(shì)的社區(qū)環(huán)境里,母語(yǔ)的使用密度相對(duì)較大,使用頻度也高。這樣,無(wú)形中就營(yíng)造了一個(gè)良好的社區(qū)母語(yǔ)環(huán)境,個(gè)體在家庭氛圍內(nèi)獲得的母語(yǔ)在更大的語(yǔ)言交往環(huán)境中得到了進(jìn)一步鞏固和強(qiáng)化。

        (四) D、E類語(yǔ)言

        這兩類語(yǔ)言中除了人口數(shù)量較多但趨于衰亡的滿族和土家族這兩種語(yǔ)言外,絕大多數(shù)是5萬(wàn)以下的人口較少民族,除俄羅斯族以外均無(wú)文字,總數(shù)上超過(guò)了30種。整體特征表現(xiàn)為母語(yǔ)使用人口稀少,絕大多數(shù)母語(yǔ)人普遍年齡老化,家庭和社區(qū)母語(yǔ)環(huán)境缺失而導(dǎo)致代際傳承出現(xiàn)嚴(yán)重危機(jī)。這兩類語(yǔ)言的當(dāng)務(wù)之急是搶救性保護(hù)現(xiàn)存的活態(tài)語(yǔ)料,并加速完成語(yǔ)言文化典藏的語(yǔ)料采集和瀕危語(yǔ)言志的撰寫(xiě)任務(wù)。

        四、結(jié) 語(yǔ)

        (一)語(yǔ)保工程一期民語(yǔ)調(diào)研專項(xiàng)任務(wù)所獲巨量少數(shù)民族語(yǔ)料資源數(shù)據(jù),反映了中國(guó)少數(shù)民族語(yǔ)言資源的分布上以漢藏語(yǔ)系和阿爾泰語(yǔ)系語(yǔ)言為主,從各調(diào)研點(diǎn)發(fā)音合作人遴選過(guò)程中透露的信息體現(xiàn)了不同類別的語(yǔ)言間語(yǔ)言資源保持類型上存在著顯著差異,這些數(shù)據(jù)及相關(guān)信息為我們進(jìn)行后續(xù)工作推進(jìn)提供了可靠信息和科學(xué)依據(jù)。

        (二)基于相關(guān)調(diào)研數(shù)據(jù)所提供的信息,并根據(jù)實(shí)際情況,中國(guó)少數(shù)民族語(yǔ)言資源的開(kāi)發(fā)應(yīng)用可采用整體統(tǒng)一開(kāi)發(fā)和分類開(kāi)發(fā)兩種思路。統(tǒng)一開(kāi)發(fā)主要聚焦于大數(shù)據(jù)研發(fā)及服務(wù)、智能化軟件及文創(chuàng)產(chǎn)品的研發(fā)應(yīng)用等方面。分類開(kāi)發(fā)則應(yīng)著眼于語(yǔ)言資源保持類型的不同特點(diǎn),實(shí)施深度開(kāi)發(fā)應(yīng)用、深度規(guī)范性的開(kāi)發(fā)應(yīng)用、深度保護(hù)性開(kāi)發(fā)應(yīng)用及深度典藏性開(kāi)發(fā)應(yīng)用等。

        (三)中國(guó)少數(shù)民族語(yǔ)言資源的開(kāi)發(fā)應(yīng)用的長(zhǎng)遠(yuǎn)規(guī)劃和具體實(shí)施方案必須秉持實(shí)事求是的態(tài)度,依據(jù)相關(guān)數(shù)據(jù)和信息,力求做到精準(zhǔn)、科學(xué)、可行,避免一刀切或削足適履的做法。

        (四)語(yǔ)言資源開(kāi)發(fā)應(yīng)用是一個(gè)系統(tǒng)工程,也是一項(xiàng)長(zhǎng)期的人文關(guān)懷工程。需要參與各方秉持工匠精神,擁有人文情懷,齊心協(xié)力,同舟共濟(jì)。在夯實(shí)語(yǔ)言資源保護(hù)與開(kāi)發(fā)應(yīng)用基礎(chǔ)之上,統(tǒng)一認(rèn)識(shí),更新理念,整合資源,科學(xué)規(guī)劃,積極探索可持續(xù)發(fā)展的新路徑。

        參考文獻(xiàn)

        戴慶廈 1993 《跨境語(yǔ)言研究》,北京:中央民族學(xué)院出版社。

        丁石慶 2018 《中國(guó)語(yǔ)言資源保護(hù)工程民語(yǔ)語(yǔ)料資源的質(zhì)量、價(jià)值和效用——以少數(shù)民族語(yǔ)言為例》,《暨南學(xué)報(bào)》第5期。

        黃 行 2018 《中國(guó)民族語(yǔ)言識(shí)別:分歧及成因》,《語(yǔ)言戰(zhàn)略研究》第2期。

        黃 行,許 峰 2013 《我國(guó)與周邊國(guó)家跨境語(yǔ)言的基本情況與問(wèn)題》,《中國(guó)語(yǔ)情》第3期。

        江 白 2018 《中國(guó)民族語(yǔ)文翻譯局藏文智能翻譯軟件發(fā)布會(huì)在成都舉行》,http://www.tibet.cn/cn/news/yc/201806/t20180606_5916359.html。

        孫宏開(kāi) 2005 《用科學(xué)的眼光看待我國(guó)的語(yǔ)言識(shí)別問(wèn)題》,《語(yǔ)言文字應(yīng)用》第3期。

        孫宏開(kāi) 2013 《關(guān)于語(yǔ)言身份的識(shí)別問(wèn)題》,《語(yǔ)言科學(xué)》第5期。

        周慶生 2013 《中國(guó)跨境少數(shù)民族語(yǔ)言類型及人口狀況》,《中國(guó)語(yǔ)情》第3期。

        朱艷華 2016 《論跨境語(yǔ)言資源保護(hù)》,《貴州民族研究》第3期。

        責(zé)任編輯:魏曉明

        猜你喜歡
        開(kāi)發(fā)應(yīng)用統(tǒng)一分類
        堅(jiān)持嚴(yán)管和厚愛(ài)相統(tǒng)一的著力點(diǎn)
        活力(2021年6期)2021-08-05 07:23:54
        分類算一算
        碑和帖的統(tǒng)一,心和形的統(tǒng)一,人和藝的統(tǒng)一
        分類討論求坐標(biāo)
        統(tǒng)一數(shù)量再比較
        數(shù)據(jù)分析中的分類討論
        教你一招:數(shù)的分類
        計(jì)算機(jī)軟件工程的管理和開(kāi)發(fā)應(yīng)用研究
        科學(xué)家(2016年3期)2016-12-30 00:40:36
        基于智能電網(wǎng)AMI的智能電表系統(tǒng)開(kāi)發(fā)應(yīng)用
        科學(xué)課堂教學(xué)材料的開(kāi)發(fā)及應(yīng)用
        国产成人无码综合亚洲日韩| 人人爽亚洲aⅴ人人爽av人人片| 日本人妻少妇精品视频专区| 成a人片亚洲日本久久| 亚洲高清国产一区二区| 中文字幕精品一区二区精品| 天天鲁一鲁摸一摸爽一爽| 国产一级免费黄片无码AV| 日韩精品一区二区亚洲av性色| 中文字幕日韩精品人妻久久久| 高级会所技师自拍视频在线| 亚洲国产精品一区二区www| 亚洲国产成人久久一区www| 日本专区一区二区三区| 日韩av他人妻中文字幕| 日本免费一二三区在线| 精品视频一区二区三区在线观看 | 亚洲制服无码一区二区三区| 亚洲综合久久久中文字幕| 日本一区二区免费高清| 看久久久久久a级毛片| 波多野结衣乳巨码无在线| 妺妺窝人体色www聚色窝| 日韩午夜三级在线视频| av一区二区三区在线| 小鲜肉自慰网站| 无码国产精品第100页| 操老熟妇老女人一区二区| 成年人观看视频在线播放| 大肉大捧一进一出好爽视频| 色综合久久无码中文字幕app| 成av人片一区二区三区久久| 虎白m粉嫩小在线播放| 天天躁日日躁狠狠躁| 免费毛片视频网站| 久久国产精品国产精品久久| 国产91色综合久久高清| 久久天天躁狠狠躁夜夜2020一| 精品人妻VA出轨中文字幕| 成人性生交c片免费看| 日韩中文字幕版区一区二区三区|