亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        認(rèn)知體驗(yàn)觀視閾下少數(shù)民族多模態(tài)語言檔案數(shù)據(jù)庫建設(shè)思考

        2021-04-06 03:31:02王金海孟子惠
        檔案管理 2021年2期
        關(guān)鍵詞:檔案管理

        王金海 孟子惠

        摘? 要:本文基于認(rèn)知體驗(yàn)觀和多模態(tài)語言理論,結(jié)合少數(shù)民族語言檔案管理的特殊性,分析多模態(tài)民族語言檔案數(shù)據(jù)庫建設(shè)的必要性,探討多模態(tài)民族語言檔案數(shù)據(jù)庫的基本構(gòu)成,并以音頻語言檔案數(shù)據(jù)庫的建設(shè)為例,提出建設(shè)該類檔案數(shù)據(jù)庫的基本步驟,以期對我國少數(shù)民族語言檔案管理工作和相關(guān)研究的開展提供借鑒思路。

        關(guān)鍵詞:認(rèn)知體驗(yàn)觀;檔案管理;少數(shù)民族語言檔案;多模態(tài)語言;檔案數(shù)據(jù)庫

        Abstract: In this paper, basing on the theory of cognitive experience and multimodal language, combing with the particularity of minority language Archives management, analyzing of multimodal national language Archives database construction, the necessity of multimodal nation language basic structure of the database Archives, and audio language Archives for the construction of the database, for example, building the basic steps of the class Archives database, in order to minority language Archival management in our country and the development of related research to provide reference ideas.

        Keywords: Cognitive experience view; Archives management; Archives of minority languages; Multimodal language;? Archive database

        本文基于認(rèn)知體驗(yàn)觀和多模態(tài)語言理論對少數(shù)民族語言檔案數(shù)據(jù)庫建設(shè)的認(rèn)知基礎(chǔ)、必要性及具體建設(shè)等問題展開探討。

        1 少數(shù)民族多模態(tài)語言檔案管理的必要性

        據(jù)統(tǒng)計(jì),國內(nèi)現(xiàn)存民族語言達(dá)120余種之多,其中,有近30種還兼具文字使用,尤以維文、壯文、蒙文、藏文及哈薩克文等最具影響力。這些語言歷時(shí)悠久,底蘊(yùn)深厚,在本語族內(nèi)通常與漢語共存使用,并行不悖,較為廣泛地運(yùn)用于廣播傳媒、科教出版及公共管理等社會生活的眾多領(lǐng)域。

        然而,研究顯示,我國境內(nèi)已有近50種民族語言處于嚴(yán)重瀕危,9種民族語言已經(jīng)消亡。[1]這無疑對少數(shù)民族文字檔案的管理提出了巨大挑戰(zhàn)??梢?,對少數(shù)民族特殊語言環(huán)境下非通用語言的檔案管理顯得格外重要。

        當(dāng)前我國各少數(shù)民族地區(qū)的檔案管理機(jī)關(guān)多已開展本民族文字檔案的收集和整理。但囿于少數(shù)民族地區(qū)語言和社會環(huán)境的特異性,相較通用語言檔案,民族語言檔案管理在多樣性上要求更高。

        單純以文字形式保存的語言檔案,在精確性和可利用性上均存在一定弊端,這在一定程度上限制了少數(shù)民族語言檔案管理工作的有效開展,勢必會對我國多民族文化的可持續(xù)保護(hù)和傳承產(chǎn)生不良影響??茖W(xué)管理少數(shù)民族語言檔案既是我國語言檔案管理不可或缺的重要內(nèi)容,也是語言檔案管理的艱巨任務(wù)。

        在各少數(shù)民族的語言檔案中,其中有一部分是以口頭形式呈現(xiàn),如口述的神話、傳說、詩歌及諺語等,還有相當(dāng)部分則是以書面形式記錄,如正式出版的書籍、官方檔案及民間文書等。

        到了近現(xiàn)代,部分語言文字檔案開始以音視頻的形式出現(xiàn),主要涉及相關(guān)訪談、民族發(fā)展中成果的圖片影像資料整理等。音視頻格式的語言檔案資料在新時(shí)期檔案管理工作中已越來越多見,但在早期語言文字檔案資料的管理中尚不多見。

        早期檔案以口頭和書面形式居多,并有部分檔案面臨缺損或流失的問題,亟待重新整理。對早期語言文字檔案的管理是民族檔案管理工作中最有價(jià)值,也最有難度的一部分。

        考慮到少數(shù)民族語言文化的特殊性,單純口頭或書面的記錄既不利于相關(guān)檔案的精準(zhǔn)記錄,也不利于后期的有效利用和傳承。

        筆者查閱相關(guān)文獻(xiàn)發(fā)現(xiàn),在方言檔案建設(shè)方面,浙江方言語音檔案建設(shè)工程曾對68 個(gè)方言的語音、詞匯、說唱及戲曲等方面建立了音視頻檔案庫。

        相較民間口傳或文字記錄等傳統(tǒng)方言檔案記錄形式,音視頻檔案庫的建設(shè)無疑對搶救和完善方言資源和區(qū)域文化具有積極意義;在少數(shù)民族語言檔案建設(shè)方面,漢藏同源詞研究系統(tǒng)收錄了漢藏語系中包括少數(shù)民族語言在內(nèi)的12 種漢語方言和122 種語言中最具代表性的1500 余條詞匯,但僅以文字形式記錄。

        中國社會科學(xué)院建設(shè)的漢語、蒙語、維語和藏語民族語言資料庫僅涉及781篇文章的文本信息,且多數(shù)年代久遠(yuǎn)的語言檔案存在語音信息不同程度的缺失等問題,借助圖像、視頻等現(xiàn)代技術(shù)手段全方位展示語言檔案信息的管理形式顯著不足,這直接導(dǎo)致現(xiàn)有老舊語言文字檔案的精準(zhǔn)度和可利用度存在嚴(yán)重缺陷。[2]

        相反,與傳統(tǒng)語言檔案不同,多模態(tài)語言檔案更強(qiáng)調(diào)不同模態(tài)語言間的整合關(guān)系,旨在通過搭建跨模態(tài)框架,借助多種感官體驗(yàn)的認(rèn)知疊加更精準(zhǔn)地記錄和傳播信息,使各模態(tài)間相互組配,相互促進(jìn),從而達(dá)到語言信息結(jié)構(gòu)的最優(yōu)存儲。因此,對民族語言檔案,特別是早期語言檔案信息的多模態(tài)存檔擴(kuò)容就顯得尤為必要。

        加快少數(shù)民族語言檔案,特別是瀕危語言檔案的多模態(tài)檔案數(shù)據(jù)庫建設(shè),探索民族地區(qū)語言檔案管理的新模式,可以有效保護(hù)和搶救少數(shù)民族文化,從而使語言檔案資源能更好地服務(wù)社會文化發(fā)展。

        總體上,目前我國少數(shù)民族多模態(tài)語言檔案建設(shè)尚處于探索階段,亟待完善。隨著現(xiàn)代信息技術(shù)的發(fā)展和大數(shù)據(jù)時(shí)代的來臨,我國的檔案現(xiàn)代化建設(shè)不斷推進(jìn),這為由文字、圖片、音頻及視頻綜合架構(gòu)的多模態(tài)語言檔案數(shù)據(jù)庫建設(shè)提供了更多可能性。[3]

        2 多模態(tài)語言檔案數(shù)據(jù)庫的基本構(gòu)成和建設(shè)

        2.1 多模態(tài)語言檔案數(shù)據(jù)庫的基本構(gòu)成

        2.1.1 文本數(shù)據(jù)庫。文本數(shù)據(jù)庫仍是民族語言檔案庫的基礎(chǔ),尤其是年代久遠(yuǎn)的文字檔案,應(yīng)盡量留存原始檔案,這類語言檔案數(shù)據(jù)庫多以詞句、段落及屬性解析等文本信息的形式存在,主要激活視覺體驗(yàn)認(rèn)知。

        2.1.2 圖像數(shù)據(jù)庫。圖像數(shù)據(jù)庫主要起到輔助文本檔案和音頻檔案的作用,例如對有關(guān)發(fā)音部位語言檔案信息的記錄,圖像便可以起到很有效的輔助作用。條件允許的前提下,所有文本子檔案庫也都應(yīng)建立對等圖像子檔案庫留作副本。這類語言檔案數(shù)據(jù)庫亦主要激活視覺體驗(yàn)認(rèn)知。

        2.1.3 音頻數(shù)據(jù)庫。音頻數(shù)據(jù)庫應(yīng)作為民族語言檔案數(shù)據(jù)的主要部分來創(chuàng)建,因其兼顧了語言檔案的存儲效率、存儲精準(zhǔn)性和保存持久性等方面的最佳平衡點(diǎn)。音頻數(shù)據(jù)庫尤其在記錄語言的語音信息方面顯得格外重要,如音位、語調(diào)、韻律等語音屬性檔案。

        理想的音頻檔案數(shù)據(jù)庫應(yīng)實(shí)現(xiàn)通過語音快速檢索數(shù)據(jù)的功能,同時(shí)還應(yīng)該涵蓋本民族語言與普通話的雙向匹配。[4]條件允許的前提下,所有文本子檔案庫都應(yīng)建立對等音頻子檔案庫留作副本,這類語言檔案數(shù)據(jù)庫主要激活聽覺體驗(yàn)認(rèn)知。

        2.1.4 視頻數(shù)據(jù)庫。視頻數(shù)據(jù)庫則通過字幕、發(fā)聲和圖像的互相補(bǔ)充,融合了視覺體驗(yàn)認(rèn)知和聽覺體驗(yàn)認(rèn)知,使民族語言數(shù)據(jù)信息呈現(xiàn)得更清晰,可實(shí)現(xiàn)語言檔案的最優(yōu)集成化效果。這種多位一體的多模態(tài)語言檔案,彌合了相關(guān)語言檔案的失真問題,可以使民族語言的內(nèi)涵及特征得到更好展現(xiàn)。

        以上四類子數(shù)據(jù)庫既相互獨(dú)立又相互補(bǔ)充,共同構(gòu)成了完整的民族語言檔案數(shù)據(jù)庫系統(tǒng)。多模態(tài)語言檔案建設(shè)可針對少數(shù)民族語言檔案的特殊性進(jìn)行全方面立體構(gòu)建,能更精準(zhǔn)、更多樣地展現(xiàn)語言檔案的信息內(nèi)涵。

        2.2 建設(shè)步驟——以音頻數(shù)據(jù)庫為例

        2.2.1 選取目標(biāo)語言材料。選取語言數(shù)據(jù)材料是語言檔案音頻數(shù)據(jù)庫建設(shè)的首要步驟,其中最核心的問題是數(shù)據(jù)的典型性問題。[5]

        最具代表性的語言數(shù)據(jù)既能更準(zhǔn)確地反映相關(guān)類屬語言檔案的典型特征,又能最大程度降低數(shù)據(jù)庫建設(shè)的成本,以最經(jīng)濟(jì)的數(shù)據(jù)樣本實(shí)現(xiàn)最大化的特征覆蓋。

        如在設(shè)計(jì)詞表時(shí),可優(yōu)先選取雙音節(jié)詞,以便研究詞語的變調(diào)特征;在設(shè)計(jì)語篇朗讀材料時(shí),應(yīng)盡量涵蓋能反映韻律、音段等多特征在內(nèi)的多種句式。

        2.2.2 建立發(fā)聲人信息檔案庫。發(fā)聲人語音的標(biāo)準(zhǔn)性是保證發(fā)聲人信息檔案庫科學(xué)性的關(guān)鍵。發(fā)聲人選取標(biāo)準(zhǔn)主要有三個(gè)方面:一是應(yīng)為常年生活在當(dāng)?shù)氐牡湫湍刚Z使用者,且固定家庭成員也應(yīng)為母語使用者;二是發(fā)聲人聽力和發(fā)聲能力正常,無影響語音信息采集的相關(guān)疾病或缺陷;三是年齡段和性別分布相對平衡。

        如在采集壯族歇后語語音數(shù)據(jù)時(shí),選取15-65歲間不同年齡段的本地母語使用者男女各10名,并進(jìn)行測試以確定發(fā)聲人發(fā)音符合要求。

        2.2.3 采集語言數(shù)據(jù)。采集語言數(shù)據(jù)是建立語言檔案音頻數(shù)據(jù)庫的核心步驟,主要涉及采集地點(diǎn)的選取、采集設(shè)備的裝配及現(xiàn)場采集等關(guān)鍵問題。傳統(tǒng)借助錄音筆的即時(shí)即地采集模式,雖相對便捷,但聲音質(zhì)量普遍不高,容易產(chǎn)生數(shù)據(jù)失真等問題,從而影響語音數(shù)據(jù)的精準(zhǔn)性和后期可分析性。

        因此,語言數(shù)據(jù)的采集應(yīng)在專業(yè)的場地由專業(yè)人員操作專業(yè)設(shè)備完成采集。除了聲音之外,還應(yīng)采集發(fā)聲人的表情和肢體動作等輔助信息,優(yōu)化采集效果。

        2.2.4 加工語言數(shù)據(jù)。這一步驟主要包括對采集數(shù)據(jù)的后期處理和校對歸檔兩部分。采集語言數(shù)據(jù)后,需要進(jìn)行后期處理,以保證數(shù)據(jù)的有效性,如刪除無效數(shù)據(jù)或?qū)Φ唾|(zhì)量音頻進(jìn)行降噪及削波等修繕處理等。此外,還要對采集數(shù)據(jù)進(jìn)行校對歸檔,確保數(shù)據(jù)信息的準(zhǔn)確性,如核驗(yàn)語音與目標(biāo)文本是否對應(yīng)、查缺補(bǔ)漏等。

        2.2.5 管理和維護(hù)語言檔案。檔案的合理命名、編排及檢索對于語言檔案數(shù)據(jù)庫的集成化、高效化使用至關(guān)重要。如在對錄制的音頻數(shù)據(jù)命名時(shí)可包含發(fā)聲人的年齡、性別、材料名稱、錄制時(shí)間及錄制地點(diǎn)等信息,以便快速識別和調(diào)取;鑒于多模態(tài)語言檔案的特殊性,定期對語言檔案實(shí)施維護(hù)也十分必要,如對損壞的音頻數(shù)據(jù)及時(shí)修復(fù)或補(bǔ)錄等。

        參考文獻(xiàn):

        [1]彭飛.基于格局理論的多模態(tài)語言檔案數(shù)據(jù)庫建設(shè)研究[J].北京檔案,2017(03): 26-28.

        [2]石貞貞.符號學(xué)視域下多模態(tài)語言檔案建設(shè)研究.[J].山西檔案,2019(04): 84-86.

        [3]劉永.檔案信息資源共享云體系建設(shè)的思考.[J].檔案管理,2017(06): 25-29.

        [4]趙生輝,胡瑩.中國少數(shù)民族語言檔案雙語著錄規(guī)范研究[J].檔案管理,2019(02): 24-26.

        [5]彭飛.澳大利亞少數(shù)民族語言檔案數(shù)據(jù)庫建設(shè)現(xiàn)狀及啟示[J].中國檔案,2019(11): 70-71.

        (作者單位:王金海,廣西民族大學(xué)/鄭州航空工業(yè)管理學(xué)院;孟子惠,天津師范大學(xué)? 來稿日期:2020-12-19)

        猜你喜歡
        檔案管理
        如何規(guī)范檔案管理
        對加強(qiáng)城建檔案管理的相關(guān)思考
        檔案管理中的電子檔案管理
        檔案管理與企業(yè)內(nèi)部控制關(guān)系的思考
        煤炭企業(yè)檔案管理的創(chuàng)新
        論如何做好檔案管理工作
        加強(qiáng)鄉(xiāng)鎮(zhèn)檔案管理的舉措
        論科研項(xiàng)目檔案管理
        西藏科技(2015年12期)2015-09-26 12:13:40
        健康檔案管理的“云”前景
        關(guān)于電力企業(yè)檔案管理之創(chuàng)新探討
        河南科技(2014年7期)2014-02-27 14:11:32
        97久久精品亚洲中文字幕无码| 少妇隔壁人妻中文字幕| 在线观看国产自拍视频| 激情五月婷婷一区二区| 在线 | 一区二区三区四区| 久久亚洲av成人无码国产| 国产成人综合久久精品推荐免费| 日韩av在线免费观看不卡| 91精品人妻一区二区三区久久久| 亚洲va国产va天堂va久久| 欧美色aⅴ欧美综合色| 特级毛片a级毛片在线播放www| 亚洲国产成人va在线观看天堂| 免费在线黄色电影| 免费无码黄动漫在线观看| 久久福利青草精品资源| 国产精品美女自在线观看| 国产自拍高清在线观看| 婷婷亚洲久悠悠色悠在线播放| 中文字幕亚洲综合久久菠萝蜜| 午夜黄色一区二区不卡| 国产内射一级一片内射视频| 国产精品无码久久久久久| 色综合久久丁香婷婷| 久久国产精品国产精品久久| 国产亚洲精品国产精品| 欧美黑人xxxx又粗又长| 99成人精品| 国产伦精品一区二区三区在线| 91伦理片视频国产精品久久久| 久久精品国产网红主播| 国产精品公开免费视频| 久久激情人妻中文字幕| 亚洲最新国产av网站| 国产成人av一区二区三区| 亚洲综合色一区二区三区另类| 亚洲国产精品美女久久久| 男女真人后进式猛烈视频网站| 真多人做人爱视频高清免费| 亚洲日产无码中文字幕| 人日本中文字幕免费精品|