亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        “混合現(xiàn)實(shí)”技術(shù)在建設(shè)布依語(yǔ)詞匯數(shù)據(jù)庫(kù)中的應(yīng)用

        2020-11-23 10:03:04代少若黃承慧
        關(guān)鍵詞:音頻現(xiàn)實(shí)詞語(yǔ)

        代少若,黃承慧

        (1.興義民族師范學(xué)院文學(xué)與傳媒學(xué)院,貴州 興義 562400;2.廣東金融學(xué)院數(shù)據(jù)科學(xué)與大數(shù)據(jù)技術(shù)系,廣東 廣州 510521)

        語(yǔ)言是一種社會(huì)資源,擁有與其他資源共同的屬性,但比較起來(lái),語(yǔ)言具有文化傳承性等獨(dú)特性。在資源的保護(hù)方面,由于語(yǔ)言的存在是與人類(lèi)社會(huì)族群相依存的,語(yǔ)言的發(fā)展受其社會(huì)功用性影響而呈現(xiàn)出不同的活力,語(yǔ)言一旦消失,就不可再生,具有礦產(chǎn)物質(zhì)資源的有限性特點(diǎn);而活的語(yǔ)言,如果不能擴(kuò)大其社會(huì)應(yīng)用范圍,激發(fā)其自身系統(tǒng)的創(chuàng)造力,也會(huì)逐漸被淘汰直至消亡,這又有生態(tài)資源的特點(diǎn)。語(yǔ)言的本體特點(diǎn)顯示,對(duì)語(yǔ)言進(jìn)行保護(hù),必須考慮其作為一種特殊社會(huì)資源具有的多樣性,相應(yīng)地在實(shí)際操作中,就要在保護(hù)方法、策略上采取一些特殊的措施。李宇明提出,把語(yǔ)言資源分為口頭資源、書(shū)面資源和衍生資源(語(yǔ)言知識(shí)、語(yǔ)言技術(shù)、語(yǔ)言藝術(shù)、語(yǔ)言人才等),認(rèn)為語(yǔ)言資源具有語(yǔ)言保護(hù)、語(yǔ)言信息處理和語(yǔ)言學(xué)習(xí)等三大功能域,并把語(yǔ)言看作是貯存人類(lèi)語(yǔ)言知識(shí)體系及文化體系的知識(shí)庫(kù),即“語(yǔ)言知識(shí)觀”。在人類(lèi)文明社會(huì)即將進(jìn)入智能新時(shí)代的背景下,按照“語(yǔ)言知識(shí)觀”建設(shè)語(yǔ)言資源,才能滿(mǎn)足語(yǔ)言保護(hù)和機(jī)器語(yǔ)言學(xué)習(xí)、人類(lèi)語(yǔ)言學(xué)習(xí)的資源需要。[1]

        一、語(yǔ)言資源保護(hù)及方法概述

        作為一種邊際性效用未得到凸現(xiàn)的社會(huì)資源,語(yǔ)言資源的重要性是伴著學(xué)界的認(rèn)識(shí)而逐漸加深,并在語(yǔ)言資源保護(hù)實(shí)踐中逐步得到彰顯的。國(guó)內(nèi)語(yǔ)言學(xué)界對(duì)語(yǔ)言資源的保護(hù)行為,早期主要以大型語(yǔ)言調(diào)查為主。上世紀(jì)30年代,趙元任、楊時(shí)逢等先生領(lǐng)銜進(jìn)行了全國(guó)漢語(yǔ)方言調(diào)查;新中國(guó)成立后,1956年,根據(jù)國(guó)務(wù)院指示,教育部及中國(guó)科學(xué)院語(yǔ)言研究所等單位展開(kāi)了漢語(yǔ)和少數(shù)民族語(yǔ)言調(diào)查;1999年,教育部等11部委聯(lián)合開(kāi)展了中國(guó)語(yǔ)言文字使用情況調(diào)查。

        李宇明評(píng)價(jià)后兩次調(diào)查,認(rèn)為對(duì)了解語(yǔ)言國(guó)情有一定的作用,但并沒(méi)有達(dá)到“語(yǔ)言普查”的水平,沒(méi)有采錄語(yǔ)料,人們籍此無(wú)從了解所調(diào)查語(yǔ)言的實(shí)際情況。[1]這種偏于書(shū)面記錄的語(yǔ)言調(diào)查模式,在中國(guó)語(yǔ)言學(xué)界長(zhǎng)期以來(lái)占主流地位。同時(shí),這種調(diào)查模式是以專(zhuān)業(yè)人士為主并主要為學(xué)術(shù)研究服務(wù)的,研究的成果很難讓普通群眾認(rèn)知,也很難在社會(huì)應(yīng)用層面進(jìn)行成果轉(zhuǎn)換。

        21世紀(jì)初期,以“中國(guó)語(yǔ)言資源有聲數(shù)據(jù)庫(kù)”、“中國(guó)語(yǔ)言資源保護(hù)工程”為代表的兩個(gè)語(yǔ)言保護(hù)建設(shè)項(xiàng)目,標(biāo)志著中國(guó)語(yǔ)言資源的保護(hù)工作進(jìn)入了書(shū)面記錄與語(yǔ)料音視頻保存同步并行的階段。這兩個(gè)建設(shè)項(xiàng)目涉及面廣,群眾參與度及接受度高,社會(huì)影響大。除此之外,還有許多語(yǔ)言類(lèi)微信公眾號(hào)定期推出中國(guó)語(yǔ)言類(lèi)的推文,并配以與圖文相應(yīng)的語(yǔ)言音頻或視頻,以自媒體的形式進(jìn)行語(yǔ)言資源保護(hù)與推廣。目前,語(yǔ)言資源數(shù)據(jù)庫(kù)主要以網(wǎng)絡(luò)數(shù)據(jù)資源庫(kù)形式呈現(xiàn),隨著網(wǎng)絡(luò)科技的發(fā)展應(yīng)用而不斷深入到社會(huì)生活的各個(gè)角落,可預(yù)期語(yǔ)言資源數(shù)據(jù)庫(kù)的應(yīng)用開(kāi)發(fā)潛力將不可限量。

        中國(guó)語(yǔ)言資源保護(hù)的每一步發(fā)展,都是伴隨自然科學(xué)技術(shù)特別是計(jì)算機(jī)科學(xué)的發(fā)展而實(shí)現(xiàn)的。調(diào)查中的錄音工具及儲(chǔ)存方式從早期的盒式錄音帶,到后期的電子錄音筆、計(jì)算機(jī)語(yǔ)言調(diào)查錄音軟件、大容量數(shù)據(jù)儲(chǔ)存器等設(shè)備及調(diào)查輔助手段。計(jì)算機(jī)信息科學(xué)的每一次發(fā)展,都促使著語(yǔ)言調(diào)查向著更簡(jiǎn)捷、更科學(xué),可進(jìn)行更大規(guī)模調(diào)查的方向發(fā)展。

        二、語(yǔ)言資源“混合現(xiàn)實(shí)”全景式開(kāi)發(fā)應(yīng)用模式

        “混合現(xiàn)實(shí)”(Mixed Reality,簡(jiǎn)稱(chēng)“MR”),是一種基于現(xiàn)代攝像技術(shù)與計(jì)算機(jī)技術(shù)發(fā)展成果的技術(shù)。即一種利用攝像的記錄功能將真實(shí)的場(chǎng)景記錄下來(lái),然后通過(guò)計(jì)算機(jī)“混合現(xiàn)實(shí)”技術(shù)軟件進(jìn)行后期處理,在瀏覽終端實(shí)現(xiàn)三維的空間展示新興技術(shù)。目前,互聯(lián)網(wǎng)媒體上類(lèi)似的應(yīng)用基本上是“混合現(xiàn)實(shí)”技術(shù),但社會(huì)大眾一般稱(chēng)為“虛擬現(xiàn)實(shí)”(即Virtual Reality,簡(jiǎn)稱(chēng)“VR”)?!疤摂M現(xiàn)實(shí)”是完全由計(jì)算機(jī)虛擬的空間,與以攝錄的實(shí)景為基礎(chǔ)的混合現(xiàn)實(shí)而形成的三維空間是有區(qū)別的。

        現(xiàn)在又有成熟的航拍技術(shù)加持,使得“混合現(xiàn)實(shí)”的三維空間展示具有俯瞰的視角。相對(duì)于一般3D建模、“虛擬現(xiàn)實(shí)”所實(shí)現(xiàn)的虛擬三維空間,“混合現(xiàn)實(shí)”的觀感體驗(yàn)更恢宏廓大,效果更客觀真實(shí),讓觀者真正獲得身臨其境的體驗(yàn)。同時(shí),還可以在“混合現(xiàn)實(shí)”的混合場(chǎng)景中,鏈接音頻、圖片及視頻,使“混合現(xiàn)實(shí)”獲得除全方位、多維度的展示外,還能達(dá)到“聲光景”多種感官的互動(dòng)體驗(yàn)。

        語(yǔ)言是一種具有符號(hào)性的聲音,這種聲音通過(guò)其無(wú)窮的組合形式來(lái)表達(dá)變化萬(wàn)千的客觀世界。也就是說(shuō),語(yǔ)言是對(duì)客觀現(xiàn)實(shí)及內(nèi)部間各種關(guān)系的一種抽象表達(dá)。這種最經(jīng)濟(jì)的抽象表達(dá),理論上具有表達(dá)范圍的無(wú)限性。但事實(shí)上,語(yǔ)言在表達(dá)客觀現(xiàn)實(shí)的時(shí)候,存在功能有限性。例如,不能跨時(shí)空交流,所以產(chǎn)生了文字;對(duì)復(fù)雜、嚴(yán)謹(jǐn)?shù)某橄笸评磉^(guò)程描述,需要借助專(zhuān)業(yè)科學(xué)符號(hào),等等??茖W(xué)的發(fā)展不斷拓寬人類(lèi)可到達(dá)的領(lǐng)域,使個(gè)體可以接觸到的信息也呈幾何級(jí)別增長(zhǎng)?,F(xiàn)在人們的學(xué)習(xí)也需借助多種輔助手段,以達(dá)到正確而迅捷地獲得知識(shí)的目的。當(dāng)然,這些技術(shù)上的進(jìn)步與發(fā)展,也要借由語(yǔ)言的社會(huì)功能、思維功能才能達(dá)成。但是也要看到,在社會(huì)發(fā)展新形勢(shì)下,語(yǔ)言表達(dá)能力也有捉襟見(jiàn)肘的時(shí)候,有時(shí)需借助其他輔助手段才能實(shí)現(xiàn)準(zhǔn)確有效地傳遞信息的功能。

        把語(yǔ)言當(dāng)作一種社會(huì)資源來(lái)進(jìn)行保存,其主要目的是記錄語(yǔ)言實(shí)況,進(jìn)而展示語(yǔ)言面貌;我國(guó)歷史上數(shù)次語(yǔ)言調(diào)查,概莫能外。在語(yǔ)言資源保護(hù)中最大程度地記錄語(yǔ)言真實(shí)面貌,除了對(duì)調(diào)查人員的專(zhuān)業(yè)素養(yǎng)提出要求外,不斷發(fā)展創(chuàng)新科技手段,也是促進(jìn)語(yǔ)言資源日益向高“保真”方向發(fā)展的保證。

        (一)“混合現(xiàn)實(shí)”技術(shù)對(duì)語(yǔ)言資源保護(hù)的高“保真”效果

        將“混合現(xiàn)實(shí)”技術(shù)引入語(yǔ)言資源保護(hù)工程,建立語(yǔ)言資源數(shù)據(jù)庫(kù),可達(dá)到以下“保真”效果:

        1.還原語(yǔ)言生活真實(shí)場(chǎng)景

        “混合現(xiàn)實(shí)”的技術(shù)優(yōu)勢(shì),就是混合現(xiàn)實(shí)與虛擬的場(chǎng)景,讓體驗(yàn)者得到身臨其境的感受。這種場(chǎng)景的三維體驗(yàn)效果在“混合現(xiàn)實(shí)”中,是通過(guò)三維空間在視覺(jué)上不斷延伸而實(shí)現(xiàn)的。體驗(yàn)者通過(guò)點(diǎn)擊、拖動(dòng)終端顯示屏,隨著顯示屏的變化不斷延展視域,得到“立于錐地而暢行千里”的全方位體驗(yàn)。

        任何一種語(yǔ)言都有自己的生存環(huán)境,語(yǔ)言的表達(dá)方式所反映的思維模式,與語(yǔ)言所存在的社會(huì)生活環(huán)境息息相關(guān)?!盎旌犀F(xiàn)實(shí)”技術(shù)通過(guò)實(shí)景拍攝再經(jīng)后期處理而成的三維空間,能高度將所拍攝的場(chǎng)景還原到終端顯示屏。語(yǔ)言資源保護(hù)工程可以利用這種技術(shù),將語(yǔ)言所處的社會(huì)生活環(huán)境以三維立體空間形式原景重現(xiàn),作為語(yǔ)言展示最有說(shuō)服力的背景。

        2.實(shí)物詮釋語(yǔ)言所指

        “混合現(xiàn)實(shí)”在實(shí)景拍攝的基礎(chǔ)上生成三維空間,極大程度地還原了語(yǔ)言生活環(huán)境。這種環(huán)境不再是一維平面靜態(tài)的展示,場(chǎng)景中的每個(gè)部分、每個(gè)小物件,都能達(dá)到三維動(dòng)態(tài)展示的逼真效果。語(yǔ)言所指是指語(yǔ)音與客觀現(xiàn)實(shí)之間發(fā)生的意義指稱(chēng)。很多時(shí)候,語(yǔ)言的所指如果沒(méi)有一定的語(yǔ)境作基礎(chǔ),便不好理解,甚至產(chǎn)生歧義與誤解。

        作為一種保存、展示的語(yǔ)言材料,語(yǔ)言資源在向外界開(kāi)放的時(shí)候,面對(duì)的觀眾除了母語(yǔ)者及了解這種語(yǔ)言的專(zhuān)業(yè)人士外,還有對(duì)這種語(yǔ)言一無(wú)所知的一般觀眾?!盎旌犀F(xiàn)實(shí)”技術(shù)可以將真實(shí)場(chǎng)景中的事物和與之相對(duì)應(yīng)的語(yǔ)音音頻、視頻融為一體,觀眾點(diǎn)擊屏幕上的事物時(shí),就能聽(tīng)到關(guān)于這個(gè)事物的相應(yīng)的語(yǔ)言發(fā)音,部分事件性的場(chǎng)景如勞動(dòng)、民俗節(jié)日等還配有完整的表現(xiàn)事件過(guò)程的視頻。這種方式極其有助于觀眾快速理解語(yǔ)言的所指,也能提高語(yǔ)言解釋的說(shuō)服力。

        (二)應(yīng)用“混合現(xiàn)實(shí)”實(shí)現(xiàn)語(yǔ)言資源在線(xiàn)歸檔、查詢(xún)等功能

        目前語(yǔ)言資源調(diào)查所得的材料,是通用的音視頻數(shù)據(jù)。語(yǔ)言資源的音視頻數(shù)據(jù)除了在硬盤(pán)進(jìn)行靜態(tài)儲(chǔ)存、備份外,還應(yīng)該用于展示、宣傳,進(jìn)而激活語(yǔ)言資源內(nèi)在潛能,發(fā)揮其應(yīng)有的社會(huì)作用。

        互聯(lián)網(wǎng)的發(fā)展讓語(yǔ)言資源有了新的、更方便可靠的存儲(chǔ)型態(tài),云端服務(wù)器可以為語(yǔ)言資源數(shù)據(jù)的儲(chǔ)存、展示提供更加便捷、先進(jìn)的技術(shù)支持。儲(chǔ)存于網(wǎng)絡(luò)空間的語(yǔ)言資源數(shù)據(jù),相當(dāng)于處于互聯(lián)網(wǎng)中的信息中心,這些信息由用戶(hù)通過(guò)互聯(lián)網(wǎng)以特定的認(rèn)證模式及控制命令進(jìn)行訪問(wèn)。用戶(hù)無(wú)需下載這些信息,僅通過(guò)相應(yīng)的控制命令、集成“混合現(xiàn)實(shí)”等先進(jìn)的信息技術(shù),就能調(diào)取相應(yīng)的語(yǔ)言資源,并且這些語(yǔ)言資源會(huì)以全新形式的呈現(xiàn)在瀏覽終端。

        將語(yǔ)言資源的路徑形成網(wǎng)絡(luò)鏈接、集成在“混合現(xiàn)實(shí)”程序上,除了前述“保真”效果外,還可以開(kāi)發(fā)出歸檔及按類(lèi)查詢(xún)功能。

        1.利用“混合現(xiàn)實(shí)”的分區(qū)功能進(jìn)行語(yǔ)言資源歸類(lèi)

        “混合現(xiàn)實(shí)”程序本身有一個(gè)瀏覽的分區(qū),每個(gè)分區(qū)對(duì)應(yīng)一個(gè)內(nèi)容豐富、地位重要的場(chǎng)景,方便瀏覽者迅捷進(jìn)入觀看。

        “混合現(xiàn)實(shí)”自帶的瀏覽分區(qū),可以作為語(yǔ)言資源按類(lèi)別展示所用。根據(jù)語(yǔ)言資源的內(nèi)容按照一定的標(biāo)準(zhǔn),可分成幾個(gè)大類(lèi)。這些大類(lèi)所轄的內(nèi)容,儲(chǔ)存在網(wǎng)絡(luò)服務(wù)器里,可應(yīng)用分類(lèi)程序,將其按照一定的分類(lèi)邏輯,建成層級(jí)分明的枝狀多層儲(chǔ)存結(jié)構(gòu)。這樣,語(yǔ)言資源的整理就可以利用“混合現(xiàn)實(shí)”的瀏覽分區(qū)功能進(jìn)行歸類(lèi),這種歸類(lèi)方便觀眾在瀏覽區(qū)查詢(xún)、選擇。

        2.利用“混合現(xiàn)實(shí)”鏈接功能查詢(xún)相關(guān)語(yǔ)言材料

        “混合現(xiàn)實(shí)”的三維實(shí)景在瀏覽終端上可以給人以無(wú)限擴(kuò)展的體驗(yàn),但事實(shí)上實(shí)景是有邊際的。如果應(yīng)用在語(yǔ)言資源展示上,它的有限范圍與語(yǔ)言所能表達(dá)領(lǐng)域的“無(wú)遠(yuǎn)弗屆”是相沖突的,有限的生活場(chǎng)景是不可能將語(yǔ)言能表達(dá)的所有內(nèi)容附于其上的。這時(shí)就可以利用鏈接功能及詞匯的類(lèi)別聯(lián)想標(biāo)準(zhǔn),在場(chǎng)景中某一個(gè)詞匯類(lèi)別的典型詞語(yǔ)位置,設(shè)置一個(gè)與典型詞語(yǔ)相應(yīng)的“詞匯類(lèi)別”鏈接,引導(dǎo)觀眾進(jìn)入相應(yīng)的詞類(lèi)數(shù)據(jù)庫(kù)。典型詞語(yǔ)“以一執(zhí)類(lèi)”,方便觀者查詢(xún),也便于語(yǔ)言的擴(kuò)展學(xué)習(xí)。

        三、“混合現(xiàn)實(shí)”技術(shù)在語(yǔ)言資源保護(hù)工作中的實(shí)踐——望謨布依語(yǔ)詞匯3D全景數(shù)據(jù)檔案館建設(shè)

        貴州省雙語(yǔ)服務(wù)基地項(xiàng)目——《望謨布依語(yǔ)詞匯3D全景數(shù)據(jù)檔案館建設(shè)》,是基于“混合現(xiàn)實(shí)”技術(shù)應(yīng)用而實(shí)現(xiàn)的語(yǔ)言資源數(shù)字化保護(hù)項(xiàng)目。貴州省民漢雙語(yǔ)服務(wù)基地,是貴州省民宗委下轄的少數(shù)民族語(yǔ)言文字辦公室與貴州省各高??蒲袉挝辉诟鞯芈?lián)合建立的。服務(wù)基地以構(gòu)建雙語(yǔ)和諧、增強(qiáng)民族團(tuán)結(jié)為宗旨,每年資助各科研單位進(jìn)行民漢雙語(yǔ)服務(wù)的科研項(xiàng)目。

        貴州省望謨縣是布依族聚居區(qū),其中,復(fù)興鎮(zhèn)是布依族較為集中的地方。按中國(guó)科學(xué)院少數(shù)民族語(yǔ)言研究所1959年進(jìn)行的布依語(yǔ)分區(qū),復(fù)興鎮(zhèn)布依語(yǔ)屬于第一土語(yǔ)區(qū)[2],因?yàn)檎Z(yǔ)音特色突出,較有代表性,上世紀(jì)80年代初被選定為制定布依文的標(biāo)準(zhǔn)語(yǔ)。本項(xiàng)目以望謨縣復(fù)興鎮(zhèn)布依語(yǔ)的詞匯為對(duì)象,應(yīng)用“混合現(xiàn)實(shí)”技術(shù)進(jìn)行語(yǔ)言資源數(shù)字化保護(hù),是基于以下理由:

        首先,望謨縣復(fù)興鎮(zhèn)布依語(yǔ)因語(yǔ)音特色突出,保留較早期的布依語(yǔ)特征,因而被賦予了制定布依文字的語(yǔ)音標(biāo)準(zhǔn)地位,將其作為數(shù)字化語(yǔ)言保護(hù)項(xiàng)目的調(diào)研對(duì)象,對(duì)保護(hù)布依語(yǔ)語(yǔ)言資源具有不言而喻的重要意義。

        其次,詞語(yǔ)是用來(lái)指稱(chēng)客觀世界及其內(nèi)在關(guān)系,具有相對(duì)獨(dú)立性的語(yǔ)言單位。詞義即詞的內(nèi)容,是反映客觀對(duì)象直觀含義的分析解說(shuō);同時(shí),詞義也包含著對(duì)客觀對(duì)象的內(nèi)在屬性的概括。一種語(yǔ)言的詞語(yǔ)總和就是詞匯。如果從詞匯角度來(lái)靜態(tài)地觀察客觀世界,那么客觀世界就可表述為一個(gè)個(gè)獨(dú)立的概念個(gè)體,詞匯系統(tǒng)里每一個(gè)單位即詞語(yǔ),與客觀世界里的概念個(gè)體具有一一對(duì)應(yīng)的關(guān)系。這種一一對(duì)應(yīng)關(guān)系,適合在“混合現(xiàn)實(shí)”系統(tǒng)里將之處理成語(yǔ)音音頻與圖像的相對(duì)應(yīng)。

        再次,語(yǔ)言的詞匯系統(tǒng)以事物的自然類(lèi)屬為基礎(chǔ)進(jìn)行分門(mén)別類(lèi),是最簡(jiǎn)潔也最符合認(rèn)知心理的系統(tǒng)組織方法。正如前文所述,在“混合現(xiàn)實(shí)”的終端瀏覽界面展示語(yǔ)言資源材料,是需要結(jié)合語(yǔ)言材料的類(lèi)別來(lái)進(jìn)行的。所以,以詞匯作為應(yīng)用MR技術(shù)進(jìn)行語(yǔ)言資源保護(hù)的切入點(diǎn),是基于詞匯本身的系統(tǒng)性、層級(jí)性與MR技術(shù)應(yīng)用的歸類(lèi)建檔功能,具有內(nèi)容與形式的契合性。這種契合,在建設(shè)數(shù)據(jù)庫(kù)具體操作的各個(gè)步驟表現(xiàn)得尤為充分。

        基于上述理由,作為將“混合現(xiàn)實(shí)”技術(shù)引入語(yǔ)言資源保護(hù)工程的首次嘗試,我們把布依語(yǔ)詞匯作為“混合現(xiàn)實(shí)”語(yǔ)言資源數(shù)據(jù)庫(kù)的建設(shè)對(duì)象。下面以“望謨布依語(yǔ)詞匯3D全景數(shù)據(jù)檔案館建設(shè)”項(xiàng)目為例,詳細(xì)介紹“混合現(xiàn)實(shí)”技術(shù)在語(yǔ)言資源保護(hù)工程中的應(yīng)用。

        按照工作內(nèi)容及性質(zhì),該項(xiàng)目分為語(yǔ)言文化調(diào)查、資料整理及“混合現(xiàn)實(shí)”程序設(shè)計(jì)3部分。

        (一)語(yǔ)言文化調(diào)查

        此部分調(diào)查嚴(yán)格按照我國(guó)少數(shù)民族語(yǔ)言常規(guī)的語(yǔ)言調(diào)查方法進(jìn)行,目的是調(diào)查語(yǔ)言現(xiàn)狀,收集到一手的、客觀的、完備的語(yǔ)言材料,以便對(duì)所調(diào)研的語(yǔ)言有一個(gè)系統(tǒng)性的把握。這里我們主要介紹詞匯的調(diào)查。

        除了詞匯語(yǔ)料收集外,還根據(jù)詞匯調(diào)查的內(nèi)容,在當(dāng)?shù)嘏臄z布依族日常社會(huì)生活及傳統(tǒng)民俗活動(dòng)等民族文化方面的照片。這部分照片的拍攝是為下一步建設(shè)語(yǔ)料數(shù)據(jù)庫(kù)做視覺(jué)素材。

        1.語(yǔ)料收集

        我們?cè)谥醒朊褡鍖W(xué)院少數(shù)民族語(yǔ)言研究所第五研究室1985年出版的《壯侗語(yǔ)族語(yǔ)言詞匯集》的基礎(chǔ)上,制定了望謨縣復(fù)興鎮(zhèn)布依語(yǔ)調(diào)查的詞匯調(diào)查表[3];又根據(jù)劉丹青編著的《語(yǔ)法調(diào)查研究手冊(cè)》制定了語(yǔ)法調(diào)查大綱[4]。在這兩個(gè)調(diào)查表、大綱的指導(dǎo)下,2017年暑假,項(xiàng)目組在望謨縣縣城所在地原復(fù)興鎮(zhèn)進(jìn)行了為期一個(gè)月的田野調(diào)查。這次調(diào)查收錄了布依語(yǔ)詞語(yǔ)2498條,語(yǔ)法例句220句;2018年3月再赴望謨縣復(fù)興鎮(zhèn)復(fù)核,補(bǔ)充調(diào)查到布依語(yǔ)詞語(yǔ)109條。

        與一般語(yǔ)保工程工作流程稍有不同的是,我們的語(yǔ)料錄音是與紙筆調(diào)查同時(shí)進(jìn)行的。為了避免發(fā)音人工作枯燥、減輕其工作強(qiáng)度,我們每次討論10個(gè)詞語(yǔ),確定每個(gè)詞語(yǔ)的意義及發(fā)音后,再進(jìn)行錄音。錄音軟件沿用語(yǔ)保工程指定的“北語(yǔ)錄音”軟件,在保證發(fā)音人正常狀態(tài)自然發(fā)音前提下,錄音技術(shù)參數(shù)也盡量參照語(yǔ)保工程規(guī)定的標(biāo)準(zhǔn)。通過(guò)“北語(yǔ)錄音”軟件的自動(dòng)化操作,每個(gè)詞條、每個(gè)語(yǔ)法例句的錄音都形成一個(gè)單獨(dú)的音頻文件,并對(duì)應(yīng)詞匯調(diào)查表、語(yǔ)法調(diào)查大綱自動(dòng)生成文件名且排序,非常便于后期語(yǔ)料整理及查詢(xún)。

        2.民族文化圖片收集

        為最大程度符合布依語(yǔ)的語(yǔ)言環(huán)境,用以輔助詞匯理解的圖片,盡量以布依族實(shí)際生活場(chǎng)景為主。

        在一個(gè)來(lái)月的田野調(diào)查中,項(xiàng)目組負(fù)責(zé)攝影記錄的成員根據(jù)詞匯調(diào)查手冊(cè)的條目,在望謨縣復(fù)興鎮(zhèn)布依族聚居區(qū)走村入寨,拍攝各種相關(guān)照片;在征得主人同意后,進(jìn)入普通布依族同胞家里,拍攝布依族同胞日常起居的生活照片。發(fā)音人介紹的一些布依族曾經(jīng)存在過(guò)的事物,我們也盡量請(qǐng)當(dāng)?shù)夭家雷逋麕兔λ蚜_,甚至重新演繹原景重現(xiàn)。

        在文化圖片的拍攝過(guò)程中,發(fā)現(xiàn)的一些極具布依族特色的事物,項(xiàng)目組成員也會(huì)拍下相關(guān)的照片。這部分新發(fā)現(xiàn)的事物在詞匯調(diào)查表上是沒(méi)有的,我們以這些照片為據(jù),請(qǐng)發(fā)音人介紹、發(fā)音,這樣就獲得了更多的民族特色詞匯。

        (二)語(yǔ)料數(shù)據(jù)整理

        進(jìn)入語(yǔ)料數(shù)據(jù)整理階段,工作也分兩部分。第一部分工作是語(yǔ)言音頻資料的整理,第二部分是將詞條音頻與圖片組合成有音有圖的視頻類(lèi)詞匯文件。

        1.語(yǔ)言音頻資料整理

        首先,通過(guò)對(duì)收集到的2000多條詞匯音頻資料進(jìn)行語(yǔ)音歸納,確定望謨縣復(fù)興鎮(zhèn)布依語(yǔ)的語(yǔ)音系統(tǒng),包括聲、韻、調(diào)。

        確定布依語(yǔ)音系之后,再將所有的詞匯音頻材料,轉(zhuǎn)寫(xiě)成以國(guó)際音標(biāo)為書(shū)寫(xiě)符號(hào)的文檔。并將文檔按照社會(huì)生活、認(rèn)知模式及語(yǔ)法性質(zhì)等標(biāo)準(zhǔn)分成天文地理、時(shí)間數(shù)字、勞動(dòng)活動(dòng)動(dòng)作、節(jié)日風(fēng)俗、動(dòng)植物、建筑、日用、人品稱(chēng)呼、身體、醫(yī)療衛(wèi)生、服飾、飲食、商業(yè)交通、文體活動(dòng)、方位、抽象名詞、代詞、形容詞、量詞、虛詞等共20類(lèi),每類(lèi)下面根據(jù)情況可再分成不同小類(lèi),形成一個(gè)枝狀結(jié)構(gòu)的詞匯分類(lèi)系統(tǒng),便于后期相應(yīng)的視頻文件按此系統(tǒng)進(jìn)行文件夾層級(jí)分類(lèi)。

        2.制作音像詞匯文件

        將布依語(yǔ)詞匯做成一個(gè)個(gè)有圖有文有聲音的音像文件,在展示的時(shí)候,可面向一般瀏覽者,也可以供專(zhuān)業(yè)人士參考。

        在田野調(diào)查階段,我們已經(jīng)收錄了布依語(yǔ)詞匯每一個(gè)詞語(yǔ)的音頻,也拍攝了部分與布依語(yǔ)詞匯相關(guān)的照片,這是詞匯音像的圖、音。詞匯音像的文,即表示詞匯相應(yīng)意義的漢字及描述布依詞語(yǔ)發(fā)音的國(guó)際音標(biāo),則標(biāo)注在詞語(yǔ)的配圖上。這一步可以在專(zhuān)業(yè)的圖片處理軟件上通過(guò)輸入文字完成。鑒于一些圖片處理軟件不兼容國(guó)際音標(biāo)字體,可以直接用word文檔來(lái)處理,處理步驟如下:

        第一步:打開(kāi)word文檔,插入圖片;

        第二步:在圖片下輸入漢字及相應(yīng)的布依語(yǔ)發(fā)音國(guó)際音標(biāo);

        第三步:截圖;

        第四步:另存到相應(yīng)的詞匯類(lèi)別文件夾里,得到類(lèi)似于圖1所示的文件。

        比較抽象的詞語(yǔ)如結(jié)構(gòu)助詞、副詞,無(wú)法或不方便用圖像表示的詞,我們就在word或ppt程序里直接用文字符號(hào)的形式表現(xiàn),然后截圖。例如圖2所示。

        圖片處理好后,再用較方便的“繪聲繪影”軟件與詞語(yǔ)的音頻合成為一個(gè)視頻文件。“繪聲繪影”界面較直觀,操作也簡(jiǎn)單。打開(kāi)軟件后,有音頻軌道、圖像軌道等。將詞語(yǔ)的音頻插入相應(yīng)的音頻軌道,配合詞語(yǔ)內(nèi)容的圖片插入圖像軌道,設(shè)置合理時(shí)間,再合成一個(gè)文件,導(dǎo)出、儲(chǔ)存為wmv或mp4格式的文件,即得到一個(gè)布依語(yǔ)詞語(yǔ)的音像文件。

        “繪聲繪影”軟件是收費(fèi)軟件。也可以用windows10操作系統(tǒng)自帶的、瀏覽照片的“照片”程序,加上音頻作為圖片的背景音樂(lè),再合成為視頻文件。步驟為:

        圖1 word軟件合并圖、文與音標(biāo)

        圖2 PPT制作詞語(yǔ)加音標(biāo)圖

        圖3 合成圖及音頻

        圖4 設(shè)置音頻時(shí)長(zhǎng)

        第一步:雙擊圖片即打開(kāi)了“照片”程序;

        第二步:點(diǎn)擊“編輯&創(chuàng)建”,再點(diǎn)擊其下的“創(chuàng)建帶有音樂(lè)的視頻”,在跳出的如圖3所示的命名界面中為即將制作的視頻文件命名;

        第三步:在“持續(xù)時(shí)間”里根據(jù)音頻時(shí)間設(shè)置好時(shí)長(zhǎng),再如圖4所示界面點(diǎn)擊“自定義音頻”;

        第四步:點(diǎn)擊“添加音頻文件”,將相應(yīng)詞語(yǔ)的音頻文件導(dǎo)入,完成后,點(diǎn)擊“完成視頻”,根據(jù)如圖5所示界面的“導(dǎo)出”指引,選擇wmv或mp4格式存入相應(yīng)的文件夾位置。

        (三)“混合現(xiàn)實(shí)”設(shè)計(jì)及詞匯數(shù)據(jù)庫(kù)建設(shè)

        “混合現(xiàn)實(shí)”設(shè)計(jì)及數(shù)據(jù)庫(kù)建設(shè),是外包給專(zhuān)業(yè)數(shù)據(jù)信息公司制作的。在制作之前,項(xiàng)目組與數(shù)據(jù)信息公司進(jìn)行了項(xiàng)目情況溝通,提出了我們的訴求及要實(shí)現(xiàn)的功能。項(xiàng)目組再根據(jù)我們的要求,提交了“混合現(xiàn)實(shí)”設(shè)計(jì)制作方案及制作預(yù)算,最終雙方達(dá)成一致,確定了“混合現(xiàn)實(shí)”制作的推進(jìn)方案。

        1.拍攝“混合現(xiàn)實(shí)”基礎(chǔ)素材

        “混合現(xiàn)實(shí)”的展示,是以真實(shí)場(chǎng)景為視覺(jué)基礎(chǔ)進(jìn)行三維空間建設(shè)的,拍攝符合項(xiàng)目主題的真實(shí)場(chǎng)景是第一步。根據(jù)信息公司的建議,考慮真實(shí)場(chǎng)景畫(huà)面在拼接時(shí)需要保持畫(huà)面的連續(xù)性與自然性,我們選擇了人、車(chē)流量少的一個(gè)布依族山寨作為拍攝場(chǎng)地。

        拍攝內(nèi)容包括航拍全景圖、室內(nèi)近景圖以及瀏覽分區(qū)配圖等。拍攝當(dāng)天天氣情況較好,陽(yáng)光適中,很適合航拍取景。所以拍攝素材的工作進(jìn)展十分順利,僅用了一個(gè)上午時(shí)間就完成了。

        2.“混合現(xiàn)實(shí)”視覺(jué)效果的制作

        將拍攝到的原始素材進(jìn)行拼接,制作成具有三維效果的展示、瀏覽界面,最終形成了如圖6、圖7所示的瀏覽界面視覺(jué)效果圖:

        圖6 、圖7所示主界面展示的是航拍的全景,通過(guò)劃動(dòng)界面可以延伸場(chǎng)景范圍,擴(kuò)大視覺(jué)空間。點(diǎn)擊瀏覽界面下部的每個(gè)分區(qū)(圖7底部的方塊),就可以進(jìn)入到不同的分場(chǎng)景;每一個(gè)分場(chǎng)景也是布依語(yǔ)詞匯的分類(lèi)儲(chǔ)存區(qū)。

        3.望謨布依語(yǔ)詞匯檔案館瀏覽渠道

        為方便推廣及便捷查詢(xún),本項(xiàng)目最終成果通過(guò)目前我國(guó)應(yīng)用范圍最廣的社交軟件微信進(jìn)行分享瀏覽。項(xiàng)目成果生成一個(gè)如圖8所示的二維碼,微信掃二維碼就接入如圖9所示布依語(yǔ)詞匯檔案館的瀏覽界面。在瀏覽界面,可以利用微信的分享功能將此檔案館成果分享在朋友圈或發(fā)給指定好友。

        4.望謨布依語(yǔ)詞匯的查閱

        詞匯的查閱方式分兩種,分別是如圖10所示的瀏覽界面直接查閱和如圖11所示的檔案調(diào)取式查閱。

        圖5 導(dǎo)出視頻文件

        圖6 視覺(jué)效果圖1

        圖7 視覺(jué)效果圖2

        圖8 成果二維碼

        圖9 檔案館界面

        圖10 瀏覽界面直接查閱

        圖11 檔案調(diào)取式查閱

        檔案調(diào)取式查閱:由詞類(lèi)聯(lián)想,可以找到相應(yīng)的詞類(lèi)鏈接;再通過(guò)鏈接進(jìn)入詞類(lèi)檔案館,就可以調(diào)閱相關(guān)類(lèi)別的布依語(yǔ)詞匯。

        例如要查閱“日常生活詞匯”,則直接進(jìn)入瀏覽界面下部的“布依建筑內(nèi)部”分區(qū),查看布依語(yǔ)日常生活的詞語(yǔ)。在這個(gè)界面顯著位置,就能看到“更多日常生活詞匯請(qǐng)點(diǎn)擊→”的提示,點(diǎn)擊這個(gè)提示可以鏈接到如圖11所示的“日常生活詞匯”的數(shù)據(jù)庫(kù)。

        四、計(jì)算機(jī)信息技術(shù)在語(yǔ)言資源數(shù)據(jù)庫(kù)中的應(yīng)用前景

        本項(xiàng)目?jī)H就布依語(yǔ)詞匯利用“混合現(xiàn)實(shí)”技術(shù)進(jìn)行了語(yǔ)言資源檔案建設(shè),無(wú)論從規(guī)模、質(zhì)量還是技術(shù)來(lái)說(shuō),都是較簡(jiǎn)單及粗疏的。但我們認(rèn)為,這是一個(gè)符合時(shí)代科技發(fā)展趨勢(shì)的極有意義的嘗試。

        在互聯(lián)網(wǎng)科技發(fā)展不斷更新?lián)Q代、功能日趨強(qiáng)大的形勢(shì)下,我們完全有可能將語(yǔ)言資源以數(shù)據(jù)資源庫(kù)的形式,來(lái)打造線(xiàn)上語(yǔ)言博物館。當(dāng)然,那將是一項(xiàng)極其龐大的工程,在技術(shù)上需要用到自然語(yǔ)言處理、區(qū)塊鏈、人工智能、網(wǎng)絡(luò)信息安全等更專(zhuān)精的技術(shù)手段;而語(yǔ)言資源本身,也不僅限于詞匯,還包括大規(guī)模的自然口語(yǔ)語(yǔ)料收錄,口頭文化的自動(dòng)采集,甚至可以有人機(jī)語(yǔ)言互動(dòng)、民族語(yǔ)言及方言直播等各種形式。這些關(guān)于語(yǔ)言數(shù)字化保護(hù)的技術(shù)與博物館的形式內(nèi)容,都需要語(yǔ)保人不斷從語(yǔ)保實(shí)踐中去發(fā)現(xiàn)問(wèn)題,提出要求。目的是在人類(lèi)文明高度發(fā)展的當(dāng)下,將語(yǔ)言這一人類(lèi)最根本的文明成果保存下來(lái),傳承下去,這需要全社會(huì)取得共識(shí)并共同努力。

        猜你喜歡
        音頻現(xiàn)實(shí)詞語(yǔ)
        容易混淆的詞語(yǔ)
        我對(duì)詩(shī)與現(xiàn)實(shí)的見(jiàn)解
        文苑(2020年11期)2021-01-04 01:53:20
        找詞語(yǔ)
        必須了解的音頻基礎(chǔ)知識(shí) 家庭影院入門(mén)攻略:音頻認(rèn)證與推薦標(biāo)準(zhǔn)篇
        基于Daubechies(dbN)的飛行器音頻特征提取
        電子制作(2018年19期)2018-11-14 02:37:08
        音頻分析儀中低失真音頻信號(hào)的發(fā)生方法
        電子制作(2017年9期)2017-04-17 03:00:46
        詞語(yǔ)欣賞
        一種基于Unity3D+Vuforia的增強(qiáng)現(xiàn)實(shí)交互App的開(kāi)發(fā)
        Pro Tools音頻剪輯及修正
        人間(2015年8期)2016-01-09 13:12:42
        一枚詞語(yǔ)一門(mén)靜
        亚洲伊人av天堂有码在线| 纯肉无遮挡H肉动漫在线观看国产 国产精品自产拍在线观看免费 | 日韩在线精品视频观看| 人妻精品人妻一区二区三区四区| 乱人伦精品视频在线观看| 国产亚洲一区二区三区综合片| 国产精品久久久久久人妻无| 国产二级一片内射视频播放| 正在播放国产对白孕妇作爱| 欧美一级人与嘼视频免费播放| 加勒比熟女精品一区二区av| 国产一区av男人天堂| 韩国三级在线观看久| 日韩国产成人无码av毛片蜜柚| 欧美色图中文字幕| 杨幂二区三区免费视频| 国产精品久久久免费精品| 亚洲国产天堂一区二区三区| 中文字幕不卡在线播放| 日韩精品免费一区二区中文字幕| 亚洲熟女av在线观看| 看全色黄大色黄大片 视频| 成 人 免费 黄 色 视频| 亚洲 无码 制服 丝袜 自拍| 亚洲精品熟女av影院| 美女扒开屁股让男人桶| 男女爽爽无遮挡午夜视频| 日韩中文在线视频| 国产午夜三级精品久久久| 国产一区二区三区四区三区| 四虎影视永久在线精品| 国产国拍亚洲精品福利| 隔壁的日本人妻bd高清中字| 欧美综合天天夜夜久久| chinesefreexxxx国产麻豆| av中文字幕在线资源网| 国产白浆一区二区三区性色| 欧洲极品少妇| 欧美日一本| 亚洲最大一区二区在线观看| 性欧美老人牲交xxxxx视频|