王越,彭詠梅
(江西中醫(yī)藥大學(xué) 人文學(xué)院,江西 南昌 330004)
中醫(yī)藥是一個不可估量的寶藏,為人類的生命健康做出了不可估量的貢獻(xiàn)。近年來,中醫(yī)藥的發(fā)展越來越受重視,國家扶持中醫(yī)藥發(fā)展的力度持續(xù)加大。自“一帶一路”發(fā)展戰(zhàn)略提出以來,文化自信與文化走出去被提上議程,中醫(yī)藥文化作為我國五千年文明中一朵璀璨的奇葩,更是其中的杰出代表。中醫(yī)藥在過去幾千年的歷史長河中救黎民百姓于水火,現(xiàn)如今,我們依舊從中醫(yī)藥典籍中受益無窮。2003年非典型肺炎以及2019年爆發(fā)的新冠疫情,中醫(yī)經(jīng)方的療效顯著。新冠疫情的抗擊實踐展示了中西醫(yī)結(jié)合療法的獨特優(yōu)勢,為世界所關(guān)注。
社會更迭時代進(jìn)步,守正創(chuàng)新才是中醫(yī)藥重?zé)ā扒啻骸钡年P(guān)鍵。為了在新時代謀求新發(fā)展、傳承精華,不斷探索中醫(yī)藥現(xiàn)代化道路,中醫(yī)藥必須適應(yīng)且依托不斷更新的信息技術(shù),融合先進(jìn)科技和創(chuàng)新方法,走向國際舞臺。截至2020年3月,中國網(wǎng)絡(luò)新聞用戶規(guī)模達(dá)7.31億,較2018年底增加5 598萬,占網(wǎng)民整體的80.9%。與此同時,自媒體隨著網(wǎng)絡(luò)媒體的迅猛發(fā)展,充分激發(fā)了內(nèi)容的產(chǎn)出,并為現(xiàn)代信息技術(shù)等各行業(yè)提供了新的發(fā)展機遇。本文以此為視域,建立中醫(yī)藥文化多模態(tài)語料庫,分析中醫(yī)藥文化傳播特征,以期在后續(xù)助力中醫(yī)藥文化傳播的工作中,提出更多切實可行的建議和策略設(shè)計藍(lán)圖。
中醫(yī)藥多模態(tài)語料庫是集合中醫(yī)學(xué)、語言學(xué)、統(tǒng)計學(xué)及計算機科學(xué)等多個學(xué)科知識的交叉融合產(chǎn)物。簡而言之,中醫(yī)藥多模態(tài)語料庫是一個收集中醫(yī)藥語言材料的數(shù)據(jù)庫,也是關(guān)系型數(shù)據(jù)庫應(yīng)用的擴展與延伸。該數(shù)據(jù)庫依托簡明的數(shù)學(xué)理論基礎(chǔ)和描述性的操作語言提高了系統(tǒng)開發(fā)的生產(chǎn)率,優(yōu)化了事務(wù)查詢管理技術(shù),同時也提升了研究效率。相對于當(dāng)前依然占據(jù)主體地位的文本語料庫,多模態(tài)語料庫在實時性、完整性和多樣性方面略勝一籌,更符合當(dāng)下的學(xué)習(xí)需求。在軟件技術(shù)的輔助下,成其為當(dāng)前單模態(tài)語料庫的補充方案。通過構(gòu)建中醫(yī)藥多模態(tài)語料庫,可使各界人士學(xué)習(xí)了解中醫(yī)藥,為中醫(yī)藥在國內(nèi)的傳承與創(chuàng)新發(fā)展的研究提供一定的參考依據(jù)。
在中國知網(wǎng)、萬方數(shù)據(jù)庫、維普數(shù)據(jù)庫等全國知名文獻(xiàn)檢索網(wǎng)站中,查詢2000年至今與中醫(yī)藥語料庫相關(guān)的文獻(xiàn),高級檢索主題包括“中醫(yī)藥語料庫”或“中醫(yī)語料庫”,且文獻(xiàn)類型為全庫資源中的學(xué)術(shù)期刊以及學(xué)位論文等。最終所得的檢索式為:TI=中醫(yī)藥語料庫OR中醫(yī)語料庫。
自2000年以來,國內(nèi)學(xué)者開始對中醫(yī)藥語料庫方面的研究進(jìn)行探索。通過CNKI可視化分析可知,國內(nèi)中醫(yī)藥語料庫研究大致可以總結(jié)為初步探索期(2000~2011),逐步發(fā)展期(2012~2014),繁榮增長期(2014~2017),并且在2017年發(fā)文量達(dá)到頂峰,到2018年進(jìn)入持續(xù)回落期(2018~2020),再到穩(wěn)步回升期(2020至今)五個階段。聞永毅教授(2003)對中醫(yī)藥術(shù)語語料庫建設(shè)領(lǐng)域進(jìn)行研究;隨后,程玲(2005)探討了在中醫(yī)英語語料庫視角下的創(chuàng)建及教學(xué)意義等相關(guān)研究;另有學(xué)者對中醫(yī)藥語料庫的應(yīng)用進(jìn)行研究(杜雪琴,2018;王世杰,2019);徐春捷等學(xué)者(2015)又基于中醫(yī)翻譯的框架,研究英漢翻譯平行語料庫的建立。當(dāng)前中醫(yī)藥語料庫相關(guān)研究已經(jīng)涉及多個學(xué)科和領(lǐng)域,但還未出現(xiàn)中醫(yī)藥相關(guān)多模態(tài)語料庫的研究,需要做進(jìn)一步的探討與補充。
Elan(EUDICO Linguistic Annotator)是由荷蘭馬普心理語言文字學(xué)科研所建設(shè)的一款語言標(biāo)注工具。對于語言學(xué)者而言,因其適用范圍廣而采用。Elan能夠?qū)τ耙暫驼Z音等多種文件同時執(zhí)行構(gòu)建、剪輯、可視化和查找的標(biāo)注任務(wù),也可以提供聲音技術(shù)等多媒體后期制作功能,還能夠?qū)φZ句、手語、姿勢等語料進(jìn)行相應(yīng)的處理。研究決定以Elan軟件作為技術(shù)平臺,構(gòu)建中醫(yī)藥多模態(tài)語料庫。
本文中醫(yī)藥多模態(tài)語料庫采集內(nèi)容為微信、微博、抖音等自媒體APP中與中醫(yī)藥相關(guān)的視頻,包括中醫(yī)治病理念、中藥知識、養(yǎng)生小貼士,以及中醫(yī)藥典故等。
在本研究建立的中醫(yī)藥多模態(tài)語料庫中,標(biāo)注層共有11層。標(biāo)注信息如表1所示,包含中醫(yī)藥的表達(dá)方式、影像、圖像、音樂等類別。
表1 標(biāo)注信息
如表1所示,根據(jù)Thibault和Baldry的多模態(tài)廣告語篇轉(zhuǎn)錄框架,分為旁白、獨白、對話、人物、中藥、人物&中藥、文字、圖片、文字&圖片、主觀音樂、客觀音樂。將視頻文件的音頻生成,將視頻與音頻文件同時導(dǎo)入ELAN軟件,再進(jìn)行人工視頻標(biāo)注,如圖1所示為使用ELAN軟件進(jìn)行標(biāo)注的界面。
圖1 標(biāo)注界面
整個工作內(nèi)容分為以下四個方面:手視頻語料采集、語料的標(biāo)注、語料專家校驗及語料庫的更新和存儲,中醫(yī)藥視頻語料庫的建立總體流程如圖2所示。具體內(nèi)容如下:
圖2 構(gòu)建流程圖
(1)確定采集內(nèi)容,對視頻進(jìn)行采集與切分。首先將MP4文件導(dǎo)入ELAN標(biāo)注軟件;其次按照時間段和鏡頭環(huán)境的切換對各個視頻進(jìn)行切分。
(2)建立轉(zhuǎn)寫標(biāo)注層。本研究在建立中醫(yī)藥多模態(tài)語料庫時,確定了11層的標(biāo)注層級,以此為參考進(jìn)行標(biāo)注。
(3)進(jìn)行校驗。再次對采集內(nèi)容和標(biāo)注者信息等進(jìn)行確認(rèn),并對標(biāo)注內(nèi)容進(jìn)行校驗。校驗的目的是為了提高語料庫的質(zhì)量,以保證語料庫的科學(xué)性。
(4)修正。最后再次核驗語料庫存在的問題,檢查是否存在標(biāo)注時段有誤、標(biāo)注信息誤填等情況,并進(jìn)行修正,最終形成中醫(yī)藥多模態(tài)語料庫的雛形,將最終的MP4文件及標(biāo)注轉(zhuǎn)寫語料EAF文件進(jìn)行存儲,如圖3所示。
圖3 文件存儲
Elan軟件簡單易用易上手,整個標(biāo)注操作可分解為以下五個步驟,以供參考:
(1)啟動ELAN6.3,點擊新建并導(dǎo)入視頻。
(2)點擊Tier并增加tier,輸入層名、參與人、標(biāo)注人、日期等信息;選擇default,更改層屬性,并輸入新的標(biāo)注信息。
(3)設(shè)置標(biāo)注段。左鍵點擊進(jìn)度條,拖動鼠標(biāo)到目標(biāo)位置,再次點擊進(jìn)度條,形成一個標(biāo)注段,雙擊標(biāo)注段并進(jìn)行命名。
(4)回放視頻語料,進(jìn)行多次轉(zhuǎn)寫與標(biāo)注工序。
(5)點擊View,選擇Annotation Statistics,可查看并得到各層數(shù)據(jù),點擊保存,如圖4所示。
圖4 數(shù)據(jù)輸出
本文從構(gòu)建背景、構(gòu)建意義、構(gòu)建方法、構(gòu)建步驟等四個方面對自媒體APP中醫(yī)藥多模態(tài)語料庫的構(gòu)建進(jìn)行了分析探討。在當(dāng)前自媒體蓬勃發(fā)展的背景下,利用Elan軟件對中醫(yī)藥相關(guān)視頻、音頻等語料進(jìn)行切分、轉(zhuǎn)寫以及多層級標(biāo)注,最終得以構(gòu)建中醫(yī)藥多模態(tài)語料庫?;诒菊Z料庫的構(gòu)建,期望未來可延伸至其他研究領(lǐng)域,輔助中醫(yī)藥相關(guān)交叉學(xué)科研究成果的拓展及應(yīng)用,并對未來的中醫(yī)藥交叉學(xué)科研究給以啟發(fā)。
中醫(yī)藥多模態(tài)語料庫的構(gòu)建可輔助國內(nèi)中醫(yī)藥文化傳播實證研究。通過構(gòu)建自媒體APP中醫(yī)藥多模態(tài)語料庫,得出的分析結(jié)論能夠更加全面地從語言學(xué)角度呈現(xiàn)國內(nèi)媒體關(guān)于中醫(yī)藥的立場,加強對中醫(yī)藥傳播效果的調(diào)查,探索有利于中醫(yī)藥傳播的途徑和手段,從而為中醫(yī)藥的傳播研究提供助力,并在一定程度上為中醫(yī)藥文化傳播政策的制定提供證據(jù)支持和參考思路。
綜上所述,基于中醫(yī)藥多模態(tài)語料庫的模態(tài)多樣性與語境再現(xiàn)等特性,在未來可為中醫(yī)藥國內(nèi)的傳承與發(fā)展提供一定的創(chuàng)新嘗試,并提出相應(yīng)的措施及建議,致力于提高大眾對中醫(yī)藥的關(guān)注度,提升中醫(yī)藥文化在國內(nèi)的影響力,從實證的角度促進(jìn)中醫(yī)藥文化在國內(nèi)的傳播與發(fā)展,為講好“中醫(yī)”故事貢獻(xiàn)力量。