■張 婧/沈陽(yáng)音樂(lè)學(xué)院
高等音樂(lè)院校中英語(yǔ)課程的設(shè)置是其教育體系中一門(mén)重要的課程。隨著國(guó)際間音樂(lè)交流的日益頻繁以及日常學(xué)習(xí)實(shí)踐中英語(yǔ)使用頻率的增加,要求音樂(lè)院校的英語(yǔ)教學(xué)不僅僅要完成高校英語(yǔ)教學(xué)大綱的基礎(chǔ)內(nèi)容,也要根據(jù)音樂(lè)院校自身的特點(diǎn),加大對(duì)專(zhuān)業(yè)英語(yǔ)即專(zhuān)門(mén)音樂(lè)用途的英語(yǔ)知識(shí)的講解和灌輸,讓學(xué)生能夠真正做到運(yùn)用英語(yǔ)這個(gè)工具來(lái)汲取和交流專(zhuān)業(yè)信息,以提高自己的專(zhuān)業(yè)素養(yǎng),為自己的專(zhuān)業(yè)學(xué)習(xí)和今后的工作服務(wù)。因此,在音樂(lè)類(lèi)專(zhuān)業(yè)院校的英語(yǔ)教學(xué)中,應(yīng)該更加突出英語(yǔ)這門(mén)語(yǔ)言的專(zhuān)業(yè)性和工具性,讓英語(yǔ)更好地服務(wù)于當(dāng)下老師和學(xué)生在各個(gè)專(zhuān)業(yè)的學(xué)習(xí)和研究。
語(yǔ)料庫(kù)語(yǔ)言學(xué)( corpus linguistics)是上個(gè)世紀(jì)中后期興起的一門(mén)新興的語(yǔ)言學(xué)分支學(xué)科, 它以真實(shí)的語(yǔ)言數(shù)據(jù)為研究對(duì)象, 利用各種語(yǔ)料庫(kù)檢索工具對(duì)經(jīng)過(guò)加工標(biāo)注過(guò)的語(yǔ)料進(jìn)行檢索和分類(lèi), 從調(diào)查語(yǔ)言信息的分布頻率入手, 以發(fā)現(xiàn)以往因條件所限而沒(méi)有注意到的語(yǔ)言在真實(shí)使用中的規(guī)律和模式。語(yǔ)料庫(kù)語(yǔ)言學(xué)發(fā)展到今天, 種類(lèi)繁多,根據(jù)語(yǔ)料庫(kù)建設(shè)目的和用途的不同, 迄今為止常見(jiàn)的語(yǔ)料庫(kù)可分為: 通用語(yǔ)料庫(kù)、專(zhuān)門(mén)用途語(yǔ)料庫(kù)、監(jiān)控語(yǔ)料庫(kù)、學(xué)習(xí)者語(yǔ)料庫(kù)、類(lèi)比語(yǔ)料庫(kù)、平行語(yǔ)料庫(kù)和教學(xué)語(yǔ)料庫(kù)等。
音樂(lè)英語(yǔ)語(yǔ)料庫(kù)屬于專(zhuān)門(mén)用途語(yǔ)料庫(kù)。專(zhuān)門(mén)用途語(yǔ)料庫(kù)和通用語(yǔ)料庫(kù)相比,使用者可以在專(zhuān)門(mén)用途料庫(kù)中快速、準(zhǔn)確、有針對(duì)性的搜索到想要的內(nèi)容。使用者不僅可以憑借語(yǔ)料庫(kù)平臺(tái)構(gòu)建滿(mǎn)足研究所需的語(yǔ)料庫(kù),也可以使用語(yǔ)料庫(kù)軟件分析語(yǔ)料,檢索和提取語(yǔ)言實(shí)例及數(shù)據(jù)。
建立專(zhuān)門(mén)用途的音樂(lè)英語(yǔ)語(yǔ)料庫(kù),在專(zhuān)業(yè)音樂(lè)院校,有以下兩點(diǎn)必要性:
首先,“培養(yǎng)國(guó)際化專(zhuān)業(yè)人藝術(shù)人才”是我院培養(yǎng)人才的目標(biāo)之一,高素質(zhì)的音樂(lè)人才不僅需要在本專(zhuān)業(yè)領(lǐng)域中不斷提升專(zhuān)業(yè)水準(zhǔn),也需要有把國(guó)外的優(yōu)秀作品引入到國(guó)內(nèi)和把我國(guó)高水平的傳統(tǒng)音樂(lè)藝術(shù)推向國(guó)際舞臺(tái)的能力。而音樂(lè)專(zhuān)業(yè)英語(yǔ)語(yǔ)料庫(kù)的建立,可以為學(xué)習(xí)者提供更為便利的學(xué)習(xí)條件,讓學(xué)習(xí)者更能快速地查詢(xún)到真實(shí)準(zhǔn)確的語(yǔ)料。
其次,音樂(lè)院校學(xué)生在進(jìn)行專(zhuān)業(yè)英語(yǔ)學(xué)習(xí)的難度要更大。一方面由于藝術(shù)類(lèi)學(xué)生學(xué)習(xí)的重心更多地放在專(zhuān)業(yè)課上,所以英語(yǔ)基礎(chǔ)相對(duì)薄弱;另一方面,專(zhuān)業(yè)音樂(lè)英語(yǔ)詞匯往往在專(zhuān)業(yè)術(shù)語(yǔ)中有著不同于其在基礎(chǔ)英語(yǔ)中的含義,所以需要學(xué)生對(duì)本專(zhuān)業(yè)的知識(shí)有一定基礎(chǔ)后才能夠更好地理解和掌握相其對(duì)應(yīng)的英語(yǔ)專(zhuān)業(yè)術(shù)語(yǔ)的含義。但目前,中國(guó)國(guó)內(nèi)已出版的音樂(lè)英語(yǔ)方面的專(zhuān)業(yè)書(shū)籍相對(duì)較少。而在互聯(lián)網(wǎng)上,盡管可以搜索到很多音樂(lè)英語(yǔ)相關(guān)的文章和詞匯,信息較多,但水平參差不齊,對(duì)于音樂(lè)院校的學(xué)生來(lái)說(shuō),由于自身英語(yǔ)基礎(chǔ)較差,時(shí)間、精力有限,所以在大量的網(wǎng)頁(yè)和信息中想要準(zhǔn)確地搜索到想要的信息,難度較大。在此背景下,加強(qiáng)對(duì)專(zhuān)業(yè)音樂(lè)英語(yǔ)的研究,對(duì)專(zhuān)業(yè)音樂(lè)英語(yǔ)的詞匯和信息的進(jìn)行系統(tǒng)化地整理,歸納,建立一個(gè)專(zhuān)門(mén)用途的語(yǔ)料庫(kù)則顯得尤為重要。
語(yǔ)料庫(kù)的設(shè)計(jì)是語(yǔ)料庫(kù)建設(shè)中最重要的階段,它會(huì)直接影響到語(yǔ)料庫(kù)的質(zhì)量并進(jìn)一步影響到以后基于語(yǔ)料庫(kù)的研究工作。在設(shè)計(jì)階段, 語(yǔ)料庫(kù)的建設(shè)者必須從語(yǔ)料庫(kù)的規(guī)模、內(nèi)容、語(yǔ)料樣本的選擇及對(duì)語(yǔ)料進(jìn)行加工的程度等幾個(gè)方面加以考慮, 確立語(yǔ)料庫(kù)的設(shè)計(jì)原則。
在建設(shè)語(yǔ)料庫(kù)時(shí),其規(guī)模并不是越大越好。語(yǔ)料庫(kù)的無(wú)限擴(kuò)大會(huì)出現(xiàn)大量“無(wú)用語(yǔ)料”。在建立語(yǔ)料庫(kù)的過(guò)程中,需要不斷經(jīng)過(guò)實(shí)驗(yàn)數(shù)據(jù)的證明,找到一個(gè)語(yǔ)料適合的百分比,來(lái)確定語(yǔ)料庫(kù)的規(guī)模大小。比如,可以設(shè)定不同的應(yīng)用場(chǎng)景,針對(duì)需要來(lái)在語(yǔ)料庫(kù)中進(jìn)行搜索,如果搜索到的信息量很少、不準(zhǔn)確或并沒(méi)有代表性,則說(shuō)明該語(yǔ)料庫(kù)中對(duì)于該類(lèi)型的語(yǔ)料準(zhǔn)備數(shù)量不夠,需要繼續(xù)補(bǔ)充,直到搜索到的語(yǔ)料基本符合搜索條件,這時(shí)可以確定該類(lèi)型的語(yǔ)料數(shù)量已基本足夠;反之,如果搜索到的語(yǔ)料數(shù)量很多,但有一部分是重復(fù)語(yǔ)料或無(wú)用語(yǔ)料,則需要對(duì)語(yǔ)料庫(kù)中相應(yīng)語(yǔ)料進(jìn)行刪減和修訂。
筆者認(rèn)為,音樂(lè)英語(yǔ)語(yǔ)料庫(kù)在初期建立時(shí),其語(yǔ)料數(shù)量可以為100萬(wàn)條左右。初期的語(yǔ)料庫(kù)可以為音樂(lè)專(zhuān)業(yè)英語(yǔ)的教學(xué)、翻譯及語(yǔ)言研究提供真實(shí)可靠的自然語(yǔ)言材料,通過(guò)文本檢索查詢(xún)音樂(lè)英語(yǔ)在詞匯、句法、篇章等各個(gè)層面的語(yǔ)言特征,為音樂(lè)專(zhuān)業(yè)英語(yǔ)在教學(xué)、翻譯以及學(xué)術(shù)研究等方面提供強(qiáng)有力的語(yǔ)料支撐。
在進(jìn)行語(yǔ)料庫(kù)樣本的選擇時(shí),一方面可以查閱現(xiàn)有的國(guó)內(nèi)外的專(zhuān)業(yè)書(shū)籍、權(quán)威報(bào)刊、雜志等資料,選取準(zhǔn)確有效的信息,編寫(xiě)到語(yǔ)料庫(kù)中。同時(shí),也可以利用現(xiàn)有的多樣的在線資源,對(duì)符合要求的網(wǎng)絡(luò)中的專(zhuān)業(yè)音樂(lè)英語(yǔ)信息利及用技術(shù)算計(jì)技術(shù)進(jìn)行提取。語(yǔ)料庫(kù)的原始語(yǔ)料的構(gòu)成和取樣一般來(lái)說(shuō)按照明確的語(yǔ)言學(xué)原則并采取隨機(jī)抽樣方法進(jìn)行收集,而不是簡(jiǎn)單地堆砌語(yǔ)料。在收集時(shí),不僅要考慮到不同的專(zhuān)業(yè)、體裁、語(yǔ)域、主題等的抽樣比例,還要考慮到語(yǔ)料庫(kù)的研究目的和具體用途。
從類(lèi)別上分類(lèi),音樂(lè)英語(yǔ)語(yǔ)料庫(kù)的建立可以分為以下幾個(gè)類(lèi)別的內(nèi)容:(1)中國(guó)傳統(tǒng)音樂(lè)英語(yǔ)詞匯語(yǔ)料庫(kù);(2)外國(guó)音樂(lè)英語(yǔ)詞匯語(yǔ)料庫(kù);(3)樂(lè)理、音樂(lè)史語(yǔ)料庫(kù);(4)人名、作品名語(yǔ)料庫(kù)。中國(guó)傳統(tǒng)音樂(lè)英語(yǔ)詞匯的語(yǔ)料庫(kù)可以為對(duì)外推廣我國(guó)傳統(tǒng)音樂(lè)文化提供準(zhǔn)確的英漢對(duì)照詞表。樂(lè)理、音樂(lè)史及人名、作品名語(yǔ)料庫(kù)的建立不僅在專(zhuān)業(yè)的音樂(lè)英語(yǔ)教學(xué)中方便師生查詢(xún)資料,更好的為專(zhuān)業(yè)學(xué)習(xí)服務(wù),更有助于師生撰寫(xiě)相關(guān)的論文和書(shū)籍。
語(yǔ)料庫(kù)的語(yǔ)料加工指語(yǔ)料經(jīng)過(guò)分詞、詞性標(biāo)注、句法分析等。由于專(zhuān)業(yè)性質(zhì)較強(qiáng),且專(zhuān)業(yè)分類(lèi)較細(xì),很難在短時(shí)間內(nèi)對(duì)大量的語(yǔ)料進(jìn)行深加工,所以筆者認(rèn)為在初建音樂(lè)英語(yǔ)語(yǔ)料庫(kù)時(shí),可以對(duì)語(yǔ)料進(jìn)行分詞和詞性標(biāo)注。以后隨著語(yǔ)料庫(kù)在實(shí)際中的使用情況,設(shè)計(jì)者可以對(duì)語(yǔ)料庫(kù)做進(jìn)一步的加工處理和統(tǒng)計(jì)分析。
首先,將準(zhǔn)備好的文字語(yǔ)料統(tǒng)一轉(zhuǎn)化為T(mén)XT格式。一般原始語(yǔ)料的格式大部分為word, pdf, mobi, html等,其中word, pdf和html格式可以利用很多轉(zhuǎn)換工具轉(zhuǎn)換為T(mén)XT格式;mobi格式可利用calibre進(jìn)行批量轉(zhuǎn)換。由于音樂(lè)的專(zhuān)業(yè)特點(diǎn),很多語(yǔ)料的來(lái)源為音頻形式,所以需要音頻進(jìn)行轉(zhuǎn)寫(xiě),如利用Sitman PC復(fù)讀機(jī)在計(jì)算機(jī)上對(duì)語(yǔ)音進(jìn)行反復(fù)的播放及轉(zhuǎn)寫(xiě)。
采集原始語(yǔ)料完后,要對(duì)資料進(jìn)行整理加工,主要包括格式處理、標(biāo)記、檢查、統(tǒng)計(jì)、自動(dòng)對(duì)齊和自動(dòng)校對(duì)。 由于通過(guò)網(wǎng)絡(luò)、手工錄入、掃描識(shí)別等方式獲得的文本存在不符合規(guī)范的符號(hào)、格式等,如不加以清理,則會(huì)在賦碼及檢索階段出錯(cuò),因此需要先對(duì)搜集到的生語(yǔ)料進(jìn)行清理??梢岳肞ower GREP或“文本整理器”來(lái)實(shí)現(xiàn)文本的批量整理、清潔、查詢(xún)和語(yǔ)言特征提。
其次,對(duì)語(yǔ)料進(jìn)行詞性標(biāo)注。詞性賦碼通常是在傳統(tǒng)語(yǔ)法對(duì)詞類(lèi)的劃分基礎(chǔ)上進(jìn)行的。 目前詞類(lèi)賦碼技術(shù)已比較成熟,對(duì)英語(yǔ)基本上可以通過(guò)計(jì)算機(jī)系統(tǒng)自動(dòng)賦碼。 標(biāo)注后的語(yǔ)料包含可以為使用者分析和研究語(yǔ)言提供大量的實(shí)證數(shù)據(jù)。標(biāo)注版本采用詞性賦碼,通過(guò)TreeTagger自動(dòng)詞性賦碼器軟件完成。在使用TreeTagger對(duì)文本進(jìn)行賦碼時(shí),還可以讓程序同時(shí)給出原文件中的文本進(jìn)行詞形還原。經(jīng)過(guò)處理、標(biāo)注過(guò)的文本按照類(lèi)別以文件夾的方式保存在電腦里,待檢索使用。
最后,利用AntConc軟件對(duì)加工后的語(yǔ)料進(jìn)行檢索。該軟件是一個(gè)開(kāi)源軟件,可以提供Windows,MacOS,和Linux版本。語(yǔ)料庫(kù)檢索的目的是為了導(dǎo)出索引行,以便于使用者批量觀察類(lèi)似的語(yǔ)言現(xiàn)象,找到其使用規(guī)律,如搭配的規(guī)律、類(lèi)聯(lián)接和形式的規(guī)律和意義的規(guī)律。
綜上所述,音樂(lè)英語(yǔ)語(yǔ)料庫(kù)的建設(shè),在實(shí)踐中,不僅會(huì)開(kāi)拓英語(yǔ)教學(xué)的新思路,也會(huì)為音樂(lè)專(zhuān)業(yè)的學(xué)習(xí)和研究開(kāi)辟新的途徑,是教師和學(xué)生能夠利用的更加現(xiàn)代化的學(xué)科工具。鑒于此,音樂(lè)英語(yǔ)語(yǔ)料庫(kù)的建立是非常有必要的。隨著多媒體網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,語(yǔ)料庫(kù)建設(shè)還會(huì)不斷地完善,對(duì)語(yǔ)料庫(kù)的建設(shè)還需要更深入地探索和研究。