(齊齊哈爾工程學(xué)院 黑龍江 齊齊哈爾 161000)
詞塊是語(yǔ)言應(yīng)用的重要單位,在理解語(yǔ)言、產(chǎn)生語(yǔ)言中發(fā)揮重要的作用。語(yǔ)料庫(kù)則為詞塊的使用提供了存儲(chǔ)的條件與環(huán)境,使詞塊使用者無(wú)需依據(jù)語(yǔ)法規(guī)則對(duì)語(yǔ)言進(jìn)行生成,從而,有效提升語(yǔ)言表達(dá)的準(zhǔn)確性與連貫性。以英語(yǔ)為例,英語(yǔ)中有很多兼有詞匯、兼有語(yǔ)法雙重語(yǔ)言結(jié)構(gòu),這些結(jié)構(gòu)可作為一個(gè)總體內(nèi)容在人類大腦中進(jìn)行儲(chǔ)存。在人們應(yīng)用詞匯時(shí),可通過(guò)詞塊的擴(kuò)大使其有效掌握詞匯語(yǔ)言結(jié)構(gòu),從而實(shí)現(xiàn)語(yǔ)言知識(shí)的拓展以及交際水平的提升。因此,針對(duì)語(yǔ)料庫(kù)的應(yīng)用語(yǔ)言學(xué)詞塊進(jìn)行研究,并對(duì)詞塊表進(jìn)行構(gòu)建,對(duì)語(yǔ)言發(fā)展來(lái)說(shuō)具有重要的意義。
針對(duì)詞塊的研究已有多年的歷史,詞塊理論也得到廣大語(yǔ)言研究者的認(rèn)可,但在詞塊實(shí)際應(yīng)用中卻存在不足之處。各類詞匯表都未曾展現(xiàn)出詞塊的理念,也沒(méi)有將詞塊納入語(yǔ)言學(xué)習(xí)計(jì)劃中,導(dǎo)致很多語(yǔ)言應(yīng)用者對(duì)詞塊的認(rèn)知過(guò)于薄弱。同時(shí),在進(jìn)行語(yǔ)言教學(xué)時(shí),也沒(méi)有將詞塊學(xué)習(xí)作為教學(xué)重點(diǎn),對(duì)詞塊的應(yīng)用與發(fā)展缺乏積極性。結(jié)合語(yǔ)料庫(kù)來(lái)看,可知語(yǔ)料庫(kù)對(duì)部分語(yǔ)言的翻譯存在較為明顯的問(wèn)題,甚至?xí)?duì)語(yǔ)言使用者帶來(lái)直接的誤導(dǎo),導(dǎo)致其在翻譯、交際過(guò)程中存在語(yǔ)言應(yīng)用不嚴(yán)謹(jǐn)?shù)默F(xiàn)象。以英語(yǔ)為例,常有部分需要單數(shù)的詞語(yǔ)被拼寫(xiě)成復(fù)數(shù)(例:infrastructure-infrastructures),雖然錯(cuò)誤較為簡(jiǎn)單,但還是要對(duì)其加以重視,減輕語(yǔ)用誤解,同時(shí),語(yǔ)料庫(kù)還存在標(biāo)點(diǎn)符號(hào)、語(yǔ)法性錯(cuò)誤等現(xiàn)象。以英語(yǔ)為例,中英文標(biāo)點(diǎn)符號(hào)混淆,易對(duì)翻譯過(guò)程帶來(lái)影響,也易導(dǎo)致部分單詞錯(cuò)誤的排列,影響語(yǔ)言的理解過(guò)程。而詞塊中冠詞與主謂不一致、名詞單復(fù)數(shù)等錯(cuò)誤,則易導(dǎo)致語(yǔ)用過(guò)程存在混淆現(xiàn)象,翻譯文本也易被理解的支離破碎。此外,也有部分語(yǔ)料庫(kù)編撰人員沒(méi)有對(duì)資料進(jìn)行仔細(xì)審核,導(dǎo)致語(yǔ)用者在對(duì)語(yǔ)言進(jìn)行翻譯、應(yīng)用發(fā)展的時(shí)候,會(huì)出現(xiàn)不足之處。
在利用語(yǔ)料庫(kù)進(jìn)行應(yīng)用語(yǔ)言學(xué)詞塊表構(gòu)建時(shí),需要遵循視覺(jué)設(shè)計(jì)合理、詞塊分類明確、語(yǔ)料庫(kù)檢索內(nèi)容豐富、詞塊語(yǔ)用信息完善等原則。因此,在進(jìn)行詞塊表構(gòu)建時(shí)首先要對(duì)視覺(jué)設(shè)計(jì)加以重視,對(duì)語(yǔ)用詞塊內(nèi)容進(jìn)行優(yōu)化,重視視覺(jué)效果,使其充分符合語(yǔ)用人員的思維與習(xí)慣。在視覺(jué)設(shè)計(jì)上則需突出詞塊表的特色與重點(diǎn),還需突出學(xué)術(shù)語(yǔ)言特色,對(duì)影響力較大的學(xué)術(shù)文獻(xiàn)進(jìn)行深入介紹,引導(dǎo)語(yǔ)用人員對(duì)學(xué)術(shù)的全面了解。其次,還需對(duì)詞塊進(jìn)行分類,對(duì)詞塊應(yīng)用排序有所側(cè)重。主要由于不同國(guó)家具有不同文化,所以詞塊表在構(gòu)建時(shí)需要設(shè)置合理的檢索欄目,并以正確的目的語(yǔ)語(yǔ)序、習(xí)慣為主,找尋母語(yǔ)與目的語(yǔ)之間的契合點(diǎn),從而提高詞塊表的實(shí)用性。再次,在針對(duì)語(yǔ)料庫(kù)詞塊表在線檢索設(shè)計(jì)時(shí),需要結(jié)合傳統(tǒng)檢索方法,了解其不足之處,從而進(jìn)行創(chuàng)新,使語(yǔ)用人員在檢索時(shí)能得到不同詞塊所擁有的豐富語(yǔ)義,并呈現(xiàn)出詞塊的語(yǔ)用實(shí)例,為語(yǔ)用人員帶來(lái)詳細(xì)的參考資料。
本次研究所利用的目的語(yǔ)語(yǔ)料皆是2005年至今語(yǔ)言學(xué)應(yīng)用專業(yè)人員參與的實(shí)證研究結(jié)果,包含國(guó)際九種SSCI語(yǔ)言學(xué)雜志中學(xué)術(shù)論文,例如:Applied Linguistics、Language for specific purposes 等,語(yǔ)料較為權(quán)威且準(zhǔn)確,經(jīng)過(guò)核查,共計(jì)語(yǔ)料約為300000詞。涉及目的語(yǔ)教學(xué)、二語(yǔ)教學(xué)等多樣化話題。并采取隨機(jī)挑選策略,將文章正文納入語(yǔ)料庫(kù)中,為詞塊表的構(gòu)建奠定基礎(chǔ)。本次研究的首要問(wèn)題時(shí)應(yīng)用語(yǔ)言學(xué)詞塊表的構(gòu)建,為解決這一問(wèn)題,首先需要設(shè)定頻率域值域標(biāo)準(zhǔn),從而安排應(yīng)用語(yǔ)言學(xué)詞塊。詞塊頻率域值域的設(shè)置與選擇參考Ellis編制詞塊表的提取標(biāo)準(zhǔn),大致設(shè)為20次/百萬(wàn)字,值域標(biāo)準(zhǔn)大致設(shè)為十分之一文本中出現(xiàn)的詞塊,利用Antconc多功能檢索工具進(jìn)行設(shè)計(jì)。其次,還需將語(yǔ)料庫(kù)內(nèi)輸入檢索工具,設(shè)定檢索長(zhǎng)度、最低頻數(shù),得到總類符及總字符的數(shù)量。并利用Excel工具針對(duì)語(yǔ)料庫(kù)內(nèi)文章進(jìn)行隨機(jī)抽取,選取高頻應(yīng)用類符詞塊,并對(duì)其中占位符進(jìn)行篩選,去除非語(yǔ)言單位、語(yǔ)法不合內(nèi)容等,得到涵蓋使用頻率較高的應(yīng)用語(yǔ)言學(xué)詞塊表。此外,本次研究還需設(shè)定詞塊頻率排序,并豐富高頻詞塊的語(yǔ)用功能與結(jié)構(gòu)特點(diǎn)內(nèi)容。為此,可將詞塊分為指示性、態(tài)度性、話語(yǔ)組織性三類,結(jié)合不同類別進(jìn)行劃分。
在構(gòu)建應(yīng)用語(yǔ)言學(xué)詞塊表時(shí)還需對(duì)詞塊進(jìn)行提取,針對(duì)詞塊的提取可利用多方印證法進(jìn)行,將文獻(xiàn)集中,利用語(yǔ)料庫(kù)及人工識(shí)別工具等對(duì)詞塊進(jìn)行提取。保障詞塊的提取可按照l(shuí)emma(詞條)進(jìn)行,與參考文獻(xiàn)與目的語(yǔ)語(yǔ)料充分結(jié)合,從而設(shè)計(jì)出詞條列表(lemma matches list,以下簡(jiǎn)稱 LML),例如 Be 動(dòng)詞(am、is、are/was、were)等。利用詞條功能,去除屈折形式,且不設(shè)頻點(diǎn),提取詞塊,加載列表,從而將其合并,做標(biāo)準(zhǔn)化處理,保障檢索結(jié)果的準(zhǔn)確性。同時(shí),詞塊出現(xiàn)頻率是詞塊表構(gòu)建的決定性特點(diǎn),當(dāng)提取率達(dá)到40次/百萬(wàn)詞時(shí),此提取頻點(diǎn)為較高頻點(diǎn)。而提取率達(dá)到20次/百萬(wàn)詞時(shí),此提取頻點(diǎn)為標(biāo)準(zhǔn)頻點(diǎn)。因此,可將詞塊提取頻點(diǎn)設(shè)定為10到40次/百萬(wàn)詞,本次研究設(shè)定為10次/百萬(wàn)詞。保障200個(gè)提取頻率最高的詞塊中有163個(gè)及以上的較高頻點(diǎn)詞塊,而此200個(gè)詞塊則是本次研究的重中之重。
語(yǔ)料庫(kù)中出現(xiàn)最高頻率的詞塊中,每200個(gè)中有百分之二十的詞塊被包含入應(yīng)用語(yǔ)言學(xué)詞塊表的構(gòu)建中,但需要注意這些詞塊中須有百分之十的詞塊出現(xiàn)40次以上,實(shí)驗(yàn)表明,語(yǔ)料庫(kù)詞塊對(duì)學(xué)術(shù)語(yǔ)言教學(xué)、寫(xiě)作、翻譯中具有重要的作用。這也代表研究人員在構(gòu)建詞塊表以及語(yǔ)用人員在檢索詞塊表時(shí)還需充分了解這些詞塊的必要性及應(yīng)用價(jià)值,因此,需要將語(yǔ)料庫(kù)與應(yīng)用語(yǔ)言學(xué)詞塊表的構(gòu)建緊密相連,從而編制具有語(yǔ)言應(yīng)用特色的詞塊表。
依照詞塊語(yǔ)用功能分類方法,可將詞塊表中詞塊分為指示性、態(tài)度性、話語(yǔ)組織性詞塊三類。在設(shè)計(jì)應(yīng)用語(yǔ)言學(xué)詞塊表時(shí),需保證指示性詞塊可占詞塊表的69.7%,充分展示出指示性詞塊的重點(diǎn)語(yǔ)用功能。同時(shí),指示性詞塊是語(yǔ)用范圍內(nèi)使用頻率最高的詞塊,因此需對(duì)其加以重視。而態(tài)度性詞塊與話語(yǔ)組織性詞塊二者在語(yǔ)用范圍內(nèi)使用頻率相似,與指示性詞塊共同構(gòu)成語(yǔ)用范圍最長(zhǎng)應(yīng)用的詞塊內(nèi)容。因此,在進(jìn)行應(yīng)用語(yǔ)言學(xué)詞塊語(yǔ)用功能分類時(shí),可將指示性詞塊作為基礎(chǔ)。指示性、態(tài)度性、話語(yǔ)組織性詞塊功能劃分見(jiàn)表1。
表1 應(yīng)用語(yǔ)言學(xué)詞塊(三類)功能劃分
指示性詞塊在語(yǔ)料庫(kù)與詞塊表的分布規(guī)律相似,但在詞塊表中,指示性詞塊的應(yīng)用頻率明顯較高,主要針對(duì)語(yǔ)用篇目、語(yǔ)用情景中的時(shí)間與空間的指代。此塊表中則需主要展示指示性詞塊所應(yīng)用的內(nèi)容與主題。 例如 teacher and student(師生)、teach and learn(教與學(xué))等。其在詞塊表中的結(jié)構(gòu)多以介詞短語(yǔ)及名詞短語(yǔ)為主,例如:at the end、the same words等。此外,語(yǔ)料庫(kù)將對(duì)彼此快納入指示性詞塊的劃分,而詞塊表中也將其實(shí)用性充分展現(xiàn)。態(tài)度性詞塊與話語(yǔ)組織性詞塊大多針對(duì)語(yǔ)料庫(kù)中語(yǔ)篇指示、話題介紹等進(jìn)行設(shè)計(jì),在構(gòu)建詞塊表時(shí)需要結(jié)合學(xué)術(shù)論文中常出現(xiàn)的詞塊內(nèi)容進(jìn)行編撰,保障詞塊使用頻率與真實(shí)頻率相符。最后,還需針對(duì)應(yīng)用語(yǔ)言學(xué)詞塊的結(jié)構(gòu)繼續(xù)擰分析,從而確定其在詞塊表中語(yǔ)用功能。有語(yǔ)用學(xué)者會(huì)利用大量的名詞詞組來(lái)確定學(xué)術(shù)語(yǔ)用意義的廣泛內(nèi)涵,例如數(shù)量詞(number)、地點(diǎn)詞(end of the...)、質(zhì)量詞(nature of)等,最終保障詞塊表中詞塊的主題可充分闡釋語(yǔ)用功能。
結(jié)合大量應(yīng)用語(yǔ)言學(xué)SSCI學(xué)術(shù)論文,編制應(yīng)用語(yǔ)言學(xué)詞塊表,同時(shí)針對(duì)詞塊進(jìn)行分析與研究,探索語(yǔ)言應(yīng)用中詞塊的使用,充分重視語(yǔ)用條件,將語(yǔ)料庫(kù)作為詞塊應(yīng)用一大措施,以提高語(yǔ)用水平,減少語(yǔ)用偏誤現(xiàn)象的出現(xiàn),有效避免語(yǔ)用交際、翻譯、閱讀等出現(xiàn)的誤解,并為語(yǔ)言學(xué)的研究提供更多參考資料。
山東農(nóng)業(yè)工程學(xué)院學(xué)報(bào)2018年12期