劉金路,柴改英
(浙江工商大學(xué)外國語學(xué)院,浙江杭州 310018)
?
基于句法樹庫的英語時態(tài)加工難度對比研究
劉金路,柴改英
(浙江工商大學(xué)外國語學(xué)院,浙江杭州310018)
摘要:在依存語法的理論框架下,利用計量方法,運用句法標(biāo)注建立的樹庫對英語時態(tài)及其對應(yīng)的被動語態(tài)的平均依存距離進行了測量分析并對它們的加工難度進行了排序。研究發(fā)現(xiàn):(1)英語時態(tài)及其被動語態(tài)存在加工難度差異;(2)常用的十類英語時態(tài)比剩余六類時態(tài)加工難度小;(3)常用的六類英語時態(tài)的主動語態(tài)比對應(yīng)的被動語態(tài)加工難度小。
關(guān)鍵詞:英語時態(tài);句法樹庫;加工難度
英語時態(tài)(tense)是一種表示行為、動作、狀態(tài)在各種時間條件下的動詞形式,是很基礎(chǔ)且重要的語法知識。不同的時態(tài)用以表示動詞的不同的時間與方式。按照傳統(tǒng)語法,英語共有16種時態(tài),同時,這些時態(tài)也分別對應(yīng)16種被動語態(tài)[1-4]。英語時態(tài)涉及每一個完整的句子,使用廣泛且普遍,因此英語學(xué)習(xí)者自開始學(xué)習(xí)英語時就要與之接觸。根據(jù)研究,在英語教學(xué)及二語習(xí)得過程中,英語時態(tài)是頗具難度的知識點之一[5]。對比英漢時態(tài)的表達形式后不難發(fā)現(xiàn),英語的時態(tài)多體現(xiàn)在語法形式上而漢語更多的使用虛詞或其他詞語的組合表達時態(tài)的概念,缺乏語法形態(tài)上的變化,這就使得中國的英語學(xué)習(xí)者在時態(tài)習(xí)得學(xué)習(xí)的過程中困難不斷,無疑是一種新語言知識的極大挑戰(zhàn)[6][7]。過去的研究發(fā)現(xiàn),無論低年級的中學(xué)生還是高年級的大學(xué)生,他們在英語學(xué)習(xí)過程中仍時常會在時態(tài)方面犯錯誤[8][9]。那英語專業(yè)的高年級大學(xué)生的英語時態(tài)使用又會如何呢?張雪梅,楊瀅瀅[10]通過收集英語專業(yè)學(xué)習(xí)者四、八級考試中的作文語料來考察了中高級學(xué)習(xí)者的時態(tài)習(xí)得概況,發(fā)現(xiàn),雖然時態(tài)形式本身錯誤的比率不高,但仍然存在。
語言類型及結(jié)構(gòu)的差異導(dǎo)致中國學(xué)生習(xí)得英語時態(tài)時很有難度,既有用法上的錯誤也有形式上的誤用或錯寫。英語時態(tài)及其被動語態(tài)的種類繁多,是否某些時態(tài)及其被動語態(tài)結(jié)構(gòu)本身就具備了句法結(jié)構(gòu)的難度呢?哪些時態(tài)及其被動語態(tài)結(jié)構(gòu)的本身加工難度更大一些呢?這些時態(tài)及其被動語態(tài)之間的加工難度是否會有差異?為何將來進行時與完成進行時沒有相對應(yīng)的被動語態(tài)形式呢[3]?對于英語時態(tài)及其語態(tài)的習(xí)得難度的順序又是怎樣的?以上這些問題至今沒有定論。基于此,本研究在依存語法框架下,采用計量方法,運用句法標(biāo)注建立的樹庫對英語時態(tài)及其對應(yīng)的被動語態(tài)的平均依存距離(MDD)進行了測量分析,以期解決以上的諸多疑問。
本文旨在通過英語句法樹庫的標(biāo)注計量,對英語時態(tài)及其被動語態(tài)的加工難度情況進行考量并對比各樹庫所得數(shù)據(jù)顯示的加工難度差異,為英語時態(tài)及其被動語態(tài)的習(xí)得難度差異探尋理據(jù),本研究主要嘗試解決以下三個問題。
(1)英語十六種時態(tài)及其被動語態(tài)的加工難度各自怎樣?加工難度排序又是怎樣的?
(2)英語前十種常用時態(tài)與后六種時態(tài)之間的加工難度有無顯著性差異?
(3)英語前八種時態(tài)的主動與被動語態(tài)之間的加工難度有無顯著性差異?
(一)語料說明
對研究語料需要特別說明的是,英語時態(tài)及其被動語態(tài)的平均依存距離的測算需要將時態(tài)及其被動語態(tài)放于具體的英語句子之中才有意義,因為英語時態(tài)及其被動語態(tài)本身就是句子結(jié)構(gòu)的一部分且在具體的謂語動詞中才得以體現(xiàn)。為控制變量,保證樹庫中語料的完整性與一致性,我們對它們的處理采用了論元一致且最簡的方案,即這些時態(tài)與其被動語態(tài)只含有一個主語與賓語兩種句子成分,且主語與賓語相同無差異,以保證所有時態(tài)及其被動語態(tài)均在相同的語言整體結(jié)構(gòu)下進行計量的。
本研究語料包括兩部分:一是含有英語十六種時態(tài)且主語與賓語相同的十六個英語句子;二是含有英語十六種時態(tài)且主語與賓語相同的十六個英語句子的被動語態(tài)句。
(二)句法標(biāo)注的理論依據(jù)
依存語法(dependency grammar)是由法國語言學(xué)家泰尼埃在1959年提出的語法理論,它認(rèn)為,依存關(guān)系具有以下屬性:(1)它是二元的,即它是一種兩個元素之間的關(guān)系;(2)它是不對稱的,即在關(guān)系兩個元素中一般而言一個元素會支配另一個元素,這是構(gòu)成依存句法樹層級結(jié)體系的基礎(chǔ)。依據(jù)該理論,計量語言學(xué)界提出用依存距離(DD:dependency distance)測量句子結(jié)構(gòu)的加工難度,它是指在一個句子中,兩個有著句法關(guān)系的語言學(xué)單位之間的線性距離[11][12],也被定義為詞語與其支配者之間的距離,可以根據(jù)相鄰詞語的數(shù)量計算獲得。Liu[13]將依存距離作為語言復(fù)雜性的量度標(biāo)準(zhǔn),Jiang&Liu[14]也認(rèn)為,依存距離與人類工作記憶加工密切相關(guān)。簡言之,一個句子的平均依存距離越大,加工難度就越大。
(三)研究方法及程序
依據(jù)以上理論及量度標(biāo)準(zhǔn),本研究運用計量的研究方法,將依存距離作為測量指標(biāo),利用Excel 2013軟件進行句法標(biāo)注,對含有英語十六種時態(tài)且主語與賓語相同的十六個英語句子及其相應(yīng)的被動語態(tài)句共計32句進行句法標(biāo)注,最終形成兩個獨立的句法樹庫,一是含有英語16種時態(tài)的依存句法樹庫;二是含有英語16種時態(tài)的被動語態(tài)的依存句法樹庫。然后,對句法分析的重要指標(biāo)平均依存距離進行定量測算,然后利用SPSS16.0對比分析每個樹庫所得的數(shù)據(jù),檢驗數(shù)據(jù)間的差異是否具有顯著性,這種計量可以使人們對英語時態(tài)及其被動語態(tài)的加工難度有更明晰化的認(rèn)識。
平均依存距離計算過程中,我們以相互依存且相鄰的兩詞間依存距離的絕對值為“1”(依存距離絕對值的最小值)為基礎(chǔ)[13],用支配詞所屬句子序號減去被支配序號所得值為依存距離,有正負(fù)之分,但句子的平均依存距離(MDD)是指句中涉及到的所有依存距離絕對值的平均值。例如,The reporter who attacked the senator admitted the error.中,從左至右的詞序代表序號,分別標(biāo)記為1,2……9.其中,“The”與“reporter”根據(jù)依存語法及句法理論確定后者為支配詞,兩者之間的依存距離為“2-1=1”,得出兩者的依存距離為“1”,本句的平均依存距離則為:
(|2-1|+|7-2|+|2-4|+|4-3|+|4-6 |+|6-5|+|7-9|+|9-8|)/8=1.875。具體標(biāo)注方法如圖1所示。
圖1 句法依存關(guān)系示例
通過以上的理論及標(biāo)注方法,本研究分別將時態(tài)的主動與被動形式進行了標(biāo)注,其依存關(guān)系如下圖2與圖3舉例所示,按照這種依存關(guān)系標(biāo)注句子從而形成英語時態(tài)及其被動語態(tài)的兩個句法樹庫,利用Excel2013軟件分別計算出了各自的平均依存距離(MDD:Mean Dependency Distance)再作差異顯著性檢驗。
圖2 英語時態(tài)的主動形式的依存關(guān)系
圖3 英語時態(tài)的被動形式的依存關(guān)系
(一)英語十六種時態(tài)及其被動語態(tài)的加工難度成正比
根據(jù)標(biāo)注的樹庫計算所得的英語時態(tài)的平均依存距離(MDD)數(shù)據(jù),筆者按照MDD的值從小到大的順序?qū)ζ溥M行了排列。由于MDD越大,加工難度就越大,首先,我們可以得知,一般現(xiàn)在與一般過去的MDD最小,說明它們的加工難度最??;其次,在很多教科書,考試大綱及語法書中涉及到時態(tài)語態(tài)的數(shù)量時,大多指的都是常用的前十種時態(tài)形式,對應(yīng)下邊表1不難發(fā)現(xiàn),恰好從第一種到第十種時態(tài)的MDD是逐漸增大的,而剩余的后六類難度逐漸增大,一直到最后的“過去將來完成進行”,其MDD已達到了2.2,我們認(rèn)為這應(yīng)該就是我們常用時態(tài)表達形式主要涉及前十種的原因,這個加工難度的排列正是其理據(jù)所在。
表1 十六種英語時態(tài)的各項統(tǒng)計
按照表1的MDD排列,我們可以得到如下圖4所示的英語16種時態(tài)加工難度排序表(由左至右,加工難度逐漸增大)。
圖4 英語16種時態(tài)加工難度排序表
根據(jù)標(biāo)注的樹庫計算所得的英語時態(tài)的被動語態(tài)的平均依存距離(MDD)數(shù)據(jù),筆者也按照MDD的值從小到大的順序?qū)ζ溥M行了排列。首先,我們可以得知,一般現(xiàn)在的被動與一般過去的被動的MDD最小,說明它們的加工難度最小;其次,在很多語法書[3]中談到“將來進行時與完成進行時沒有相對應(yīng)的被動語態(tài)形式”,這背后有何依據(jù)?原因在哪里呢?通過表2不難發(fā)現(xiàn),從“現(xiàn)在完成進行被動”開始的MDD值上升到了1.83,而之前的數(shù)據(jù)是1.6,且大于現(xiàn)在完成進行時的1.75,明顯在加工難度上有所增大。我們認(rèn)為這應(yīng)該就是該語法規(guī)則限制的理據(jù)所在。再次,對于表2中的排序,我們可以看出,前八種形式恰恰是我們很多語法書及考試大綱中提出要求的那些被動語態(tài)形式。
表2 十六種英語時態(tài)的被動語態(tài)各項統(tǒng)計
按照表2的MDD排列,我們可以得到如下圖5所示的英語16種時態(tài)的被動語態(tài)的加工難度排序表(由左至右,加工難度逐漸增大)。
圖5 英語16種時態(tài)的被動語態(tài)加工難度排序表
(二)英語前十種常用時態(tài)與后六種時態(tài)之間的加工難度對比
在表1中列出了英語的十六種時態(tài)的MDD排序,且通過分析驗證了前十種時態(tài)是常用形式,而后六種時態(tài)隨著MDD的增大其加工難度也在增加,那么前十種常用時態(tài)與后六種不常用甚至不用的時態(tài)之間的加工難度有無顯著性差異呢?如果有,那么說明兩者之間確實在加工難度上有著明顯差異,這也可以為前十種時態(tài)的常用找到理據(jù)。
我們利用SPSS16.0對以上的兩組數(shù)據(jù)進行顯著性檢驗,檢驗前我們進行了數(shù)據(jù)的正態(tài)分布檢驗,從表3與表4可知,前十種英語時態(tài)及后六種時態(tài)的平均依存距離的數(shù)據(jù)值服從正態(tài)分布,可以進行參數(shù)T檢驗。
表3 正態(tài)分布數(shù)據(jù)(1)
表4 正態(tài)分布數(shù)據(jù)(2)
表5 兩類英語時態(tài)間的平均依存距離差異
表6 獨立樣本T檢驗數(shù)據(jù)表
表5與表6是T檢驗具體反映的數(shù)據(jù)結(jié)果,在表6即表Independent Samples Test(獨立樣本T檢驗)中,通過Levene′s Test for Equality of Variances(方差齊次性檢驗)中Sig.0.633可以看出明顯大于0.05,因此獨立樣本T檢驗的結(jié)果應(yīng)該以Equal variances assumed欄為準(zhǔn)。由于其p值0.001明顯小于0.05,說明零假設(shè)被推翻,通過效應(yīng)量計算得知d=2.3,明顯大于0.8,表明,英語十六種英語時態(tài)中的前十種常用時態(tài)的平均依存距離(1.3480+0.25108)與后六種時態(tài)的平均依存距離(1.9000+0.23238)具有顯著性差異,且差異性較大,t(14)=4.371,P〈0.05,d=2.3。
兩類英語時態(tài)間的平均依存距離有著較大的明顯差異,說明了兩者之間的加工難度存在明顯差異,其中,后六類時態(tài)的平均依存距離為1.900大于前十類英語時態(tài)的平均依存距離1.348,這樣就對后六類時態(tài)形式在英語語言的具體使用中幾乎沒有涉及找到了理據(jù)所在。
(三)英語前八種時態(tài)的主動與被動語態(tài)之間的加工難度對比
在表1與表2中列出了英語的十六種時態(tài)及其被動語態(tài)的MDD排序,通過對比不難發(fā)現(xiàn),在表2中的前八種被動語態(tài)是我們經(jīng)常會見到且有用到的,那么我們可以對比這八種被動語態(tài)及其對應(yīng)的主動語態(tài)(前八種時態(tài))之間的MDD有無顯著性差異,從而探尋英語時態(tài)的主動與被動形式之間的加工難度有無顯著性差異,如果有,兩者哪一個的加工難度更大呢?
表7 英語時態(tài)與被動語態(tài)間的平均依存距離差異(Group Statistics)
表8 獨立樣本T檢驗數(shù)據(jù)表(Independent Samples Test)
表7與表8是T檢驗具體反映的數(shù)據(jù)結(jié)果,在表8即表Independent Samples Test(獨立樣本T檢驗)中,通過Levene′s Test for Equality of Variances(方差齊次性檢驗)中的Sig.值0.852可以看出明顯大于0.05,因此獨立樣本T檢驗的結(jié)果應(yīng)該以Equal variances assumed欄為準(zhǔn)。由于p值0.005明顯小于0.05,說明零假設(shè)被推翻,通過效應(yīng)量計算得知d=1.68,明顯大于0.8,表明英語十六種英語時態(tài)中的前八種常用時態(tài)的平均依存距離(1.248+0.528)與其被動語態(tài)間的平均依存距離(1.513+0.162)具有顯著性差異,且差異性較大,t(14)=3.366,P〈0.05,d=1.68。
兩類英語語態(tài)間的平均依存距離有著較大的明顯差異,說明了兩者之間的加工難度存在明顯差異,其中,前八類被動語態(tài)的平均依存距離為1.513,大于前八類時態(tài)(主動語態(tài))的平均依存距離1.248,可以看出英語時態(tài)的被動語態(tài)在加工處理上要更有難度。
本文考量了英語時態(tài)及其被動語態(tài)的加工難度問題,在依存語法的理論框架下,運用計量的研究方法,將依存距離作為測量指標(biāo),利用Excel 2013軟件進行了句法標(biāo)注,并利用SPSS16.0統(tǒng)計軟件對樹庫所得數(shù)據(jù)進行了差異顯著性的分析對比,研究發(fā)現(xiàn),(1)英語時態(tài)及其被動語態(tài)存在加工難度差異;(2)常用的十類英語時態(tài)比剩余六類時態(tài)加工難度?。唬?)常用的六類英語時態(tài)的主動語態(tài)比對應(yīng)的被動語態(tài)加工難度小。
該計量分析所得數(shù)據(jù)及加工難度的排序?qū)橛⒄Z時態(tài)及其語態(tài)的教學(xué)提供參考,有助于英語學(xué)習(xí)者時態(tài)及被動語態(tài)習(xí)得效率的提高,加深對其結(jié)構(gòu)表達式的理解與掌握,提高其英語時態(tài)及其被動語態(tài)運用的正確率,包括理解和產(chǎn)出的正確性及靈活度,為其結(jié)構(gòu)復(fù)雜性認(rèn)識提供了理論及數(shù)據(jù)參考。本研究的語料數(shù)量還略小,加工難度差異對比的參照點還可以更加細(xì)化,選擇的語料有待改進與完善,期待后續(xù)相關(guān)研究能有更加權(quán)威的研究發(fā)現(xiàn)。
[參考文獻]
[1]Quirk R,etal.A Comprehensive Grammar of the English Language[M].London:Longman Group Ltd,1985.
[2]徐廣聯(lián).大學(xué)英語語法[M].上海:華東理工大學(xué)出版社,2003.
[3]薄冰.實用英語語法[M].太原:山西教育出版社,2004.
[4]Murphy R.English Grammar in Use(Fourth Edition)[M]. Cambridge:Cambridge University Press,2012.
[5]Bardovi-Harlig K.Tense and Aspect in Second Language Acquisition:Form,Meaning,and Use[M].Oxford:Blackwell,2000.
[6]蔡慧萍.漢語不對應(yīng)現(xiàn)象和外語學(xué)習(xí)中的負(fù)遷移[J].外語教學(xué),1999(2):92-95.
[7]楊惠中,桂詩春,楊達復(fù).基于CLEC語料庫的中國學(xué)習(xí)者英語分析[M].上海:上海外語教育出版社,2005.
[8]樊長榮,林海.中國學(xué)生英語時體習(xí)得中的兩大誤區(qū)[J].外語教學(xué)與研究,2002(6):414-420.
[9]韓存新,樊斌.英語寫作中的現(xiàn)在完成時錯誤分析[J].基礎(chǔ)英語教育,2007(2):20-23.
[10]張雪梅,楊瀅瀅.英語專業(yè)學(xué)習(xí)者的時態(tài)習(xí)得現(xiàn)狀——一項基于中國英語專業(yè)寫作語料庫的研究[J].外國語文,2009(3):133-138.
[11]Heringer H J,Strecker B,Wimmer R.Syntax:Fragen-Lo¨ sungen-Alternativen[M].München:Wilhelm Fink Verlag,1980.
[12]Hudson R.Measuring Syntactic Difficulty.Unpublished paper[EB/OL].(2008-07-06)http://www.phon.ucl.ac.uk/home/ dick/difficulty.htm.
[13]Liu Haitao.Dependency Distance as a Metric of Language Comprehension Difficulty[J].Journal of Cognitive Science,2008,9(2):159-191.
[14]Jiang Jingyang&Haitao Liu.The Effects of Sentence Length on Dependency Distance,Dependency Direction and the Implications-Based on a Parallel English-Chinese Dependency Treebank[J].Language Sciences,2015(50):93-104.
(責(zé)任編輯:劉婧)
中圖分類號:H314
文獻標(biāo)識碼:A
文章編號:2096-2126(2016)03-0057-06
[收稿日期]2016-03-12
[基金項目]2015年浙江工商大學(xué)研究生科研創(chuàng)新基金重點項目“基于句法樹庫的英語從句依存距離研究”(14020000248)階段成果。
[作者簡介]劉金路(1981—),男,山東泰安人,碩士,研究方向:句法學(xué),依存語法及計量語言學(xué);柴改英(1968—),女,山西太原人,浙江工商大學(xué)外國語學(xué)院院長,教授,博士,碩士生導(dǎo)師,研究方向:修辭學(xué),英語教學(xué)及語用學(xué)研究。
Processing Difficulty in English Tense:A Contrastive Study Based on English Treebanks
LIU Jinlu,CHAI Gaiying
(School of Foreign Languages,Zhejiang Gongshang University,Hangzhou 310018 China)
Abstract:According to the theoretical framework of dependency grammar,the treebank is established using metrology method and syntactic tagging in order to carry out the measuring analysis of English tenses and their corresponding average distance dependence of the passive voice,and sort the processing difficulty as well.The study finds:(1)There exists the difference of processing difficulty in English tenses and their corresponding passive voices;(2)There exists less processing difficulty in the ten English tenses frequently used than the remaining six ones;(3)There exists less processing difficulty in the six English tenses than their corresponding passive voices.
Key words:English tense;syntactic treebank;processing difficulty