鐘春蒙 金勇男 鄒善軍
(大連理工大學軟件學院,遼寧 大連 116621)
視頻語料庫是一種新型的語料庫系統(tǒng)。它擁有材料真實、題材廣泛、風格迥異、語音語調不同等特點。對于語用學研究有著劃時代的意義。迄今為止,關于視頻語料庫建設的著作很多,但是如何利用視頻預料庫進行實證研究的作品卻很少見。本文作者是在大學生創(chuàng)新項目中立項對日語條件句進行基于視頻語料庫的分類研究。作為階段性成果初步歸納了基于視頻語料庫的實證研究方法。日語的條件表達方式多種多樣,是日語學習的一個重點,也是一大難點。目前為止,關于日語條件句的研究很多,從理論研究到實證研究,條件句的研究日趨完善。這些研究成果有的是綜述性的文獻,有的是基于文本語料庫,或者是基于影視劇腳本的純語法性的或者是實證性的研究。雖然研究內容很詳盡,研究成果也很有獨創(chuàng)性,但是在一些方面還是有所欠缺。因為研究材料的局限性,不能在真實的語境中探討條件句的用法,進而導致研究內容和結果沒能夠更真實的反映自然語言中條件句的具體表象?;谠诰€日語智能視頻語料庫,從虛擬自然語境的視角來進行日語研究,是解決上述研究缺陷的途徑之一,而如何高效準確的進行這一研究,是本文將要具體論述的問題。
本研究組于2015年春進行了基于視頻語料庫的日語“と”條件句研究。因為是初次進行基于視頻語料庫的研究,所以研究過程都是嘗試性地進行?,F將研究經驗與方法歸納總結如下。
要進行針對“と”條件句的甄選和分類研究,首先需要獲得研究素材,也就是模擬真實語境下的“と”條件句使用實例。我們將原材料的搜集步驟總結如下:
1)登陸JV-Finder語料庫,依次輸入“うと、くと、ぐと、すと、つと、ぬと、ぶと、むと、ると”并進行查找,查找結果按日劇名排列;
2)在同一部日劇的搜索結果中進行篩選,篩除非本動詞接と的用例、慣用句等,找出遵循本研究定義的“と”條件句[1],即動詞原型+と句型的非慣用句的句子,并將視頻片段下載保存;
3)制作表格,將視頻片段編號、條件句文本、條件句中文翻譯、來源日劇名依次輸入表格。注意視頻文件名中的編號要和表格中的日語句編號一一對應,方便后續(xù)研究的進行;
4)在每部日劇中搜集30段條件句視頻片段(目標是總體收集1000句,以便于對比分析)。將同一部日劇的視頻片段和日語句整理表格放入同一文件夾,文件夾用日劇名命名。若條件句數目不足30句,也在命名中標注;
5)完成一部日劇的條件句搜集工作后,將整理表格交由指導教師審查。對于不合乎研究標準的條件句,收到反饋后剔除,同時對視頻文件和表格材料中的排序重新整理,以防序號與材料不對應;
6)若存在不合乎要求的條件句,則重復1)-4)步驟。將每一部日劇最終結果保存并在團隊內共享;
7)完成語料庫中全部29部日劇的搜集工作后,開始具體分類工作。
在得到原始素材之后,需要對這些素材按照具有權威性的先行研究所劃分的“と”條件句種類進行整理,以便找到其使用特點和使用頻率。分類過程總結如下:
1)小組成員根據現有權威性條件句研究資料對“と”條件句分類進行分析研究,之后總結出能夠代表各類條件句特點的關鍵詞[2]和分類具體標準,“と”條件句的分類按照這些標準進行;
2)小組成員分別根據制定出的關鍵詞和分類標準進行分類。在每一份表格的最后一列對每一個句子進行標注,標注的內容為本類條件句的關鍵詞;
3)成員單獨分類完成后,成員之間匯總分類結果,對分類有異議的句子進行討論,若仍無法確定其類型,則另外進行特殊標記;
4)將成員間匯總之后的結果上交給指導教師,指導教師對分類結果進行確認,并對特殊標記句子進行解釋,同時成員也可對指導教師的分類提出異議,經最終討論確定歸屬種類;
5)將分類之后的表格同樣放入該日劇的文件夾中,并保留之前所有版本的臨時檔案,以備以后遇到分類困難時查考;
6)將分類后的所有日語句整理到同一個表格中,按照類型進行排序,整理出每一種類條件句的數目,將該表格留存。
分類完成之后需要對結果進行分析從而發(fā)現其中的規(guī)律。分析的方式分兩種:第一種是對基于視頻語料庫的研究結果本身進行分析;另一種,是將結果與基于文本語料庫的研究結果進行對比。筆者將最后的分析步驟總結如下:
1)將分類成果表格按條件句種類重新編排,統(tǒng)計出各種類型“と”條件句的數目和比例并且整理該種類的所有例句;
2)通過查閱先行研究文獻,找出基于文本語料庫的“と”條件句研究結果,統(tǒng)計出該結果中各種類型條件句的數目和比例;
3)將兩類研究結果綜合,對比取自文本語料庫和視頻語料庫的條件句各種類型占總體的比例,做出統(tǒng)計圖表;
4)基于統(tǒng)計結果進行分析,得出基于視頻語料庫的“と”條件句使用特點和各類型使用傾向。
本研究的研究結果已經表明,基于文本語料庫的研究和基于視頻語料庫的研究結果有一定的區(qū)別。這說明真實語境中日語“と”條件句的使用特點與文本中的使用特點不盡相同,真實語境是日語使用中很重要的一個場景,對語言的實證性研究僅僅局限于文本語料庫是不全面的。相信本研究會為今后基于視頻語料庫的研究在方法上提供一定的提示作用。
注1:本研究中不符合要求的“と”條件句匯總如下:
(1)非動詞基本型接と:書けると、見ていると、言われると
(2)慣用句:となると、すると、というと、といい
注2:在本研究中將“と”條件句的類型總結為如下關鍵詞:
(1)一般的関係(自然法則、社會法則、現在の習慣、過去の習慣)
(2)現実狀況、現実警告
(3)発見、発生
(4)異主語契機、同主語契機
(5)動作の連続等五類關鍵詞
[1][日]蓮沼昭子,有田節(jié)子,前田直子.條件表現[M].東京:くろしお出版.(2001).
[2][日]前田直子.日本語の複文-條件文と原因·理由文の記述的研究[M].東京:くろしお出版,2009.
[3]李光赫.日中対照から見る條件表現の諸相[M].大阪:風詠社.(2011a).
[4]李光赫.條件を表わす接続助詞トにおける日中対照[J].國語學研究.(2005).
[5]李光赫.ト形式の時間的限定性における日中対照[J].日中言語対照研究論集.(2011b).
[6]鄒善軍,李光赫.日中対訳から見るタラ條件文の実証的研究[J].研究會報告/日本語文法研究會.(2014).
[7]李光赫,鄒善軍,湯明昱.日中対照から見る原因·理由文の諸相 [M].大阪:風詠社.(2015).