亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        廣義話題結(jié)構理論視角下話題自足句成句性研究

        2014-02-28 01:26:26盧達威
        中文信息學報 2014年6期
        關鍵詞:標點語義漢語

        尚 英,宋 柔,盧達威

        (1. 北京語言大學 預科教育學院,北京,100083 2. 北京語言大學 語言信息處理研究所,北京,100083)

        1 引言

        話題是當前漢語本體研究和語言信息處理研究中的熱點。趙元任[1]指出“把主語、謂語當做話題和說明來看待,較為合適?!敝斓挛鮗2-3]繼承了這種觀點。Li 和 Thompson[4]從類型學的角度指出漢語屬話題凸顯的語言,后又對句子的話題和主語做了系統(tǒng)對比。徐烈炯,劉丹青[5]認為漢語中話題被高度語法化,成了一種句法成分。曹逢甫[6-7]在漢語篇章層面上提出了“主題鏈”概念;沈開木[8]、屈承熹[9]、許余龍[10]等也在篇章層面對話題進行了研究。呂叔湘[11]、范繼淹[12]、沈家煊[13]發(fā)展了趙元任的零句說,關注了漢語流水句現(xiàn)象,同時對漢語話題也有深入研究;陳平[14]從零形回指的角度探討了漢語話題推進情況。

        話題研究在理論探索過程中取得了豐富的成果,綜觀這些成果,可以看到: 目前關于漢語話題的研究在理論上進行了多方面探討,由于不以應用為直接目標,所得結(jié)論和規(guī)則還不能直接用于信息處理等領域。例如,關于“話題”的論述中的最基本的單位——漢語的句子,有的人進行了定義,而有的人沒有。依據(jù)現(xiàn)有的關于漢語“句子”的定義,在實際語料中仍然難以清晰地把握“句子”的邊界。此外,上述成果在觀點論證過程中多采用舉例的方法,少見大規(guī)模真實語料的系統(tǒng)性調(diào)查分析。目前研究多引口語和敘述體小說中的實例,這在一定程度上束縛了研究范圍,將視野放至多語體將更有助于漢語話題及話題結(jié)構的深入研究。

        宋柔[15]面向語言工程的需要,以標點句為基本單位,提出了廣義話題結(jié)構的概念和表示方法,歸納出了廣義話題結(jié)構遵從的堆棧模型并拓展為流水模型,指出廣義話題結(jié)構具有兩個重要性質(zhì): 話題的不可穿越性和話題自足句的成句性。本文在38萬字不同語體的廣義話題結(jié)構語料庫中,基于人工標注對話題自足句的成句性進行了實證性調(diào)查和研究。

        2 話題自足句及其成句性

        話題自足句是在廣義話題結(jié)構理論的基礎上定義的。漢語篇章中的每個標點句都對應一個話題自足句。如果標點句不共享其他標點句中成分,那么它的話題自足句就是它本身。否則,設標點句c在廣義話題結(jié)構S中,S是根據(jù)流水模型理論表示的,把c在S中的話題逐個地按原順序補充到c的左端,把c在S中的說明或說明尾部逐個地按原順序補充到c的右端,最后得到的就是c在S中的話題自足句?!白宰恪钡囊馑际?,c在字面上能找到的話題都找到了,都集中在這個“句子”中。例如,

        例1

        普通八哥較常見,通體黑色,嘴基上羽額聳立,形成羽幘;頭頂、頰、枕和耳羽具綠色金屬光澤;

        我們用表1顯示例中標點句與話題自足句之間的對應關系,左欄是標點句換行縮進圖示,右欄是每個標點句對應的話題自足句,其中標下劃線的部分是補上的話題。

        表1 例1的標點句與話題自足句的對應

        話題自足句具有成句性,這是從話題和篇章的角度說的。任何自然語言中“句子”的成句性都是無法嚴格定義的,漢語缺少形式標記,更無法嚴格定義,區(qū)分是否成句的操作基礎只能是語感。這種語感的大致意思是: 語法通順并且語義清楚正確。反過來說,不成句的話題自足句或者是語法不通,或者是語義不清甚至語義錯亂。

        趙元任、朱德熙、沈家煊等人指出,漢語的主謂關系就是話題—說明關系。因此可以說漢語中結(jié)構完整的“成句”的單位,具有話題—說明關系。那么,反過來,一對具有話題—說明關系的詞語串,中間不加標點,是否能連成句呢?

        從理論上說,這個問題的答案是否定的。因為我們談的是廣義話題結(jié)構,包括狀中關系、述賓關系等結(jié)構,它們句法成分不完整,通常會導致語義不清。當然,從實際調(diào)查中看,廣義話題結(jié)構中大多數(shù)的話題—說明關系,從句法結(jié)構的角度看就是主謂關系,這對于成句性是一種正面的保障。

        語料庫的調(diào)查說明,絕大多數(shù)話題自足句都是成句的。上例的話題結(jié)構中用堆棧模型生成話題自足句S1—S5都是成句的。再看下面的例子。

        例2

        ……已編入‖《愛因斯坦文集》,

        中文本 共3卷,

        由許良英、趙中立、范岱年、李寶恒、張宣三編譯,

        這個話題結(jié)構用節(jié)棧模型生成話題自足句S1—S3如下,都是成句的:

        S1: ……已編入《愛因斯坦文集》,

        S2: 《愛因斯坦文集》中文本共3卷,

        S3: 《愛因斯坦文集》中文本由許良英、趙中立、范岱年、李寶恒、張宣三編譯,

        例3

        『制定……,

        繼續(xù)……,』

        是全國人民關心的大事。

        這是匯流模型的話題結(jié)構,標記“『』”括起來的標點句,其說明部分在括號后面。用匯流模型生成話題自足句如下。

        S1: 制定……是全國人民關心的大事。

        S2: 繼續(xù)……是全國人民關心的大事。

        S1、S2都是成句的。

        例4

        吃完晚飯,

        邢老漢叼著煙鍋想說點什么,

        這是話題后置的話題結(jié)構,用逆向堆棧模型生成話題自足句:

        S1: 邢老漢吃完晚飯,

        S2: 邢老漢叼著煙鍋想說點什么,

        S1、S2都是成句的。

        由上文話題自足句的生成過程可以看出,每個話題自足句只帶一個說明。如果其中的話題在標點句序列中還帶有其他說明,那些說明就被割除了。畢竟少了信息,且去除了標點句間的停頓,于是可能發(fā)生語法不通、語義不清甚至錯亂的情況,使得少數(shù)話題自足句不成句。

        3 話題自足句及其成句性研究的意義

        首先,漢語中沒有天然的“句子”。在現(xiàn)實的漢語篇章中,只能看到標點句。基于廣義話題理論的話題自足句可看作抽象的“句子”在漢語中存在的現(xiàn)實形態(tài)。這種句子同其他語言中的“句子”處于同一語法層面。漢語學界對于理想的“單句”已經(jīng)進行了長期深入的研究,積累了大量成果。于是,把話題自足句當作單句,當作從標點句到篇章的中間層次,是一種理論上和實踐上都比較理想的篇章語法體系構建方法。

        第二,對于語言信息處理來說,把話題自足句當作從標點句到篇章的中間層次也是比較適當?shù)摹S嬎阏Z言學對于單句的分析已經(jīng)比較成熟。話題自足句相當于單句,其中積聚了比較完整的信息,對于機器翻譯、信息提取、自動文摘等應用具有現(xiàn)實的價值。話題自足句的成句性則保證了單句分析的成果能夠運用到話題自足句上來。

        第三,漢語篇章中約一半的標點句需要從廣義話題結(jié)構中共享話題信息。聽者/讀者在聽/讀的過程中,接收的只是標點句。把標點句所缺少的信息補充完整,應當是人的認知過程不可或缺的一步。話題自足句具有如下性質(zhì): 信息比較完整;保全了標點句的詞序,而詞序?qū)τ跐h語的重要性是大家的共識;生成過程足夠簡單,可以適應人腦實時處理標點句的需要。由于話題自足句的這些性質(zhì),我們雖然不能說人在這一步認知過程結(jié)束時,大腦中存儲的認知結(jié)果的形式一定是一個話題自足句,但可以猜想這種認知結(jié)果的形式同話題自足句具有相當大的相似性。因此,話題自足句的研究對于探索人的語言認知過程具有重要意義。

        第四,我們特別關注話題自足句中少數(shù)不成句的現(xiàn)象,詳盡地調(diào)查和發(fā)現(xiàn)這類實例,歸納這種現(xiàn)象的特征,研究使其成句的方法。這樣做的目的有4個。一是通過話題自足句成句性的視角,發(fā)掘漢語中過去未曾注意到的語言現(xiàn)象,推進漢語的研究;二是基于這些特征,想辦法通過完善廣義話題結(jié)構的模型,改進話題自足句的構造方法,提高話題自足句的成句率;三是基于這些特征,剔除不成句的話題自足句,從而提高使用話題自足句的應用系統(tǒng)的性能;四是發(fā)現(xiàn)話題自足句與人的認知結(jié)果在形式上的差異,進一步探索人的認知機制。

        4 話題自足句不成句現(xiàn)象的分類研究

        4.1 句法不通

        4.1.1 篇章功能成分

        有的篇章功能成分用在話題與說明之間,導致話題與說明相連以后不成句??煞?類。

        4.1.1.1 句間連詞

        有些句間連詞如“但是”、“并且”“然后”等,可以用在用作說明的獨立標點句之首,可以用在兩個具有相應邏輯關系的說明之間,但不能用在話題與說明之間。當用作說明的標點句句首有這種成分時,話題與說明相連所形成的話題自足句就不成句。

        例5

        在企業(yè)管理工作開展的過程中,預算管理一直是整項工作開展的重要內(nèi)容,其不僅對資金運用效率提升具有重要促進作用,同時也為企業(yè)決策有效的財務數(shù)據(jù)支撐。但是,在目前階段,各個企業(yè)對于財務預算管理工作的開展并未充分重視起來,導致企業(yè)資金運行受到限制,無法為員工提供更好的工作環(huán)境和工作條件。基于此,針對以預算為核心的財務管理制度建設這一課題進行了深入探討,具有重要現(xiàn)實意義。

        他房子里只有一鋪炕和兩個舊得發(fā)黑的木板箱,

        “但”是表示轉(zhuǎn)折的句間連詞,它可以出現(xiàn)在標點句之首,包括話題前和說明前(如本例那樣),可以出現(xiàn)在兩個具有轉(zhuǎn)折關系的說明之間,如“他數(shù)學很好但語文很糟”,但不能出現(xiàn)在話題與說明之間。當它出現(xiàn)在用作說明的標點句的首部時,如果把話題和說明部分連成一個話題自足句,這個問題就暴露出來了。“他房子里但收拾得倒很干凈?!敝小暗碧幵诰渥又髦^關系的話題與說明之間,導致了話題自足句句法不通。為解決這個問題,可以修改廣義話題結(jié)構理論中話題自足句的處理方法,在對話題自足句作句法分析時臨時把連詞“但”刪除,待進行話題自足句之間的邏輯關系分析時,再考慮“但”的功能。又如,

        例6

        1976年4月,

        他再次失去一切職務,

        “并”是表示遞進的連詞,它可以出現(xiàn)在標點句之首,也可以用在兩個具有遞進意義的說明之間,但不能出現(xiàn)在話題與說明之間。本例中話題和說明部分連成一個話題自足句“1976年4月他并受到錯誤批判”“并”處在句子主謂關系的話題與說明之間,導致了話題自足句句法不通。

        這類連詞是一個封閉的集合,在話題自足句生成過程中如果遇到這些連詞,正常順序下不成句,可以通過機械的辦法將其調(diào)整成句。

        4.1.1.2 代詞

        有些代詞可以離開上下文單獨使用,如“你、我、他”等,有的代詞離開上文語境便不能獨立使用,如“其、其余、前者”等。它們也是可以出現(xiàn)在標點句首,但不能出現(xiàn)在話題后面。否則,一旦把話題和說明連成話題自足句,就會導致語法不通。

        例7

        大黃魚是鱸形目石首魚科黃魚屬的1種。

        ……

        體長橢圓形,

        側(cè)扁。

        尾柄細長,

        例中最后一個標點句,話題與說明連接成話題自足句“大黃魚尾柄其長為其高的3倍多”句法不通,原因是代詞“其”雖然能作主語,但不能出現(xiàn)在它指代的名詞的后面緊鄰處,因而生成話題自足句時,不能出現(xiàn)在話題和說明之間。

        還有一些篇章成分,由于在語料中出現(xiàn)次數(shù)較少,在此略去。

        4.1.2 標點句中賓語成為新支話題

        標點句中的賓語被后面的標點句說明形成新支話題結(jié)構,此時新支話題作為原標點句中的賓語,往往是不定指的,但是在生成的話題自足句中是主語,通常要求定指,否則句法錯誤。為此,要將不定指變成定指,辦法是加定指代詞“這、這些”等。如果原來新支話題以“一”加量詞的數(shù)量結(jié)構開始,其中的數(shù)詞“一”往往要刪除。

        例8

        C1:那都是‖些愣頭愣腦的小伙子 。

        C2: 前天把一個賣瓜子的捆了一繩子,

        C3: 昨天又把一個木匠的家伙收了,

        C4: 害得人連哭帶嚎。

        例中新支話題是“些愣頭愣腦的小伙子”,與說明“前天把一個賣瓜子的捆了一繩子,”“昨天又把一個木匠的家伙收了,”連接成話題自足句時,須在話題前加定指代詞“這”,使得話題自足句成為“這些愣頭愣腦的小伙子前天把一個賣瓜子的捆了一繩子,”“這些愣頭愣腦的小伙子昨天又把一個木匠的家伙收了,”“這些愣頭愣腦的小伙子昨天又害得人連哭帶嚎?!?/p>

        例9

        邢老漢思忖了幾鍋子煙的工夫,

        思忖出了‖一個主意 ,

        就是給狗求得一個官方保護。

        上例中的新支話題“一個主意”,是不定指的,與說明“就是給狗求得一個官方保護”連接成話題自足句“一個主意就是給狗求得一個官方保護”時,所表示的語義成了“主意之一”。如果要保持原意又要語法通順,就須在話題前加定指代詞“這”,同時需要刪除數(shù)詞“一”,成為“這個主意就是給狗求得一個官方保護。”

        語料中我們還發(fā)現(xiàn)兩例新支話題結(jié)構因文言而導致話題與說明連接不成句的情況,此處不詳述。

        4.2 語義模糊不清或語義錯亂

        首先我們將話題自足句語義問題分為3大類: 第一類是首部語義缺失,歸為主語省略句;第二類話題自足句主謂齊全,但語義不清楚;第三類是話題自足句主謂齊全,能夠獨立表達清楚的語義,但是獨立表達的語義與其在標點句序列中的語義不一致。

        主語省略句情況復雜,受篇幅所限,需另文詳述,這里只討論其它兩類。

        4.2.1 語義不清

        話題所在句(準確地說是話題所在的標點句所對應的話題自足句。這里和下面的例子中,為了避免行文繁雜,就直接說話題所在句)中的舊對象,與說明標點句中的新對象,在標點句序列中的關系是清晰的,當中間的標點句被隔離,話題與說明直接相連成為話題自足句時,這種成分之間的語義關系可能模糊不清,需要添加虛性詞顯性地表示它們的關系。從語料調(diào)查中的情況看,引起語義不清的成分,其語義角色主要有以下幾種。

        4.2.1.1 時間

        例10

        C1:慈云桂是中國計算機專家。

        ……

        C2: 中華人民共和國成立后 ,

        C3: 任副教授、教授、……,

        C4: 長期從事……工作。

        例中“中華人民共和國成立后”一句是事件性時間,同時它帶有兩個說明需要形成內(nèi)層話題結(jié)構,是外層話題“慈云桂”的說明,直接生成話題自足句為:

        S3: 慈云桂中華人民共和國成立后任副教授、教授、系主任……,

        S4: 慈云桂中華人民共和國成立后長期從事教學和研究工作,

        S3、S4的語義結(jié)構關系是{主體1+時間+行為}。

        主體和行為之間插入時間成分時,時間成分通常是簡單的時間名詞、時間名詞短語,例如,

        我昨晚上急得一夜沒睡著。

        馬西莫夫2006年出任哈政府副總理。

        他們黃昏前到達了另一個村鎮(zhèn)。

        當時間成分為事件性時間時,通常該事件行為與時間成分后面的行為均由同一主體發(fā)出或者是模糊的主體,例如,

        他畢業(yè)后回了上海。

        我們開會前先收拾一下會議室。

        事件性時間“畢業(yè)后”、“開會前”中的行為“畢業(yè)”、“開會”的主體有兩種可能,一種是與時間成分后面的行為主體統(tǒng)一,前一例都是“他”,后一例是“我們”;另一種可能是“畢業(yè)”、“開會”的主體是模糊的,不特別指明。

        事件性時間{主體2+行為+時間方位詞}中出現(xiàn)了新的主體即主體2,則兩個主體之間需要插入顯性的標記,表示主體2是時間成分的開始,整個話題自足句可以分析為{主體1+{主體2+行為+時間方位詞}+行為};否則主體1與主體2關系不清楚,導致整個句子語義模糊。上例中的S3、S4即是這種情況。

        這種情況下,需要在主體2前加形式標記,本例中可以加介詞“在”:

        S3: 慈云桂在中華人民共和國成立后任副教授、……,

        S4: 慈云桂在中華人民共和國成立后長期從事教學和研究工作,

        4.2.1.2 處所

        新舊對象之間存在主體與處所、處所與狀態(tài)的關系,需要通過加詞的方式將處所成分顯性表示出來。

        例11

        c1: 斑鰶是鯡形目鯡科斑鰶屬的1種,

        ……

        c2: 分布于印度到東印度群島和朝鮮及日本南部,

        c3: 中國沿海均有分布。

        上例話題“斑鰶”為已有對象,與標點句c3中“中國沿?!笔侵黧w與處所的關系,可以在處所成分前加“在”,對應的話題自足句是:

        斑鰶在中國沿海均有分布。

        4.2.1.3 存在物、部件、可用設施或擁有物

        話題與跨標點句的說明中的對象是主體與存在物、部件、可用設施、擁有物等關系時,常需要在對象前加“有”表示主體和對象之間的關系。

        例12

        c1: 帶魚是鱸形目帶魚科帶魚屬的1種(見圖帶魚外形)。

        ……

        c2: 卵徑約為1.4~2.2毫米,

        c3: 油球一個,

        c4: 油球徑為0.4~0.5毫米;

        標點句c3中的“油球”是卵的一個部件,需要在前面插入“有”,得到話題自足句“帶魚卵有油球一個,”使其關系明確,語義清楚。

        4.2.1.4 類屬與特征

        話題與跨標點說明中的新對象是種屬或主系關系,需要在種屬、主系間加系詞“為/是”。

        例13

        角鮟鱇亞目無腹鰭,

        無假鰓,

        副蝶骨與額骨不連接,

        體側(cè)扁,

        深海魚類,

        最后一個標點句“深海魚類”是話題“角鮟鱇亞目”的父類,如果直接生成話題自足句為“角鮟鱇亞目深海魚類”,不自然,中間加上“為/是”生成話題自足句“角鮟鱇亞目為(是)深海魚類,”。

        4.2.1.5 動詞論元

        漢語中二價動詞,如果施事S和受事O同時出現(xiàn),則可能的順序有3種: SVO,SOV,OSV。例如,

        ① 我喝牛奶了。 ④ 小華認識小剛。

        ② 我牛奶喝了。 ⑤ 小華小剛認識。

        ③ 牛奶我喝了。 ⑥ 小剛小華認識。

        ①~③三個句子,盡管語序不同,但表達了同樣的語義關系,兩個論元中,“我”是“喝”的施事,“牛奶”是“喝”的受事。我們認為之所以上例中O與S位置可以靈活出現(xiàn),是因為二者的詞匯語義決定了與V的語義關系,否則它們的順序調(diào)整會受限,往往需要其他手段予以輔助,以便理解。例如,

        ④~⑥三個句子中只有④的語義是清晰的,⑤⑥的語義不清楚,因為“小剛”與“小華”對于“認識”的語義關系不確定,如果將二者放在一起,盡管從語序上有前后之分,但還是難以理解。

        在廣義話題結(jié)構中,有時候話題與跨標點句說明連接成話題自足句時,有些OSV或者SOV的語序不能表達原有的語義或者存在歧義,這時我們?yōu)榱吮WC語義的清晰,需要對話題自足句中的相關成分進行調(diào)序。

        例14

        白朗軍長驅(qū)入陜,

        攻占商南等地,

        一度逼近西安。

        又沿渭水西進,

        由隴縣進入甘肅省境。

        陜西一帶哥老會紛紛歸附,

        在上例標點句序列中,最后一個標點句表達的語義是“陜西一帶哥老會紛紛歸附白朗軍”。但在堆棧模型下生成的話題自足句為“白朗軍陜西一帶哥老會紛紛歸附”,這個句子本身可接受度差;另外如果沒有足夠的歷史知識,可能會將“陜西一帶哥老會”與“白朗軍”當作隸屬關系,可見這種表達還會影響到語義的理解,因此需要調(diào)序。

        調(diào)序超出了流水模型現(xiàn)有的功能范圍,所以這類現(xiàn)象列在現(xiàn)有體系無法覆蓋的范圍內(nèi)。

        4.2.1.6 復雜關系要素不全

        復雜關系句所述的關系涉及多個要素,其中有些要素在上文提到,下文往往省略。話題自足句脫離了廣義話題結(jié)構的語境,是孤立的,在被省略成分不能作為話題被共享的情況下,話題自足句可能發(fā)生語義不清的問題。

        例15

        c1:2004年 ,

        c2: 國內(nèi)生產(chǎn)總值達到13.65萬億元,

        c3: 比上年增長9.5%;

        c4: 財政收入2.63萬億元,

        c5: 增長21.4%;

        c6: 社會消費品零售總額5.4萬億元,

        c7: 增長13.3%;

        c8: 進出口貿(mào)易總額1.15萬億美元,

        c9: 增長35.7%,

        c10: 由上年居世界第四位上升為第三位;

        c5、c7、c9對應的話題自足句為:

        S5: 2004年財政收入增長21.4%;

        S7: 2004年社會消費品零售總額增長13.3%;

        S9: 2004年進出口貿(mào)易總額增長35.7%;

        “增長”關系需要說明增長的主體、增長的基點、增長量。在標點句序列中三個標點句所說的對象增長率都是比較于基點“上年”而說的,但是在話題結(jié)構中,由于省略了比較對象,生成的話題自足句S5、S7、S9缺失了增長基點,從而導致語義表達不清楚。因此需要將缺失的關聯(lián)對象“比上年”補出來。這一對象的補足可通過模式匹配的方式從上文中獲取。

        還有個別更為復雜的情況,限于篇幅此處略去。

        4.2.2 語義錯亂

        跨標點句的說明如果關聯(lián)到話題所在句中的幾個對象,其中有的是話題,另一些是其他關聯(lián)要素,它們并不相鄰,用現(xiàn)有流水模型不能把它們都提取出來,話題自足句由于關聯(lián)對象缺失而致語義失解。此時需要在適當位置插入話題所在句中的非話題的關聯(lián)對象,并且常常需要添加介詞、結(jié)構助詞等虛詞,使關聯(lián)對象之間的關系得以清晰表達。這種處理方式超出了現(xiàn)有流水模型的功能,只能歸入現(xiàn)有流水模型無法覆蓋的范圍。

        例16

        c1: 安徽省……

        c2: 澇災則以淮河流域較多,

        c3: 主要出現(xiàn)在7~8月;

        c4: 次為長江流域,

        c5: 多出現(xiàn)在6~7月。

        例中標點句c3、c5對應的話題自足句分別是:

        S3: 安徽省澇災主要出現(xiàn)在7~8月,

        S5: 安徽省澇災多出現(xiàn)在6~7月,

        原文要表達的語義是“安徽省澇災在淮河流域主要出現(xiàn)在7~8月”,“安徽省澇災在長江流域多出現(xiàn)在6~7月”,而由于“淮河流域”和“長江流域”無法作為話題被共享,話題自足句S3、S5表達的語義錯誤,背離了原文要表達的語義。需要在此類情況下補足必要的成分,有時還需要另加虛詞,以保證話題自足句的通順合法,因此例中需要在“淮河流域”和“長江流域前”加介詞“在”,如此處理后生成的話題自足句如下:

        S3: 安徽省澇災在淮河流域主要出現(xiàn)在7~8月,

        S5: 安徽省澇災在長江流域多出現(xiàn)在6~7月,

        這樣的處理方法超出了流水模型的功能范圍。

        還有些現(xiàn)象涉及到對象的動態(tài)變化,限于篇幅本文不加討論。

        5 結(jié)語

        本文界定了話題自足句及其成句性,闡述了研究話題自足句及其成句性的意義,列舉并分析了語料中話題自足句不成句的主要情況,并做了詳細分類。主要分為兩大類: 句法不通和語義不清或錯亂。其中句法不通的情況主要是篇章連接成分導致話題自足句不成句和新支話題不定指導致話題自足句不成句。篇章連接成分是一個封閉的集合且出現(xiàn)的位置固定在標點句首,新支話題不定指的情況具有較好的形式特征,能夠用機械化的辦法將不定指變?yōu)槎ㄖ?,因此總體上可以通過改進流水模型中話題自足句的生成方法,將其不成句的問題解決掉。

        據(jù)統(tǒng)計,語料中共有30 963個標點句,對應30 963個話題自足句,其中有1 963個不成句的話題自足句。不成句的話題自足句根據(jù)不成句原因的分類情況如表2所示。

        表2中其他語義不清或語義錯亂類的話題自足句不成句的語言現(xiàn)象比較復雜,在現(xiàn)有流水模型的機制中無法提供改進機制使得話題自足句成句。這些現(xiàn)象實例雖然分了多個類別,但是從整個語料來看,所占比例很少。這些現(xiàn)象的處理方法并非完全無跡可循,例如,對于復雜關系句引入模式匹配的方法就是一種可以探索的途徑。還有相當多的部分可以通過加入介詞等功能詞來解決。這些可能的解決途徑不僅為廣義話題結(jié)構流水模型的改進提供了可能的方向,而且對于探索說漢語者在聽/讀標點句序列過程中的話題信息認知機制,提供了十分有益的啟示。

        表2 話題自足句不成句現(xiàn)象的分類情況

        受篇幅限制,本文對上表中的主語省略句未進行詳細說明,其他各類中也有些出現(xiàn)數(shù)量少的細類無法詳細示例解釋,相關內(nèi)容可參見筆者的博士學位論文。

        本文是廣義話題結(jié)構理論實證性研究的一部分,說明話題自足句是隱藏在漢語篇章中的一種客觀存在的、通常具備成句性的語言單位,少數(shù)不成句的則有若干系統(tǒng)性的原因。實證性研究對于科學理論的可靠性、可用性具有重要意義,但只是相關理論研究的一部分。漢語篇章廣義話題結(jié)構的研究剛剛開始,其中最具實質(zhì)性的課題之一是如何分析判斷標點句之間的話題—說明關系。這一工作具有極大的挑戰(zhàn)性,是我們今后工作的目標,需要在實證性研究工作的基礎上,經(jīng)過長期努力來解決。

        [1] 趙元任.漢語口語語法(呂叔湘譯)[M].北京:商務印書館,1979.

        [2] 朱德熙.語法講義[M].北京: 商務印書館,1982.

        [3] 朱德熙.語法答問[M].北京: 商務印書館,1985.

        [4] Li C, Thompson S. Subject and Topic: A New Typology of Language[M]New York: Academic Press,1976: 457-489.

        [5] 徐烈炯,劉丹青.話題的結(jié)構與功能[M].上海: 上海教育出版社,1998.

        [6] 曹逢甫.主題在漢語中的功能研究:邁向語段分析的第一步[M].北京: 語文出版社,1979.

        [7] 曹逢甫.漢語的句子與子句結(jié)構[M].北京: 北京語言大學出版社,1990.

        [8] 沈開木.現(xiàn)代漢語話語語言學[M].北京: 商務印書館,1996.

        [9] 屈承熹.漢語篇章語法[M].北京: 北京語言大學出版社,2006.

        [10] 許余龍.篇章回指的功能語用探索[M].上海: 上海外語教育出版社,2004.

        [11] 呂叔湘.漢語語法分析問題[M].北京: 商務印書館,1979.

        [12] 范繼淹.漢語句段研究[C],范繼淹語言學論文集,北京: 語文出版社,1986: 252-270.

        [13] 沈家煊. “零句”和“流水句”-為趙元任先生誕辰120周年而作[J].中國語文,2012(5): 403-415.

        [14] 陳平.漢語零形回指的話語分析[J].中國語文,1987(5): 363-378.

        [15] 宋柔.漢語篇章廣義話題結(jié)構的流水模型[J].中國語文,2013(6): 483-494.

        [16] 蔣玉茹,宋柔.基于廣義話題理論的話題句識別[J],中文信息學報, 2012(5): 114-128.

        [17] 尚英.漢語篇章廣義話題結(jié)構理論的實證性研究[D],北京: 北京語言大學博士學位論文,2014.

        [18] 尚英,宋柔.基于廣義話題結(jié)構語料庫的語體對比研究——以報告體與小說體為例[J].計算機工程與應用,2014(11): 21-27.

        [19] 張瑞朋.現(xiàn)代漢語書面語中跨標點句句法關系約束條件的研究[D],北京: 北京語言大學博士學位論文,2007.

        猜你喜歡
        標點語義漢語
        學漢語
        金橋(2022年6期)2022-06-20 01:36:16
        標點可有可無嗎
        《遼史》標點辨誤四則
        輕輕松松聊漢語 后海
        金橋(2020年11期)2020-12-14 07:52:56
        小小標點真厲害
        語言與語義
        追劇宅女教漢語
        漢語不能成為“亂燉”
        華人時刊(2017年17期)2017-11-09 03:12:08
        “上”與“下”語義的不對稱性及其認知闡釋
        有趣的標點
        国产成人精品999在线观看| 日本一区二区三区区视频| 色欲一区二区三区精品a片| 国产无遮挡又黄又爽免费网站| 国产成人精品久久亚洲高清不卡| 久久只精品99品免费久23| 一本一本久久a久久精品综合麻豆| 亚洲综合色婷婷久久| 国产一区二区白浆在线观看| 国产av天堂亚洲av刚刚碰| 亚洲成aⅴ人片久青草影院| 亚洲综合无码一区二区| 无码伊人久久大杳蕉中文无码 | 亚洲精品国产av成人网| 国产在线无码一区二区三区视频| 亚洲第一av导航av尤物| 国产xxxxx在线观看免费| 人妻少妇喷水意淫诱惑| 亚洲乱熟妇一区二区三区蜜桃| 老太婆性杂交视频| 亚洲男同志网站| 亚洲欧洲一区二区三区波多野| 日韩中文字幕在线丰满| 亚洲人成网线在线播放va蜜芽| 色一乱一伦一图一区二区精品| 无码流畅无码福利午夜| 手机久草视频福利在线观看| 亚洲国产精品va在线看黑人| 欧美在线成人午夜网站| 亚洲国产综合久久精品| 日韩精品无码熟人妻视频| 韩国精品一区二区三区无码视频 | 91伊人久久| 少妇性l交大片免费快色| 自由成熟女性性毛茸茸应用特色| 亚洲热妇无码av在线播放| 日本成人久久| 丝袜美腿爆炒国产在线观看| 国产精品高清视亚洲乱码| 亚洲国产精品第一区二区| 欧美三级超在线视频|