亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        副詞語義指向自動識別的路徑探討和個案分析

        2009-09-05 09:56:18

        赫 琳 吳 迪

        [摘要]研究現(xiàn)代漢語副詞語義指向的計算機識別,是從語義入手探索句處理的一個嘗試。我們提出的基本思路是:充分地利用海量語料,詳盡考察現(xiàn)代漢語副詞語義指向的不同情況,探尋不同語義指向的約束條件和機制,并對其進(jìn)行形式化的描述,然后構(gòu)建計算機自動處理策略和流程模型,編寫程序,使之在計算機上得以實現(xiàn)。據(jù)此,我們以否定副詞“不”為樣本,全面探討了其語義指向的各種情況,構(gòu)建了計算機自動識別的流程圖。

        [關(guān)鍵詞]副詞;語義指向;計算機識別;不

        [中圖分類號]H08[文獻(xiàn)標(biāo)識碼]A[文章編號]1671—881X(2009)04—0459—05

        一、要研究的問題

        在自然語言信息處理中,當(dāng)前遇到的瓶頸是句處理的問題。所謂“句處理”,就是怎么讓計算機處理、理解自然語言中一個句子的意義-怎么讓計算機生成一個符合自然語言規(guī)則的句子。制約句處理的最大難題就是要解決語義問題,這也是自然語言處理的關(guān)鍵。句子的語義問題涉及兩個層面:一是句子各成分本身的意義,另一個是句子各成分組合所產(chǎn)生的意義。句處理必須對句子的語義問題進(jìn)行分層處理。既要弄清各成分本身的意義,又要弄清成分與成分組合所產(chǎn)生的種種意義。一般來說,成分本身的意義相對簡單、明確,成分的組合意義十分復(fù)雜,而且成分組合意義的復(fù)雜性更導(dǎo)致了句處理的復(fù)雜性和艱難性。本文擬探討的語義指向問題就是句子成分組合中的復(fù)雜問題,是句處理不可回避的重要問題。

        語義指向是指句中某個成分在語義上跟哪個成分直接相關(guān)。某成分語義指向的不同,直接影響句子的意義。例如:

        飯我們都吃了。

        例子中的“都”在意義上既可能指向“飯”,也可能指向“我們”。如果指向“飯”,句義是:飯被我們吃光了;如果指向“我們”,句義是:我們都吃了飯了。顯然,同一成分的語義指向不同,句義完全不同。如果不能正確判斷語義指向,就會誤解句義。而語義指向在句法上往往沒有明顯的形式標(biāo)記,這就給語言理解帶來一定的困難,尤其是給計算機的自動識別帶來障礙。要解決自然語言的句處理問題,必須突破語義指向的自動識別問題。

        自從20世紀(jì)80年代語義指向分析進(jìn)入語言研究領(lǐng)域以來,我國語法學(xué)者從不同角度對語義指向進(jìn)行了研究??偟膩碚f,主要包括兩個方面:其一,運用語義指向分析法對語言事實做具體的分析,探尋其句法和語義上的對應(yīng)規(guī)律。有的著眼于句子成分,考察了補語、狀語、定語等句法成分的語義指向問題,有的從詞類出發(fā),考察了副詞、形容詞、代詞、名詞、動詞以及介詞結(jié)構(gòu)等的語義指向問題。其二,從理論上對語義指向本身進(jìn)行探討,說明其產(chǎn)生的背景、性質(zhì)、內(nèi)涵、范圍、表現(xiàn)形式以及在語法分析中的作用等??偟膩砜矗Z義指向研究雖然涉及的內(nèi)容較為廣泛,但較多的是現(xiàn)象分析,較少歸納規(guī)律;較多的是個別分析,較少系統(tǒng)考察;面向應(yīng)用的更少,幾乎還沒有見到針對自然語言計算機處理的語義指向研究??傊?,我們對語義指向問題的認(rèn)識還十分有限,尤其是對語義指向的規(guī)律缺乏把握,對語義指向的形式標(biāo)記捕捉不多,加上已有的研究立足點大都不在應(yīng)用,沒有為計算機處理語義指向儲備好充足的知識,所取得的成果與語言信息處理的要求之間存在著很大的距離。因此,要想實現(xiàn)計算機對語義指向的自動識別,還有大量工作要做。

        我們擬在語義指向研究既有成果的基礎(chǔ)上,緊緊圍繞“為語言信息處理所用”這一目標(biāo),進(jìn)一步深化、細(xì)化語義指向研究,以現(xiàn)代漢語副詞語義指向為樣本來解剖麻雀,具體探討現(xiàn)代漢語副詞不同語義指向出現(xiàn)的條件和可以捕捉的形式標(biāo)記,描繪現(xiàn)代漢語副詞語義指向網(wǎng),建構(gòu)副詞語義指向的流程圖,從而為副詞語義指向計算機自動識別策略的制定和程序編寫,提供依據(jù)甚至藍(lán)本。這無疑對于實現(xiàn)語義指向的計算機自動處理乃至整個基于語義的自然語言處理都具有重要意義。

        二、研究思路

        要實現(xiàn)現(xiàn)代漢語副詞語義指向的計算機自動識別,必須摸清現(xiàn)代漢語副詞不同語義指向出現(xiàn)的條件和可以捕捉的形式標(biāo)記,并把它們形式化。因此,我們首先要做的工作,就是最充分地利用海量語料,詳盡考察現(xiàn)代漢語副詞語義指向的不同情況,探尋現(xiàn)代漢語副詞不同語義指向的約束條件和機制,并對其進(jìn)行形式化的描述,然后構(gòu)建計算機自動處理策略和流程模型。

        我們知道,現(xiàn)代漢語中副詞主要做狀語,在語義上可能前指,也可能后指;既可以指向相鄰成分,也可以指向間隔成分,在不同的情況下具體指向不同。本研究就是要找出不同指向出現(xiàn)的條件,并在此基礎(chǔ)上編制流程圖,使計算機根據(jù)有關(guān)的條件執(zhí)行相應(yīng)的命令,做出相應(yīng)的判斷,從而使整個系統(tǒng)成為一個可以自動運作的過程。

        現(xiàn)代漢語副詞可分為程度副詞、時間副詞、范圍副詞、否定副詞、語氣副詞、頻率副詞等。其中,時間副詞語義指向單一,流程簡單;范圍副詞、否定副詞、程度副詞、頻率副詞情況較復(fù)雜,編制流程圖需要具體詳盡的條件限制。即使是同類副詞,不同的詞具體運行情況也不相同,所以我們擬對副詞進(jìn)行分類討論,對同類中的特殊副詞進(jìn)行個別討論。具體包括程度副詞和時間副詞語義指向的計算機識別,范圍副詞“都”、“只”語義指向的計算機識別,否定副詞“不”、“沒(有)”、“別”語義指向的計算機識別和頻率副詞“又”、“也”語義指向的計算機識別,等等。

        確定了副詞的類別之后,我們將從具體的副詞入手,以具體副詞為關(guān)鍵詞,利用大型語料庫和巨量生語料查找全部用例,考察其上下文,確定其語義指向,探索其語義指向的條件和標(biāo)記,然后將這些條件和標(biāo)記系統(tǒng)化,抽象其規(guī)律,找出其相互制約的因素,根據(jù)這些因素起作用的程度和先后順序編制流程圖。

        三、個案分析

        下面我們以否定副詞“不”為樣本,全面探討其語義指向的各種情況,構(gòu)建計算機自動識別的流程圖。

        現(xiàn)代漢語研究中,關(guān)于否定的成果頗豐。有的是從否定轄域的角度進(jìn)行,有的是從否定焦點的方面著手。但不管是否定轄域還是否定焦點,研究的都是否定詞到底否定的是什么成分,其實也就是否定副詞的語義指向問題。

        在否定副詞“不”指向的方向性這一問題上,學(xué)者們的研究結(jié)論基本一致,即指后。但是,“不”否定的究竟是其后哪一個或哪幾個成分,各家看法不一,歸納起來有三種觀點。

        第一種,指向“不”后的全部成分。持此種觀點的是呂叔湘先生。

        第二種,指向焦點。持此種觀點的有徐杰、李英哲、沈家煊、劉順等。

        第三種,指向毗鄰成分,即緊鄰的成分。持此種觀點的有錢敏汝、李寶倫、潘海華等。

        由上述可知,關(guān)于副詞“不”的語義指向還有一些問題需要進(jìn)一步研究。為了弄清副詞“不,,的語義指向的全面情況,我們利用北京大學(xué)現(xiàn)代漢語語料庫,詳盡考察了“不”的語義指向狀況。根據(jù)我們的考察和研究,含有否定副詞“不”的句子分為兩種情況:一種是“不”后出現(xiàn)帶有“的,或“地,,的修飾語,另一種是“不”后沒有出現(xiàn)帶“的”或“地”的修飾語。我們發(fā)現(xiàn),“不的語義指向與“的”、“地,,的有不具有明顯

        的相關(guān)性。這條規(guī)律為我們解決副詞“不”語義指向的計算機自動識別問題提供了重要線索。為此,我們對“不”的語義指向與“的”、“地”的具體相關(guān)性進(jìn)行了詳細(xì)的考察,現(xiàn)分述于下。

        (一)“不”后有帶“的”或“地”的修飾語

        據(jù)我們考察,“不”后有帶“的”或“地”的修飾語時,“不”就否定緊隨其后的修飾語。究其原因,主要是因為定語帶“的”、狀語帶“地”就表明定語和狀語與被修飾語之間結(jié)合不甚緊密,‘‘的”、“地”起到了間隔修飾語與被修飾語的作用,所以“不”只能否定緊隨其后的成分,而不能否定被“的”、“地”隔開的成分。

        1、“不”后出現(xiàn)帶“的”的修飾語,也就是“不”出現(xiàn)在定語中,這時“不”指向緊鄰其后的成分。例如:他喝了不新鮮的牛奶。不”否定的是“新鮮”。誠如錢敏汝所說,定中結(jié)構(gòu)中否定載體的否定范圍不會超過定語。

        2、“不”后出現(xiàn)帶“地”的修飾語,這時“不”指向緊鄰其后的成分。例如:她不高興地瞪了他一眼。

        這一類修飾語往往是對施動者的情態(tài)進(jìn)行描寫。其后的動詞一般不是單純形式,而是“動+了”、動結(jié)式、動趨式、動詞重疊式(“VV”和“V了V”)、“動+著”等。例如:鮑里斯@別爾曼在與她談話時,不高興地提到了格利戈里·阿爾庫斯。(動+了+賓)我很不高興地走開了。(動結(jié)式)

        不高興地走了出去。(動趨式)

        不高興地故意清清喉嚨。(vV)

        騎兵們不高興地抿了抿嘴。(V了V)

        他不高興地嘀咕著。(動+著)

        這些動詞代表的動作往往都是有終結(jié)點的,也就是說,意義上是有界的。在“不,和“沒,,的否定分工上,“不”否定的是無界成分,“沒”否定的是有界成分。因此,上述各動詞是無法用“不來否定的,所以“不”在這里否定的只能是修飾語。

        (二)“不”后沒有帶“的”或“地”的修飾語

        “不”可以出現(xiàn)在狀語、補語、主謂謂語句的謂語中,“不”后面可以是一個成分,也可以有多個成分。根據(jù)我們的考察,只要“不”后未出現(xiàn)帶“的”或“地”的修飾語,“不就能否定其后所有的成分。究其原因,主要是因為在這類格式中,“不”后的所有成分結(jié)合緊密,構(gòu)成一個整體,所以“不只能否定其整體,而不能只否定其部分成分。

        1、“不”后只有一個成分。

        這咖啡不香。

        小明跑得不快。

        2、“不”后有兩個成分。

        (1)“不”+狀語+動/形

        這句話不太懂。

        小明跑得不很快。

        (2)“不”+動+賓

        爺爺不吃面食。

        張老師不是我們的數(shù)學(xué)老師。

        3、“不”后有三個成分。

        (1)“不”+狀語+動+賓

        我不在學(xué)校讀小說。

        她不天天吃食堂。

        (2)“不”+動+賓1+賓2

        張老師不教我們數(shù)學(xué)。我就不告訴你那件事。

        (3)“不”+動1+兼語+動2

        大家不選老王當(dāng)組長。

        4.“不”后有四個成分。

        “不”十狀語+動+賓1+賓2

        張老師不只教我們數(shù)學(xué)。

        上面討論的例子的謂語一般只有一個動詞或形容詞。連動句中能用“不”否定的有三種情況:

        (1)后一個動詞/短語表示的動作行為是前一動詞/短語表示的動作的目的。例如:

        她不去開門。

        (2)前一個動詞/短語表示后一個動詞/短語所表示的動作的方式(或手段、工具)。例如:

        他不騎車上班。

        (3)前一個部分表示肯定的意思,后一個部分表示否定的意思,但前后兩個部分表示的意思一樣,其中后一個部分用“不”來構(gòu)成否定。

        孩子緊緊抓著她的手不放。

        顯然,當(dāng)“不”后沒有帶“的”或“地”的修飾語時,“不”指向其后所有的成分。

        綜上所述,當(dāng)“不”后有帶“的”或“地”的修飾語時,“不”指向修飾語,也就是其后毗鄰成分;“不”后沒有帶“的”或“地”的修飾語時,“不”指向其后全部成分?!暗摹焙汀暗亍背蔀閰^(qū)分“不”語義指向的標(biāo)志詞。計算機識別就可以以“的”和“地”為切入點,首先看“不”后是否有助詞“的”,如果有,“不”指向其后毗鄰成分;如果沒有,再看“不”后是否有助詞“地”,如果有,“不”同樣指向毗鄰成分;如果沒有,“不”指向其后所有成分。依據(jù)這個順序,我們可以畫出否定副詞“不”的語義指向流程圖(如圖1)。

        本文探討了現(xiàn)代漢語副詞語義指向的計算機識別問題,重點討論了副詞“不”的語義指向。語義指向的計算機識別研究,為我們提供了一個新的視角來反觀現(xiàn)代漢語中的一些語言現(xiàn)象。所以卒文的研究成果可以直接用于語言學(xué)領(lǐng)域,以利用副詞語義指向的研究思路和方法來研究其他詞類,從計算機識別這一新的角度重新探討各種詞類的語義指向,從而對語義指向的性質(zhì)、內(nèi)涵、對象和范圍等有一個全新的思考和定位。同時,我們的研究成果也可以直接用于語言信息處理領(lǐng)域,計算語言學(xué)家們可以將我們已經(jīng)形式化的條件表示為算法,使之在計算上形式化,根據(jù)流程圖編寫程序,使我們的研究成果最終在計算機上得以實現(xiàn)。

        注釋:

        ①我們在北京大學(xué)現(xiàn)代漢語語料庫中輸入關(guān)鍵詞“不”,得到語料約10萬條,人工刪除不合格語料,獲得可用語料約1萬條。

        ②我們在北京大學(xué)語料庫中搜到的帶“不高興地”和“不滿意地”的語料共301條,我們對其后出現(xiàn)的動詞及動詞詞組進(jìn)行了,窮盡性考察,尚未發(fā)現(xiàn)例外。

        [參考文獻(xiàn)]

        [1]陸儉明:《關(guān)于句處理中所要考慮的語義問題》,載《語言研究}2001年第1期。

        [2]稅昌錫;《語義指向分析的發(fā)展歷程與研究展望》,載《語言教學(xué)與研究}2004年第1期。

        [3]呂叔湘:《疑問否定肯定》,載《中國語文}1985年第4期。

        [4]徐杰、李英哲:《焦點和兩個非線性語法范疇:“否定”“疑問”》,載《中國語文>)1993年第2期。

        [5]沈家煊:《不對稱和標(biāo)記論》,南昌:江西教育出版社1999年版。

        [6]劉順:《現(xiàn)代漢語的否定焦點和疑問焦點》,載《齊齊哈爾大學(xué)學(xué)報(哲社版)))2003年第2期。

        [7]錢敏汝:《否定載體“不”的語義——語法考察》,載《中國語文))1990年第1期。

        [8]胡建華:《否定、焦點與轄域》,載《中國語文》200F年第2期。

        [9]石毓智:《肯定和否定的對稱與不對稱》,北京:北京語言文化大學(xué)出版社2001年版。

        (責(zé)任編輯何坤翁)

        99久久久久久亚洲精品| 久久久av精品波多野结衣| 吃奶还摸下面动态图gif| 92精品国产自产在线观看48页| 国产超碰在线91观看| 久久不见久久见www日本网| 日本免费一区二区三区| 亚洲综合色区无码专区| 一区二区三区人妻在线| 我和隔壁的少妇人妻hd| 麻豆久久久9性大片| 天天狠天天透天干天天| 亚洲国产精品成人一区二区三区 | 亚洲中文久久久久无码| 日本国产一区在线观看| 97人人模人人爽人人喊网| 蜜桃av噜噜一区二区三区| 亚洲人成网站18男男| 国产免费一区二区在线视频| 亚洲色成人网站www永久| 亚洲精品你懂的在线观看| 日韩精品有码中文字幕在线| 日本av亚洲中文字幕| 亚洲av无码xxx麻豆艾秋| 欧洲亚洲视频免费| 亚洲精品一区二区三区四区| 国产国语亲子伦亲子| 国产精品久久久av久久久| 在线观看极品裸体淫片av| 亚洲国产精品国自拍av| 国产女人的高潮国语对白| 国产亚洲精品看片在线观看| 亚洲国内精品一区二区在线 | 亚洲成av人片在www| 亚洲夜夜骑| 国产成人自拍视频视频| 亚洲av色香蕉一区二区三区| 丰满人妻熟妇乱又伦精品视| 网友自拍人妻一区二区三区三州| 国产亚洲精品久久情侣| 天天综合网天天综合色|