亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        漢語名名組合語義分析的計(jì)算研究

        2020-09-29 07:44:49王萌符雅茹胡純
        現(xiàn)代語文 2020年6期
        關(guān)鍵詞:語義分析語料庫

        王萌 符雅茹 胡純

        摘 ?要:名名組合語義分析的主要目的是探討修飾語和中心詞之間隱含的語義關(guān)系。運(yùn)用降級(jí)述謂結(jié)構(gòu)理論,利用語料庫自動(dòng)獲取隱含謂詞,將修飾語和中心詞之間的語義關(guān)系顯性化。實(shí)驗(yàn)結(jié)果表明,該方法不僅可以為名名組合提供多種可能的語義解釋,而且能夠反映組成相似的名名組合之間細(xì)微的語義差別。這一研究成果不但能夠服務(wù)于信息檢索、問答系統(tǒng)等應(yīng)用領(lǐng)域,而且可以為概念組合認(rèn)知機(jī)制研究提供語義解釋的依據(jù)。

        關(guān)鍵詞:名名組合;語義分析;隱含謂詞;語料庫

        一、引言

        名名組合(noun compounds)是一種特定類型的名詞短語,它由相鄰的名詞序列組成,其功能整體上相當(dāng)于一個(gè)名詞,如“電腦 公司”“衣服 價(jià)格”和“汽車 質(zhì)量 問題”等。學(xué)界通常把名名組合中的最后一個(gè)名詞稱為中心詞(head),前面的名詞稱為修飾詞(modifier)。名名組合廣泛存在于英語、漢語、日語、德語等各種語言,是語言中的第一高頻組合,它主要有以下幾個(gè)特點(diǎn):

        第一,通過兩個(gè)詞語的組合來實(shí)現(xiàn)信息壓縮,并以最少的文本呈現(xiàn)出來,這符合語言學(xué)中的“經(jīng)濟(jì)原則”(人們?cè)诮浑H時(shí)總是力求用最簡潔的語言來表達(dá)復(fù)雜完整的意思)。因此,名名組合的使用非常普遍,經(jīng)常出現(xiàn)在新聞媒體、科技報(bào)告及小說等各種文體中。

        第二,名名組合的能產(chǎn)性很高。一方面,在日常生活中,人們根據(jù)交流的需要,不斷產(chǎn)生新的概念組合來指稱新出現(xiàn)的事物,如“傻瓜 相機(jī)”“板凳 隊(duì)員”“鳳凰 男”等。另一方面,在快速更新的科技領(lǐng)域中,專業(yè)術(shù)語通常以名名組合的形式出現(xiàn),如“數(shù)據(jù) 總線”“光電 鼠標(biāo)”等。

        第三,雖然名名組合的構(gòu)成比較簡單(相鄰的名詞序列),但是它們?cè)诰浞ǚ治龊驼Z義解釋上表現(xiàn)出較高的歧義性。特別是在漢語中,名名組合的分析效果對(duì)整個(gè)句法分析有著很大的影響。

        以上特點(diǎn)使得名名組合在語言學(xué)和計(jì)算語言學(xué)領(lǐng)域成為一個(gè)熱點(diǎn)研究課題,它所涉及的研究范圍也越來越廣泛,包括名名組合的自動(dòng)獲取、句法分析、語義解釋、翻譯以及語義焦點(diǎn)分析等。本文主要關(guān)注的是漢語名名組合的語義解釋,運(yùn)用降級(jí)述謂結(jié)構(gòu)理論,利用語料庫自動(dòng)獲取隱含謂詞,探討修飾語和中心詞之間隱含的語義關(guān)系。

        二、名名組合的語義分析

        (一)理論語言學(xué)中的名名組合語義類型

        在句法結(jié)構(gòu)上,漢語名名組合可以分為主謂、定中、同位與聯(lián)合。在語義分析上,名名組合內(nèi)部隱含著復(fù)雜的意義構(gòu)建過程,其語義關(guān)系一直受到學(xué)界的

        重視,對(duì)語義關(guān)系的研究在逐步深入和細(xì)化,相關(guān)成果也頗為豐富。朱德熙從修飾語和中心語的意義聯(lián)系出發(fā),歸納出領(lǐng)屬、質(zhì)料、時(shí)間、處所等語義類別[1]。李宇明采用層級(jí)性分類方法,將N1與N2組合分為屬性關(guān)系與非屬性關(guān)系兩大類,每一類下面再分若干小類[2]。袁毓林將名詞定語分為領(lǐng)屬定語和屬性定語兩類[3];文貞惠在這一分類的基礎(chǔ)上提出了一個(gè)有層級(jí)的語義類別關(guān)系網(wǎng)絡(luò)[4]。周日安系統(tǒng)研究了名名組合的句法語義,構(gòu)建出語義匹配的演繹表,推演出名名組合的語義生成模型[5]。方清明以“雙視點(diǎn)”視角對(duì)名名語義關(guān)系進(jìn)行了細(xì)致的分類,提出了如質(zhì)料、提取物、處所、部位等20種關(guān)系類型[6]。

        (二)計(jì)算語言學(xué)對(duì)名名組合的語義分析

        在計(jì)算語言學(xué)領(lǐng)域,很多實(shí)際的應(yīng)用系統(tǒng)都可以利用名名組合的句法語義分析結(jié)果。降級(jí)述謂結(jié)構(gòu)理論認(rèn)為,名詞和名詞之間常常隱藏了謂詞,其語義關(guān)系可以通過補(bǔ)入隱含謂詞而揭示出來,如“電影 公司”可以是“[制作/發(fā)行/拍攝]電影[的]公司”。這種隱含信息的顯性化對(duì)信息檢索、問答系統(tǒng)、機(jī)器翻譯等諸多自然語言處理任務(wù)都有所幫助。例如,在信息檢索系統(tǒng)中,用戶輸入查詢“偏頭疼 療法”,系統(tǒng)可以提供“[減輕]偏頭疼[的]療法”或者“[防止]偏頭疼[的]療法”等不同的語義解釋來幫助用戶改進(jìn)查詢及結(jié)果。

        目前,研究漢語名名組合的語義解釋主要有兩大處理策略。第一種是自上而下的策略(top-down strategy),這種方法首先要求有一組已經(jīng)定義好的、明確的關(guān)系集合,然后根據(jù)這個(gè)關(guān)系集合,為每個(gè)名名組合分配適當(dāng)?shù)恼Z義關(guān)系。這實(shí)際上就是一個(gè)分類問題,也有學(xué)者將這種方法稱之為“Inventory-based method”。Zhao等實(shí)現(xiàn)了具有名物化現(xiàn)象(nominalization)的漢語名名組合的自動(dòng)語義分類,如“鳥類 遷徙”中的“遷徙”是名動(dòng)詞(具有名詞功能的動(dòng)詞)。作者參照動(dòng)詞的語義角色(semantic roles)界定了四種粗粒度語義關(guān)系(Proto-Agent,Proto-Patient,Range和Manner),對(duì)300個(gè)短語進(jìn)行了自動(dòng)分類實(shí)驗(yàn)[7]。

        隨著研究的逐步深入,越來越多的研究者意識(shí)到,將語義關(guān)系歸納為有限的幾個(gè)類型的做法是有缺陷的。首先,名名組合的語義關(guān)系是不能由一組固定的集合窮盡的,無論根據(jù)何種關(guān)系進(jìn)行定義,總存在一些組合不能被正確歸類[6]、[8];其次,固定的關(guān)系集合難以反映名名組合的多義性,一個(gè)名名組合根據(jù)不同的解釋可以屬于多個(gè)語義類;最后,各種語義分類體系孰優(yōu)孰劣無法判斷。因此,研究者開始采用一種非受限的、開放式的方法,不事先定義語義關(guān)系集合,而是通過大規(guī)模語料去發(fā)現(xiàn)詞語組合時(shí)隱含的語義關(guān)系,并通過某種模式進(jìn)行釋義(paraphrase)。這就是第二種處理策略:即自下而上的策略(bottom-up strategy)。

        在這種思路指導(dǎo)下,很多研究者嘗試用動(dòng)詞來解釋名名組合的語義關(guān)系,他們認(rèn)為,動(dòng)詞在表達(dá)細(xì)粒度的語義關(guān)系上更具有表現(xiàn)力。這種研究思路在英文名名組合的語義解釋上,得到了廣泛認(rèn)可并付諸實(shí)踐[9]—[12]。例如,“night flight”的語義關(guān)系屬于時(shí)間(Temporal)類型,兩個(gè)名詞之間更細(xì)微的語義關(guān)系可以通過加入一系列動(dòng)詞(如“arrive at,leave at,be at,be conducted at”)表達(dá)出來。2010年,國際語義評(píng)測會(huì)議(Semantic Evaluation,簡稱“SemEval”)提出一項(xiàng)英文評(píng)測任務(wù)“Noun Compound Interpretation Using Paraphrasing Verbs and Prepositions”,要求參賽者為測試短語提供釋義動(dòng)詞集合,同時(shí)給出動(dòng)詞的排名;2013年,SemEval延續(xù)并擴(kuò)展了該項(xiàng)評(píng)測任務(wù)“Free Paraphrases of Noun Compounds”。

        漢語名名組合的釋義研究也經(jīng)歷了從靜態(tài)分類到動(dòng)態(tài)演繹的過程,研究成果主要集中在對(duì)名名組合語義的靜態(tài)分類上,采用動(dòng)態(tài)方式釋義的研究成果較少。王萌等首次采用動(dòng)態(tài)策略,利用語料庫(Chinese Sketch Engine)及Web數(shù)據(jù),自動(dòng)獲取漢語名名組合的釋義短語[13]。魏雪形式化歸納了名名組合的語義模式,對(duì)基于規(guī)則的漢語名名組合的自動(dòng)釋義方法進(jìn)行了探索,利用知網(wǎng)生成釋義短語,對(duì)網(wǎng)絡(luò)搜索詞進(jìn)行語義分析[14]。劉鵬遠(yuǎn)、劉玉潔基于大規(guī)模真實(shí)語料,建立了中文基本復(fù)合名詞短語語義關(guān)系體系及相應(yīng)句法語義知識(shí)庫, 其中包含18281條高頻基本復(fù)合名詞短語,每條短語標(biāo)注了語義關(guān)系、短語結(jié)構(gòu)等信息,可作為相關(guān)研究的基礎(chǔ)數(shù)據(jù)資源[15]。

        三、隱含謂詞的獲取

        (一)降級(jí)述謂結(jié)構(gòu)理論

        名名組合的表層形式是“名1+名2”。降級(jí)述謂結(jié)構(gòu)理論認(rèn)為,名1和名2之間隱含了動(dòng)詞,通過補(bǔ)入動(dòng)詞,大致能將其語義關(guān)系揭示出來。不同語義關(guān)系隱含著不同的降級(jí)謂詞,對(duì)應(yīng)著不同的降級(jí)述謂結(jié)構(gòu)。比如,“羊毛 背心”可解釋為“羊毛[編織的]背心”,“英語教師”可解釋為“[教]英語[的]教師”。袁毓林曾對(duì)漢語謂詞隱含(implying predicate)進(jìn)行過詳細(xì)論述,從句法和心理實(shí)現(xiàn)性等方面對(duì)謂詞隱含現(xiàn)象進(jìn)行了驗(yàn)證,指出被隱含的謂詞是句子的語義表達(dá)中不可或缺的成分[3]。周日安從名詞的語義格(施事、受事、領(lǐng)事等)出發(fā),列舉了18種語義格的匹配情況,他指出研究名名組合的語義類型應(yīng)持開放態(tài)度,可以以語義格為縱橫坐標(biāo),構(gòu)建名名組合語義關(guān)系的演繹表[5]??梢?,采用降級(jí)述謂結(jié)構(gòu)理論對(duì)名名組合進(jìn)行語義分析,關(guān)鍵是要獲取隱含謂詞。

        (二)隱含謂詞

        名詞通常會(huì)指涉概念,每一概念都具有自己的特征,當(dāng)名詞與名詞相組合時(shí),某一方面的特征便會(huì)凸顯出來。如“鉆石”作為一種堅(jiān)硬的材質(zhì)可以被切割和打磨,也可以作為裝飾物,“鉆石 鋸片”和“鉆石 戒指”分別凸顯了鉆石的兩種不同特征。這些特征可以通過不同的“動(dòng)詞”進(jìn)行解釋,即“[切割]鉆石[的]鋸片”和“[鑲嵌]鉆石[的]戒指”。因此,隱含謂詞獲取的主要任務(wù)便是找到所有可能的與名詞概念相關(guān)的動(dòng)詞,在兩個(gè)名詞組合時(shí),與被凸顯特征相關(guān)的“動(dòng)詞”就是合理的隱含謂詞。

        那么,如何獲取與名詞概念相關(guān)的動(dòng)詞呢?在自然語言中,任何形式和結(jié)構(gòu)都是為了表達(dá)一定的意義,而任何意義及其關(guān)聯(lián)都要通過一定的形式和結(jié)構(gòu)表現(xiàn)出來。從句法層次上看,連接動(dòng)詞與名詞的最為直接的語法關(guān)系就是“述賓(verb-object)”和“主謂(subject-verb)”。因此,本研究從較易把握的形式線索——表層的句法結(jié)構(gòu)入手,利用“述賓”和“主謂”兩種語法關(guān)系,獲取與名詞概念相關(guān)的動(dòng)詞。這就要求我們所使用的語料是標(biāo)記了主謂賓等句法結(jié)構(gòu)信息的,而目前可以直接利用的中文句法樹庫資源有限,這會(huì)直接影響到動(dòng)詞的獲取數(shù)量。我們的方法是,獲取與名詞在指定語法關(guān)系下具有搭配意義的動(dòng)詞,并不要求語料經(jīng)過深層次的句法加工和標(biāo)注。就目前的研究來看,中文詞匯特征素描系統(tǒng)(Chinese Sketch Engine,簡稱“CSE”)便可勝任。

        (三)中文詞匯特征素描系統(tǒng)

        Sketch Engine是一個(gè)大規(guī)模語料處理系統(tǒng),該系統(tǒng)除了提供一般的關(guān)鍵詞及語境查詢外,還提供了詞匯特征素描(word sketch)、語法關(guān)系(grammatical relation)以及同近義詞分析(thesaurus)等自動(dòng)產(chǎn)生的語法知識(shí)[16]。目前這個(gè)系統(tǒng)已經(jīng)應(yīng)用于英語、漢語、法語、德語、日本語等多種語言,產(chǎn)生了廣泛的影響。中文詞匯特征素描系統(tǒng)①是Sketch Engine系統(tǒng)與十四億字的Chinese Gigaword語料相結(jié)合的產(chǎn)物,它提供了絕大部分中文詞匯實(shí)際使用的描述,可以服務(wù)于諸多自然語言處理任務(wù)[17]。

        Word Sketch描述了詞語在某些語法關(guān)系下與其他詞語的搭配情況。根據(jù)詞類的不同,其對(duì)應(yīng)搭配詞的語法關(guān)系也不同。例如,CSE中名詞的搭配關(guān)系有述賓關(guān)系(object_of)、主謂關(guān)系(subject_of)、領(lǐng)屬關(guān)系(possession/possessor)、修飾關(guān)系(A_modifier/N_modifier/modifies)及并列關(guān)系(and/or)等9種。所有的搭配關(guān)系可以用一個(gè)三元組(triple)來表示,即(word1,relation,word2),其中,word1是查詢的關(guān)鍵詞,relation是語法關(guān)系,word2是在這種語法關(guān)系下的搭配詞。我們以“愛情”為例,運(yùn)用該系統(tǒng)的查詢結(jié)果制作了該詞的特征素描,具體如表1所示:

        表1列舉了名詞“愛情”在三種語法關(guān)系(object_of、subject_of、A_Modifier)下的搭配情況。其中,“頻次”是指在相應(yīng)的語法關(guān)系下搭配詞出現(xiàn)的次數(shù),如“愛情”作為“渴望”的賓語共出現(xiàn)了40次;搭配顯著性的計(jì)算方法是互信息;搭配詞語按照顯著性的降序進(jìn)行排列。

        (四)獲取步驟

        利用CSE中的Word Sketch功能,可以方便地獲取某個(gè)名詞的在各種語法關(guān)系下的特征素描,本文只使用“subject_of”和“object_of”兩種關(guān)系。以名名組合“n1 n2”為例,經(jīng)過兩個(gè)步驟即可獲取隱含謂詞。

        第一步,將n1和n2作為查詢關(guān)鍵詞,分別獲取它們?cè)凇皊ubject_of”和“object_of”兩種語法關(guān)系下的搭配詞,只保留前200個(gè)顯著性最高的搭配詞,這樣分別得到名詞n1和n2的相關(guān)動(dòng)詞集合,分別記為VerbSetn1和VerbSetn2。

        第二步,求取VerbSetn1和VerbSetn2的交集,得到名詞n1和n2所共有的動(dòng)詞,作為最終的隱含謂詞獲取結(jié)果。

        這里以“鉆石 戒指”為例,來探究一下是如何獲取隱含謂詞的,具體如表2所示:

        表2給出了“鉆石”“戒指”這兩個(gè)名詞在subject_of和object_of語法關(guān)系下的搭配動(dòng)詞樣例,以及它們交集的結(jié)果??梢钥闯?,獲取結(jié)果中的“鑲嵌、鑲、交換、獲得”等動(dòng)詞,能夠表達(dá)“鉆石”和“戒指”的語義關(guān)系。

        我們按照這一方法,獲取了部分名名組合隱含謂詞的結(jié)果,具體如表3所示:

        表3給出了部分名名組合隱含謂詞的結(jié)果樣例,這里列出的只是顯著性最高的且正確的詞語。對(duì)于同一組具有相同中心詞的名名組合,隱含謂詞可以反映它們進(jìn)行語義關(guān)聯(lián)的方式,如“民間 故事”主要用“流傳、源于、挖掘”等動(dòng)詞進(jìn)行釋義,強(qiáng)調(diào)的是故事的來源或發(fā)生地;而“愛情 故事”主要用“敘述、圍繞、表示”等動(dòng)詞進(jìn)行釋義,強(qiáng)調(diào)的是故事的內(nèi)容。

        四、相關(guān)結(jié)果分析

        本研究從《人民日?qǐng)?bào)》語料中抽取了424個(gè)高頻名名組合,并列出了部分樣例,具體如表4所示:

        經(jīng)過上述步驟,獲取到400個(gè)名名組合的隱含謂詞,有24個(gè)名名組合不能獲取隱含謂詞(即兩個(gè)集合的交集為空)。

        我們?yōu)槊總€(gè)名名組合保留10個(gè)顯著性最高的謂詞,統(tǒng)計(jì)給出的候選中是否有正確的釋義出現(xiàn),基于此就可以計(jì)算整個(gè)方法的準(zhǔn)確率。我們逐一考察了這400個(gè)名名組合獲取的隱含謂詞,其中385個(gè)名名組合都有正確的隱含謂詞,只有15個(gè)名名組合獲取的謂詞完全不正確,準(zhǔn)確率達(dá)到96.25%。

        與以中心語或修飾語分類的方法相比,筆者所采用的方法具有一定的優(yōu)越性。這里以名名組合“X公司”隱含謂詞的獲取結(jié)果為例,對(duì)此加以說明,具體如表5所示:

        表5給出了一組具有相同中心詞的名名組合“X公司”,中心語相同時(shí)并不表示其構(gòu)成關(guān)系相同,通過隱含謂詞可以有效地揭示其語義關(guān)系的差別。例如,“壽險(xiǎn) 公司”使用“服務(wù)、經(jīng)營、投資”等謂詞,而“飼料 公司”使用“制造、開發(fā)、制作”等謂詞,體現(xiàn)出這兩個(gè)公司的不同職能范圍。對(duì)于同一個(gè)名名組合,不同的隱含謂詞代表了各種可能的語義解釋,對(duì)于歧義具有分化作用,如“電影 公司”可以是“[制作/發(fā)行/管理]電影[的]公司”等。

        本研究還對(duì)沒有獲取到隱含謂詞的24個(gè)名名組合進(jìn)行了分析。這些名名組合可以分為兩類:第一類,如“國際 公司”“專業(yè) 市場”“外籍 人員”等名名

        組合。把它們譯為英文時(shí),一些名詞對(duì)應(yīng)的是形容詞。如“國際 公司”的英文是“international corporation”,名詞“國際”變成了形容詞“international”。在英文名名組合的釋義任務(wù)中(參看SemEval2010 Task9),這類形容詞作為修飾語的情況是不包括在內(nèi)的。而在漢語中,對(duì)于這部分名詞實(shí)際上充當(dāng)了形容詞功能的名名組合,是很難找到合適的隱含謂詞的。第二類,如“皮包 公司”“文化 沉渣”“小康 步伐”等名名組合。認(rèn)知語言學(xué)認(rèn)為,名名組合是一種概念結(jié)合的產(chǎn)物,而“皮包 公司”是屬于特征映射型語義關(guān)系[18],在這一組合中,“皮包”已失去原來的指稱意義,而是指它所具有的特征。因此,對(duì)于這類名名組合,該方法是不能正確獲取隱含謂詞的。而“小康 步伐”其實(shí)是隱含了多個(gè)謂詞“[邁]步伐[進(jìn)入]小康”,該方法對(duì)此類名名組合也不能獲取到隱含謂詞。

        五、余論

        漢語名名組合的語義類型復(fù)雜多變,難以窮盡,它是開放的,處于不斷的變化中。以基于隱含謂詞的動(dòng)態(tài)策略探討漢語名名組合的語義解釋,是當(dāng)前研究的趨勢和熱點(diǎn)。本文主要是利用Chinese Word Sketch獲取在指定語法關(guān)系下具有搭配意義的動(dòng)詞,通過這一方法獲取的動(dòng)詞仍是有限的,今后我們將借鑒英文的相關(guān)成果,進(jìn)一步改進(jìn)隱含謂詞的獲取方法,通過定義模板利用Web數(shù)據(jù)進(jìn)行擴(kuò)充。同時(shí),在獲取到隱含謂詞后,將利用釋義模板恢復(fù)其完整的釋義短語。這一方法不僅可以為名名組合提供多種可能的語義解釋,而且能夠反映組成相似的名名組合之間細(xì)微的語義差別。其研究成果不但能夠服務(wù)于計(jì)算機(jī)語言信息處理的需求,而且可以為心理語言學(xué)關(guān)于概念組合認(rèn)知機(jī)制的研究提供語義解釋的依據(jù)。

        參考文獻(xiàn):

        [1]朱德熙.語法講義[M].北京:商務(wù)印書館,1982.

        [2]李宇明.領(lǐng)屬關(guān)系與雙賓句分析[J].語言教學(xué)與研究, 1996.(3).

        [3]袁毓林.謂詞隱含及其句法后果——“的”字結(jié)構(gòu)的稱代規(guī)則和“的”的語法、語義功能[J].中國語文, 1995,(4).

        [4][韓國]文貞惠.“N1(的)N2”偏正結(jié)構(gòu)中Nl與N2之間語義關(guān)系的鑒定[J].語文研究,1999,(3).

        [5]周日安.名名組合的句法語義研究[M].北京:中國社會(huì)科學(xué)出版社,2010.

        [6]方清明.現(xiàn)代漢語名名復(fù)合形式的認(rèn)知語義研究[D].廣州:暨南大學(xué)博士學(xué)位論文,2011.

        [7]J.Zhao,H.Liu & R.Lu.Semantic labeling of compound nominalization in Chinese[A].Proceedings of the Workshop on A Broader Perspective on Multiword Expressions[C].2007.

        [8]Downing,P.On the creation and use of English compound nouns[J].Language,1977,(4).

        [9]Girju,R.,Moldovan,D.,Tatu,M. & Antohe,D.On the semantics of noun compounds[J].Computer Speech and Language,2005,(19).

        [10]Diarmuid,? Séaghdha.Learning compound noun semantics[D].Ph.D.thesis,University of Cambridge,2008.

        [11]Nakov,P.Noun compound interpretation using paraphrasing verbs:Feasibility Study[A].Proceedings of the 13th international conference on Artificial Intelligence:Methodology,Systems and Applications(AIMSA)[C].2008.

        [12]Nakov,P. & Hearst,M.Using verbs to characterize noun-noun relations[A].Proceedings of the 12th international conference on Artificial Intelligence:Methodology,Systems and Applications(AIMSA)[C].2006.

        [13]王萌,黃居仁,俞士汶,李斌.基于動(dòng)詞的漢語復(fù)合名詞短語釋義研究[J].中文信息學(xué)報(bào),2010,(6).

        [14]魏雪.面向語義搜索的漢語名名組合的自動(dòng)釋義研究[D].北京:北京大學(xué)碩士學(xué)位論文,2012.

        [15]劉鵬遠(yuǎn),劉玉潔.中文基本復(fù)合名詞短語語義關(guān)系體系及知識(shí)庫構(gòu)建[J].中文信息學(xué)報(bào),2019,(4).

        [16]Kilgarriff,A.,Rychly,P.,Smrz,P. & Tugwell,D.The sketch engine[A].Proceedings of the Eleventh Euralex Congress[C].2004.

        [17]Huang,C.R.,Kilgarriff,A.,Wu,Y.,et al.Chinese sketch engine and the extraction of collocations[A].Proceedings of the Fourth SigHan Workshop on Chinese Language Processing[C].2005.

        [18]劉正光.關(guān)于N+N概念合成名詞的認(rèn)知研究[J].外語與外語教學(xué),2003,(11).

        Computational Research on the Semantics of Chinese Noun Compounds

        Wang Meng1,F(xiàn)u Yaru2,Hu Chun3

        (1.2.School of Humanities, Jiangnan University, Wuxi 214122;

        3.School of Foreign Studies, Jiangnan University, Wuxi 214122, China)

        Abstract:The semantic analysis of noun compounds is to recover the implicit semantic relations between the head and modifier.In this paper, we adopt the downgraded predication theory to paraphrase Chinese noun compounds. Corpus is used to acquire the implying predicates automatically. The experiment results show that this approach can not only provide the possible interpretations for noun compounds but also reflect the interesting, detailed semantic differences of similar noun compounds.In addition, our research can be applied in some other fields such as question answering, information retrieval and language teaching, and provide semantic interpretation for the study of cognitive mechanisms of concepts combination in psycholinguistics.

        Key words:noun compounds;semantic analysis;implying predicates;corpus

        猜你喜歡
        語義分析語料庫
        《語料庫翻譯文體學(xué)》評(píng)介
        基于語料庫“隱秘”的詞類標(biāo)注初步探究
        把課文的優(yōu)美表達(dá)存進(jìn)語料庫
        基于交叉配血的多賬戶識(shí)別模型研究
        基于LDA模型的95598熱點(diǎn)業(yè)務(wù)工單挖掘分析
        新興“被+X”結(jié)構(gòu)探析
        從認(rèn)知語義學(xué)的角度來看多義動(dòng)詞“あげる”
        科技視界(2016年18期)2016-11-03 23:48:03
        語義分析算法在互聯(lián)網(wǎng)信息檢索中的應(yīng)用
        基于JAVAEE的維吾爾中介語語料庫開發(fā)與實(shí)現(xiàn)
        語言與翻譯(2015年4期)2015-07-18 11:07:45
        基于網(wǎng)絡(luò)語料庫的“給力”研究
        国产av无码专区亚洲a∨毛片| 人妻被猛烈进入中文字幕| 激情内射亚洲一区二区| 亚洲三级中文字幕乱码| 亚洲欧美综合精品成人网站| 日本公妇在线观看中文版| 91亚洲国产成人aⅴ毛片大全 | 成人区人妻精品一熟女| 亚洲Va中文字幕久久无码一区 | 一本久久精品久久综合| 国产在线精品一区二区三区直播| 人人妻人人爽人人做夜欢视频九色 | 国产婷婷色综合av蜜臀av| 欧美整片第一页| av男人操美女一区二区三区| 国产人妻熟女呻吟在线观看| 97精品超碰一区二区三区| 91国视频| 日韩精品中文字幕免费人妻| 成人日韩精品人妻久久一区| 国产一区二区在线视频| 国产亚洲高清不卡在线观看 | 不卡a v无码在线| 女主播国产专区在线观看| 亚洲日韩精品无码专区网址| 国产精品区一区第一页| 2022AV一区在线| 日本黑人亚洲一区二区| 黑色丝袜秘书夹住巨龙摩擦| 亚洲国产午夜精品乱码| 丰满熟女人妻一区二区三区| 色偷偷色噜噜狠狠网站30根| 18禁高潮出水呻吟娇喘蜜芽| 精品一区二区三区影片| 国产精品亚洲一区二区三区在线| 宅男666在线永久免费观看| 久久国产精品不只是精品| 黄片亚洲精品在线观看| 狠狠摸狠狠澡| 国产亚洲精久久久久久无码77777| 亚洲国产日韩精品综合|