亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        口語(yǔ)對(duì)話中冗余詞匯識(shí)別方法研究

        2011-06-14 03:45:48翟飛飛宗成慶
        中文信息學(xué)報(bào) 2011年3期
        關(guān)鍵詞:語(yǔ)料口語(yǔ)詞匯

        翟飛飛,宗成慶

        (中國(guó)科學(xué)院 自動(dòng)化研究所 模式識(shí)別國(guó)家重點(diǎn)實(shí)驗(yàn)室,北京 100190)

        1 引言

        口語(yǔ)是人與人之間相互交流最直接、最方便、最自然的語(yǔ)言使用方式。與書(shū)面語(yǔ)相比,由于人在說(shuō)話過(guò)程中思維和交流的需要,口語(yǔ)句子中往往存在很多不同的語(yǔ)言現(xiàn)象,包括間斷、省略、重復(fù)、修正、詞序顛倒和冗余等。對(duì)于口語(yǔ)中的這些特殊語(yǔ)言現(xiàn)象的研究和處理,是目前口語(yǔ)分析所面臨的一個(gè)難點(diǎn)[1]。

        文獻(xiàn)[1]對(duì)漢語(yǔ)口語(yǔ)中的冗余現(xiàn)象進(jìn)行了定義,即當(dāng)說(shuō)話人思維停頓或不連貫的時(shí)候,往往不自覺(jué)地在句子中添加一些詞匯來(lái)保持語(yǔ)氣和句子的連續(xù)性,這些添加的詞匯就構(gòu)成了冗余。冗余現(xiàn)象是句中的多余成分,去掉這些成分不會(huì)對(duì)句子的意思和結(jié)構(gòu)產(chǎn)生影響。例如: 口語(yǔ)句子: “是那個(gè)如家快捷嗎?”中的“那個(gè)”一詞在本句中為冗余成分。

        在英語(yǔ)口語(yǔ)語(yǔ)言現(xiàn)象的自動(dòng)處理方面,人們對(duì)重復(fù)、修訂等現(xiàn)象進(jìn)行了大量的研究,冗余現(xiàn)象的處理主要是作為上述工作的一個(gè)子任務(wù)來(lái)完成的。文獻(xiàn)[2]使用規(guī)則的方法來(lái)識(shí)別口語(yǔ)句子中的冗余成分。文獻(xiàn)[3]使用條件隨機(jī)場(chǎng)(CRFs),文獻(xiàn)[4]使用最大熵模型在識(shí)別其他特殊語(yǔ)言現(xiàn)象的同時(shí)對(duì)冗余成分進(jìn)行了識(shí)別。文獻(xiàn)[5]對(duì)刪除冗余成分后造成的影響進(jìn)行了實(shí)驗(yàn),他們發(fā)現(xiàn)提前刪除冗余成分能夠提高依存句法分析的準(zhǔn)確率。

        在漢語(yǔ)口語(yǔ)語(yǔ)言現(xiàn)象的自動(dòng)處理方面,針對(duì)口語(yǔ)冗余現(xiàn)象處理的工作并不是很多。文獻(xiàn)[6]介紹了中國(guó)科學(xué)院自動(dòng)化研究所和中國(guó)社會(huì)科學(xué)院語(yǔ)言所聯(lián)合建設(shè)的漢語(yǔ)口語(yǔ)對(duì)話語(yǔ)料庫(kù),它涉及了旅館預(yù)訂、機(jī)場(chǎng)信息咨詢(xún)以及餐館訂餐等領(lǐng)域,并對(duì)口語(yǔ)的各種特殊現(xiàn)象進(jìn)行了標(biāo)注。文獻(xiàn)[7]對(duì)100多段涉及旅館預(yù)訂領(lǐng)域的口語(yǔ)對(duì)話語(yǔ)料進(jìn)行了統(tǒng)計(jì)分析,冗余現(xiàn)象在口語(yǔ)的特殊語(yǔ)言現(xiàn)象中所占比例為4.7%。文獻(xiàn)[8]詳盡地分析了真實(shí)口語(yǔ)語(yǔ)料中的冗余現(xiàn)象,對(duì)冗余現(xiàn)象涉及的詞匯長(zhǎng)度,詞匯分布進(jìn)行了統(tǒng)計(jì),并對(duì)冗余現(xiàn)象出現(xiàn)的特征進(jìn)行了詳細(xì)分析并提出了一種面向中間表示的口語(yǔ)解析方法,得到了較好的魯棒性和正確率,但文獻(xiàn)[8]并沒(méi)有對(duì)冗余現(xiàn)象進(jìn)行針對(duì)性的處理。冗余現(xiàn)象是影響口語(yǔ)句法和語(yǔ)義分析的重要因素之一[1]。當(dāng)系統(tǒng)對(duì)口語(yǔ)句子進(jìn)行分析或自動(dòng)翻譯時(shí),冗余現(xiàn)象的存在常常會(huì)降低分析準(zhǔn)確率,影響譯文的質(zhì)量。因此,如果能夠在口語(yǔ)句子分析之前把這部分冗余成份進(jìn)行過(guò)濾或去除,就可以有效地減輕后續(xù)分析模塊的負(fù)擔(dān)。當(dāng)然,這個(gè)預(yù)處理過(guò)程本身也可以看作是口語(yǔ)理解的一項(xiàng)任務(wù)。本文基于真實(shí)漢語(yǔ)口語(yǔ)語(yǔ)料庫(kù)對(duì)冗余現(xiàn)象進(jìn)行分析,并對(duì)漢語(yǔ)口語(yǔ)中的冗余詞匯識(shí)別方法進(jìn)行了研究。

        本文的其余部分安排如下: 第2節(jié)我們對(duì)口語(yǔ)對(duì)話語(yǔ)料中的冗余現(xiàn)象進(jìn)行分析;第3節(jié)介紹了本文進(jìn)行冗余詞匯識(shí)別和處理的思路;第4節(jié)簡(jiǎn)單介紹了所使用的統(tǒng)計(jì)方法: 最大熵模型,支持向量機(jī),以及條件隨機(jī)場(chǎng);第5、6節(jié)介紹了冗余詞匯識(shí)別的方法并給出了實(shí)驗(yàn)結(jié)果和分析;第7節(jié)對(duì)冗余詞匯處理前后的口語(yǔ)句子進(jìn)行了翻譯實(shí)驗(yàn)并進(jìn)行人工打分以及結(jié)果分析;最后一節(jié)對(duì)全文進(jìn)行總結(jié)。

        2 口語(yǔ)對(duì)話語(yǔ)料統(tǒng)計(jì)結(jié)果及分析

        2.1 口語(yǔ)語(yǔ)料預(yù)處理

        本文使用中國(guó)科學(xué)院自動(dòng)化研究所和中國(guó)社會(huì)科學(xué)院語(yǔ)言所聯(lián)合建設(shè)的CASIA-CASSIL口語(yǔ)對(duì)話語(yǔ)料庫(kù)的部分語(yǔ)料,包括: 旅館咨詢(xún)領(lǐng)域44段 1 522句、機(jī)場(chǎng)信息問(wèn)詢(xún)領(lǐng)域55段1 471句以及餐館訂餐領(lǐng)域41段 1 509句。為了便于使用統(tǒng)計(jì)方法對(duì)口語(yǔ)中的冗余詞匯進(jìn)行識(shí)別,我們首先把口語(yǔ)句子中的冗余現(xiàn)象分為以下四類(lèi):

        (1) 語(yǔ)氣詞性質(zhì)的冗余詞匯,即在句子中表示語(yǔ)氣的詞,例: “啊”、“呀”等,記作prt^y;

        (2) 代詞性質(zhì)的冗余詞匯,即詞性為代詞,且可以作為冗余詞匯的詞匯,例: “這個(gè)”、“那”等,記作prt^r;

        (3) 副詞性質(zhì)的冗余詞匯,即詞性為副詞,且可以作為冗余詞匯的詞,例: “就”等,記作prt^d;

        (4) 插入語(yǔ)性質(zhì)的冗余詞匯,除上述三類(lèi)的冗余都分入此類(lèi),例“就是說(shuō)”,“就是”等,記作prt^p;

        另外,為了后續(xù)描述的方便,我們把后面三類(lèi)的合并,即(2)(3)(4)的并集記作prt^rdp。

        我們按照上述四類(lèi)對(duì)所使用的口語(yǔ)對(duì)話語(yǔ)料中的冗余詞匯進(jìn)行標(biāo)注。在標(biāo)注之前,我們首先對(duì)語(yǔ)料進(jìn)行了如下預(yù)處理: (1)由于真實(shí)的口語(yǔ)轉(zhuǎn)成的文本中并沒(méi)有標(biāo)點(diǎn)符號(hào)信息,而CASIA-CASSIL語(yǔ)料中含有標(biāo)點(diǎn)符號(hào)信息,因此在標(biāo)注之前,我們首先刪除了語(yǔ)料中的標(biāo)點(diǎn)符號(hào)。(2)由于我們沒(méi)有發(fā)現(xiàn)專(zhuān)用于真實(shí)場(chǎng)景口語(yǔ)對(duì)話語(yǔ)料的分詞工具,我們使用分詞工具ICTClass對(duì)語(yǔ)料進(jìn)行分詞和詞性標(biāo)注。然后按照我們的分類(lèi)模式對(duì)語(yǔ)料中的冗余詞匯進(jìn)行標(biāo)注*冗余詞匯標(biāo)注過(guò)程中,對(duì)于具有句型指示作用的詞匯標(biāo)注為非冗余詞匯,以保證刪除冗余詞匯后,句子的句型信息不會(huì)消除。,標(biāo)注的同時(shí)我們也對(duì)分詞錯(cuò)誤進(jìn)行了修改。完成上述工作后,就得到了本文所使用的語(yǔ)料。

        2.2 統(tǒng)計(jì)結(jié)果及分析

        對(duì)語(yǔ)料進(jìn)行預(yù)處理之后,我們對(duì)使用的口語(yǔ)對(duì)話語(yǔ)料進(jìn)行了統(tǒng)計(jì)分析。在旅館咨詢(xún)領(lǐng)域、機(jī)場(chǎng)信息問(wèn)詢(xún)領(lǐng)域以及餐館訂餐領(lǐng)域三個(gè)領(lǐng)域的口語(yǔ)語(yǔ)料中,冗余詞匯在總詞匯中所占的比例分別為 11.97%、15.23%和14.4%。這說(shuō)明在真實(shí)的口語(yǔ)對(duì)話中,有至少11%的詞匯不僅對(duì)口語(yǔ)的語(yǔ)法分析和語(yǔ)義理解沒(méi)有幫助,而且會(huì)產(chǎn)生不利影響。其他的統(tǒng)計(jì)結(jié)果如表1。

        表1 真實(shí)口語(yǔ)語(yǔ)料統(tǒng)計(jì)結(jié)果

        表格中的數(shù)據(jù)代表當(dāng)前語(yǔ)料中當(dāng)前類(lèi)別的冗余詞匯在所有冗余詞匯中所占的比例。從表中可以看出,無(wú)論哪個(gè)領(lǐng)域,語(yǔ)氣詞性質(zhì)的冗余詞匯(prt^y)在冗余詞匯中所占比例最大,超過(guò)50%,說(shuō)明人們?cè)诳谡Z(yǔ)對(duì)話中語(yǔ)氣詞的使用較多,這也符合一般的規(guī)律。前三類(lèi)冗余詞匯所占比例之和可以達(dá)到93%以上,這說(shuō)明冗余詞匯在詞典中的分布主要集中在語(yǔ)氣詞、副詞、代詞三種詞性上,這也為我們的冗余成分識(shí)別提供了便利。

        3 本文的思路

        經(jīng)由上面的分析,我們知道冗余詞匯的分布相對(duì)集中,而冗余現(xiàn)象則主要是由冗余詞匯構(gòu)成*一些長(zhǎng)度較長(zhǎng)的冗余現(xiàn)象可能并不是完全由典型的冗余詞匯組成,例如“我想打聽(tīng)一下”,但在語(yǔ)料中所占比例很少[8],且直觀上對(duì)譯文影響不大,因此對(duì)這部分冗余成份本文沒(méi)有進(jìn)行處理。,因此本文以冗余詞匯作為冗余現(xiàn)象識(shí)別和處理的基本單位。本文對(duì)冗余詞匯進(jìn)行識(shí)別和處理的任務(wù)就是識(shí)別并刪除口語(yǔ)對(duì)話語(yǔ)句中的冗余詞匯。刪除句子中的冗余詞匯后,就可以把處理好的口語(yǔ)句子送入后續(xù)應(yīng)用模塊進(jìn)行后續(xù)處理,如口語(yǔ)句法分析,口語(yǔ)機(jī)器翻譯等。因此,為盡量減小刪除冗余詞匯后對(duì)后續(xù)應(yīng)用模塊的不利影響,冗余詞匯識(shí)別的原則是在保證準(zhǔn)確率的情況下,盡量提高召回率。也就是說(shuō),在F值相差不大的情況下,我們選擇準(zhǔn)確率較高的方法進(jìn)行冗余詞匯識(shí)別。

        我們把識(shí)別口語(yǔ)中冗余詞匯的任務(wù)作為一個(gè)分類(lèi)問(wèn)題,通過(guò)統(tǒng)計(jì)分類(lèi)器對(duì)口語(yǔ)句子中的詞進(jìn)行分類(lèi)從而判定當(dāng)前詞是否是冗余詞匯。

        為了在冗余詞匯識(shí)別過(guò)程中采用與各個(gè)冗余詞匯類(lèi)別相適應(yīng)的特征模板信息,我們把各個(gè)類(lèi)別的識(shí)別任務(wù)分開(kāi)進(jìn)行。例如,語(yǔ)氣詞性質(zhì)的冗余詞匯識(shí)別并不需要前后文的詞型特征,但前后文的詞型特征對(duì)于識(shí)別代詞、副詞、插入語(yǔ)性質(zhì)的冗余詞匯卻有著積極的作用。另外,我們發(fā)現(xiàn)識(shí)別代詞、副詞、插入語(yǔ)性質(zhì)的冗余詞匯所需要的特征模板信息基本一致,為了降低識(shí)別過(guò)程的復(fù)雜性,我們把這三類(lèi)的冗余成分識(shí)別任務(wù)合并在一起進(jìn)行。因此冗余成分的識(shí)別任務(wù)即變?yōu)閮蓚€(gè)典型的兩類(lèi)分類(lèi)問(wèn)題: (1)對(duì)口語(yǔ)句子中的詞按照語(yǔ)氣詞性質(zhì)的冗余詞匯prt^y和非prt^y兩類(lèi)進(jìn)行分類(lèi)。(2)對(duì)口語(yǔ)句子中的非prt^y詞匯按照prt^rdp和非prt^rdp兩類(lèi)進(jìn)行分類(lèi)。冗余詞匯處理的過(guò)程可用圖1表示。

        圖1 口語(yǔ)冗余詞匯識(shí)別與處理過(guò)程

        以口語(yǔ)句子“呃哦你這個(gè)能不能按時(shí)解決啊”為例說(shuō)明這個(gè)過(guò)程。對(duì)口語(yǔ)句子預(yù)處理之后,首先識(shí)別句子中的語(yǔ)氣詞性質(zhì)的冗余詞匯“呃”、“哦”、“啊”,并對(duì)其標(biāo)注為“prt^y”;然后識(shí)別句子中其他類(lèi)別的冗余詞匯“這個(gè)”,并標(biāo)注為“prt^rdp”;最后刪除標(biāo)注為“prt^y”或“prt^rdp”的詞,即得到句子“你能不能按時(shí)解決”,送入后續(xù)處理模塊。

        4 三個(gè)統(tǒng)計(jì)模型簡(jiǎn)介

        現(xiàn)有的統(tǒng)計(jì)分類(lèi)方法中,最大熵模型近幾年受到人們的重視并成功地應(yīng)用于很多自然語(yǔ)言處理問(wèn)題中,例如: 詞性標(biāo)注、中文分詞、句子邊界識(shí)別、淺層句法分析及文本分類(lèi)等。SVM是一種基于統(tǒng)計(jì)學(xué)習(xí)理論下的數(shù)據(jù)集分割模型,它在自然語(yǔ)言處理領(lǐng)域也有著廣泛應(yīng)用,例如: 文本分類(lèi)、淺層句法分析等。而且它在兩類(lèi)分類(lèi)問(wèn)題上有著很好的分類(lèi)效果。另外,冗余詞匯的識(shí)別問(wèn)題還可看作一個(gè)序列標(biāo)注問(wèn)題,而條件隨機(jī)場(chǎng)模型(CRFs)是序列標(biāo)注模型中的佼佼者。另外,上述三種統(tǒng)計(jì)方法都能夠融合口語(yǔ)句子中各種上下文特征信息而無(wú)需考慮特征之間的相關(guān)性,便于使用各種各樣的特征信息,因此,本文分別使用了最大熵模型、支持向量機(jī)(SVM)和條件隨機(jī)場(chǎng)(CRFs)三種統(tǒng)計(jì)方法來(lái)完成口語(yǔ)冗余詞匯的識(shí)別任務(wù),并選擇效果最好的方法用于最終的冗余詞匯識(shí)別。

        4.1 最大熵模型

        最大熵模型的基本思想是在滿足所有已知因素的基礎(chǔ)上建立模型,并對(duì)未知事件作最客觀的估計(jì)。也就是說(shuō),在滿足已知因素的條件下,選擇熵最大的模型來(lái)估計(jì)數(shù)據(jù)的分布[9]。使用最大熵模型進(jìn)行數(shù)據(jù)分布的估計(jì)一般使用文獻(xiàn)[10]介紹的GIS(Generalized Iterative Scaling)算法,Pietra等人改進(jìn)了GIS算法,具體見(jiàn)文獻(xiàn)[11]。本文使用最大熵模型分別完成兩項(xiàng)任務(wù),即: (1)對(duì)口語(yǔ)句子中的詞按照語(yǔ)氣詞性質(zhì)的冗余詞匯prt^y和非prt^y兩類(lèi)進(jìn)行分類(lèi)。(2)對(duì)口語(yǔ)句子中的詞按照prt^rdp和非prt^rdp兩類(lèi)進(jìn)行分類(lèi)。

        4.2 支持向量機(jī)

        支持向量機(jī)(SVM)是由文獻(xiàn)[12]提出的一種基于兩類(lèi)分類(lèi)問(wèn)題的有監(jiān)督機(jī)器學(xué)習(xí)算法,SVM的目標(biāo)是尋找一個(gè)分類(lèi)面使得兩類(lèi)數(shù)據(jù)正確切分,且分類(lèi)面距離兩類(lèi)數(shù)據(jù)的間隔最大化。SVM在兩類(lèi)分類(lèi)問(wèn)題上有著良好的分類(lèi)效果,因此本文使用SVM分別完成了兩項(xiàng)任務(wù),即: (1)對(duì)口語(yǔ)句子中的詞按照語(yǔ)氣詞性質(zhì)的冗余詞匯prt^y和非prt^y兩類(lèi)進(jìn)行分類(lèi)。(2)對(duì)口語(yǔ)句子中的詞按照prt^rdp和非prt^rdp兩類(lèi)進(jìn)行分類(lèi)。

        4.3 條件隨機(jī)場(chǎng)

        條件隨機(jī)場(chǎng)(CRFs)是繼隱馬爾可夫模型和最大熵馬爾可夫模型之后提出的一個(gè)新的基于統(tǒng)計(jì)的序列標(biāo)注模型,它在自然語(yǔ)言處理的領(lǐng)域得到了很好的應(yīng)用。CRFs 是一個(gè)無(wú)向圖模型,它在給定需要標(biāo)記的觀察序列的條件下,計(jì)算整個(gè)標(biāo)記序列的聯(lián)合概率分布[13]。它不僅具有最大熵馬爾可夫模型的優(yōu)點(diǎn),而且從理論上解決了標(biāo)注偏置問(wèn)題,達(dá)到了更好的效果。本文把冗余詞匯識(shí)別問(wèn)題看作一個(gè)序列標(biāo)注問(wèn)題,使用CRFs對(duì)口語(yǔ)句子中的詞進(jìn)行標(biāo)注,標(biāo)注類(lèi)別為prt^rdp和非prt^rdp。

        5 識(shí)別語(yǔ)氣詞性質(zhì)的冗余詞匯

        語(yǔ)氣詞性質(zhì)的冗余詞匯是指在句子中作為冗余成份的語(yǔ)氣詞,例如“啊”、“呀”等。本部分的任務(wù)是判斷口語(yǔ)句子中的每個(gè)詞是否是語(yǔ)氣詞性質(zhì)的冗余詞匯。由于語(yǔ)氣詞在口語(yǔ)句子中出現(xiàn)的位置相對(duì)固定,且直觀上這個(gè)問(wèn)題是一個(gè)分類(lèi)問(wèn)題而不是一個(gè)序列標(biāo)注問(wèn)題,因此我們選擇最大熵模型和SVM來(lái)完成這個(gè)任務(wù)。

        5.1 最大熵模型、SVM及特征選擇

        本文使用張樂(lè)博士的最大熵工具包,采用GIS迭代算法迭代200次進(jìn)行訓(xùn)練,其他參數(shù)為工具默認(rèn)值,記作ME,特征模板如表2所示。

        我們使用SVM-light V6.01進(jìn)行了兩次SVM識(shí)別prt^y的實(shí)驗(yàn)。由于其他核函數(shù)訓(xùn)練時(shí)間長(zhǎng)且效果不好,實(shí)驗(yàn)均采用線性核函數(shù),其他參數(shù)為工具默認(rèn)值。兩次實(shí)驗(yàn)使用不同的特征模板: 一次和上述最大熵模型一致,記作SVM_MEfea,而另一次使用的特征模板如表3所示,記作SVM_Full。

        表2 prt^y識(shí)別—最大熵模型特征模板

        表3 prt^y識(shí)別—SVM_Full的特征模板

        5.2 規(guī)則添加

        根據(jù)對(duì)語(yǔ)氣詞性質(zhì)的冗余詞匯在口語(yǔ)句子中的使用規(guī)律的總結(jié),在使用統(tǒng)計(jì)模型進(jìn)行冗余詞匯識(shí)別的基礎(chǔ)上,我們又添加了以下三類(lèi)規(guī)則來(lái)協(xié)助完成prt^y的識(shí)別,實(shí)驗(yàn)證明規(guī)則的添加顯著提高了識(shí)別的準(zhǔn)確率和召回率。

        a) 識(shí)別口語(yǔ)句子中關(guān)于語(yǔ)氣詞的固定搭配,根據(jù)搭配的含義對(duì)其中的語(yǔ)氣詞進(jìn)行單獨(dú)處理。例如搭配“不是…吧”,對(duì)應(yīng)的規(guī)則為: “吧 after 不是 notprt 5”,意思是指,如果“吧”出現(xiàn)在“不是”之后,并且二者之間的詞的個(gè)數(shù)小于或等于5,則判定“吧”不是冗余詞匯。

        b) 如果口語(yǔ)句子只包含語(yǔ)氣詞,用來(lái)表示應(yīng)答、響應(yīng)等情況,規(guī)定句子中的第一個(gè)詞為非冗余詞匯。該類(lèi)規(guī)則是一個(gè)語(yǔ)氣詞列表,若句子中只出現(xiàn)這些語(yǔ)氣詞,那么就可以使用這條規(guī)則。例如: 為表示“肯定答復(fù)”的含義,使用句子“啊,?。 ?,則第一個(gè)“啊”標(biāo)注為非冗余詞匯。

        c) 許多語(yǔ)氣詞的使用很簡(jiǎn)單,除了特定的結(jié)構(gòu)外,在口語(yǔ)句子中均沒(méi)有任何意義,于是都標(biāo)注為冗余詞匯。例如c)類(lèi)規(guī)則: “唉 prt^y”,表示只要口語(yǔ)句子中出現(xiàn)詞匯“唉”,就判定為冗余詞匯。

        規(guī)則使用時(shí),首先根據(jù)詞的前后文信息判斷是否能夠使用這條規(guī)則,然后根據(jù)規(guī)則確定當(dāng)前詞是否是冗余詞匯。例如句子“不是 沒(méi)有 了 吧”。分析詞匯“吧”時(shí),由于它前面的第3個(gè)詞為“不是”,因此可以使用規(guī)則,于是判定“吧”不是冗余詞匯。

        我們?cè)谏鲜鲎畲箪啬P秃蚐VM(使用與最大熵模型相同的特征模板和取值)的基礎(chǔ)上又進(jìn)行了添加規(guī)則的實(shí)驗(yàn)。實(shí)驗(yàn)過(guò)程中,首先檢查當(dāng)前詞匯是否可以使用規(guī)則進(jìn)行判定,若存在對(duì)應(yīng)的規(guī)則,則根據(jù)規(guī)則對(duì)詞匯進(jìn)行判定。若沒(méi)有,則使用統(tǒng)計(jì)模型對(duì)詞匯進(jìn)行判定。實(shí)驗(yàn)中共使用規(guī)則39條,兩次實(shí)驗(yàn)分別記作ME_Rule和 SVM_MEfea_Rule。

        5.3 實(shí)驗(yàn)

        我們把本文第2部分介紹的語(yǔ)料即旅館咨詢(xún)領(lǐng)域1 522句、機(jī)場(chǎng)信息問(wèn)詢(xún)領(lǐng)域1 471句以及餐館訂餐領(lǐng)域1 509句合并在一起進(jìn)行了語(yǔ)氣詞性質(zhì)的冗余詞匯的識(shí)別實(shí)驗(yàn),并使用識(shí)別正確率(Precision)、召回率(Recall)和F值(Fscore)三項(xiàng)指標(biāo)對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行評(píng)價(jià)。由于實(shí)驗(yàn)所使用的語(yǔ)料規(guī)模較小,我們采用交叉驗(yàn)證的方式進(jìn)行實(shí)驗(yàn)以保證實(shí)驗(yàn)結(jié)果的精確性。實(shí)驗(yàn)過(guò)程中,我們把語(yǔ)料均分為9份,進(jìn)行9次實(shí)驗(yàn),每次實(shí)驗(yàn)使用其中的8份作為訓(xùn)練語(yǔ)料,剩余的一份作為測(cè)試語(yǔ)料,并將9次實(shí)驗(yàn)的結(jié)果取平均值后得到最終的結(jié)果,如表4所示。

        表4 統(tǒng)計(jì)方法識(shí)別prt^y結(jié)果

        由SVM_MEfea 和 SVM_Full 的實(shí)驗(yàn)結(jié)果表明,增加的特征并沒(méi)有改善prt^y識(shí)別的結(jié)果。從ME和ME_Rule,以及SVM_MEfea和SVM_MEfea_Rule兩組結(jié)果對(duì)比,我們可以看到規(guī)則的加入顯著改善了prt^y識(shí)別的結(jié)果。另外,由ME和SVM_MEfea以及ME_Rule 和SVM_MEfea_Rule的結(jié)果對(duì)比,我們發(fā)現(xiàn)最大熵模型結(jié)果準(zhǔn)確率較高,而SVM結(jié)果的召回率相對(duì)較高,但準(zhǔn)確率較低。由于識(shí)別冗余詞匯的目的是便于后續(xù)分析,且冗余詞匯識(shí)別的原則是保證準(zhǔn)確率的情況下,盡量提高召回率,因此我們選擇最大熵模型進(jìn)行prt^y的識(shí)別。

        5.4 錯(cuò)誤分析

        使用統(tǒng)計(jì)方法進(jìn)行語(yǔ)氣詞性質(zhì)的冗余詞匯識(shí)別能夠達(dá)到較高的正確率,但由于某些語(yǔ)氣詞的搭配結(jié)構(gòu)較為復(fù)雜或者涉及到語(yǔ)義層面,模型很難對(duì)其作出正確的識(shí)別,主要有以下兩條:

        1) 語(yǔ)氣詞“啦”用于某些動(dòng)詞或動(dòng)詞短語(yǔ)后表示完成一種動(dòng)作,不是冗余成分,但模型標(biāo)注為冗余。例句子“取消啦”,“跑總站去啦”,“找到啦”等。

        2) 語(yǔ)氣詞“吧”、“呢”用于表示疑問(wèn)語(yǔ)氣,使得句子為疑問(wèn)句型,不是冗余成分,但模型標(biāo)注其為冗余成分。例如句子 “沒(méi)問(wèn)題吧”,“十點(diǎn)呢”等。

        6 識(shí)別口語(yǔ)句子中prt^rdp

        prt^rdp是指在口語(yǔ)句子中具有代詞、或者副詞、或者插入語(yǔ)性質(zhì)的冗余詞匯。本部分的任務(wù)是對(duì)口語(yǔ)句子中的每個(gè)詞按prt^rdp或非prt^rdp進(jìn)行分類(lèi)并進(jìn)行相應(yīng)標(biāo)注。我們使用了最大熵模型、SVM以及條件隨機(jī)場(chǎng)(CRFs)進(jìn)行了實(shí)驗(yàn),所使用的語(yǔ)料為第2部分所得到的語(yǔ)料。

        6.1 語(yǔ)料預(yù)處理

        統(tǒng)計(jì)模型在獲取上下文的詞性作為特征時(shí),不會(huì)因?yàn)樵~性對(duì)應(yīng)的詞不同而對(duì)詞性特征加以區(qū)分,于是相同的詞性對(duì)類(lèi)別的指示作用也就相同。但冗余詞匯和非冗余詞匯為分類(lèi)提供的信息顯然不同,因此在特征采集之前,我們對(duì)詞性進(jìn)行修改以反應(yīng)這種提供信息的差異。我們稱(chēng)這種策略為PosModi。

        在進(jìn)行特征提取之前,我們遍歷訓(xùn)練語(yǔ)料,抽取所有的prt^rdp冗余詞匯建立prt^rdp冗余詞詞典,在之后的模型訓(xùn)練時(shí),對(duì)冗余詞詞典中的詞的詞性進(jìn)行修改。例如: “就”的詞性為副詞“d”,將其修改為: “就”詞性為“d_prt”。

        6.2 最大熵模型、SVM、CRFs及特征選擇

        我們?nèi)匀皇褂脧垬?lè)博士的最大熵工具包,并采用GIS迭代算法迭代200次進(jìn)行訓(xùn)練,其他參數(shù)為默認(rèn)值,記作ME,特征模板如表5所示。

        表5 最大熵模型識(shí)別prt^rdp特征模板

        SVM所使用的工具為SVM-light V6.01,由于其他核函數(shù)訓(xùn)練時(shí)間長(zhǎng)且效果不好,因此我們采用線性核函數(shù),其他參數(shù)為默認(rèn)值,記作SVM,特征模板如表6所示。

        表6 SVM識(shí)別prt^rdp特征模板

        我們使用工具CRF++--0.53進(jìn)行prt^rdp的識(shí)別,選擇的特征過(guò)濾頻次下限值為5,且由九折交叉驗(yàn)證取得-c值為0.3*-c選項(xiàng)用于規(guī)定模型對(duì)訓(xùn)練數(shù)據(jù)的擬合程度,c值越大,對(duì)訓(xùn)練數(shù)據(jù)的擬合程度越高,但擬合程度過(guò)高會(huì)出現(xiàn)過(guò)擬合現(xiàn)象。此處我們使用交叉驗(yàn)證的方式選擇-c的參數(shù)為0.3。,其他參數(shù)設(shè)為默認(rèn)值,記作CRF,特征模板選擇如表7。

        表7 CRF識(shí)別prt^rdp特征模板

        注: a. 表5、6、7中的C,P,以及下標(biāo)的含義與表2、3相同。T-1代表模型對(duì)前一個(gè)詞的標(biāo)注結(jié)果。

        b. 表5、6中的“取值”一列的含義與表2、3一致。

        c. 表7中“取值”一列的含義為對(duì)特征進(jìn)行重復(fù)并添加到模型中。例如若當(dāng)前詞的詞性為副詞“d”,則構(gòu)建兩個(gè)模板T00和T01,兩個(gè)模板的取值均為“d”,并加入到模型中。實(shí)驗(yàn)證明,這樣的方式進(jìn)行特征重復(fù)能夠提高識(shí)別的效果。

        6.3 實(shí)驗(yàn)及分析

        我們使用第2部分所得到的口語(yǔ)語(yǔ)料共4 502句進(jìn)行prt^rdp識(shí)別實(shí)驗(yàn),并使用識(shí)別正確率(Precision)、召回率(Recall)和F值(Fscore)三項(xiàng)指標(biāo)對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行評(píng)價(jià)。實(shí)驗(yàn)過(guò)程中,和第5部分采用的實(shí)驗(yàn)方法相同,我們把語(yǔ)料均分為9份,進(jìn)行9次實(shí)驗(yàn),并對(duì)實(shí)驗(yàn)結(jié)果取平均值后得到最終的實(shí)驗(yàn)結(jié)果,如表8所示。

        表8 統(tǒng)計(jì)方法識(shí)別prt^rdp結(jié)果

        從表中可以看出,PosModi策略并沒(méi)有改善識(shí)別結(jié)果,而且雖然各個(gè)模型結(jié)果有好有差,但總體上相差不大,結(jié)果不是很好。主要原因是所選擇的特征無(wú)法真正反應(yīng)prt^rdp冗余詞匯的本質(zhì)。因?yàn)闊o(wú)論是代詞性質(zhì)的冗余,還是副詞性質(zhì)的冗余,都是由上下文以及本身的語(yǔ)義關(guān)系決定,而不是它周?chē)脑~、詞性等外在特征所能夠單純決定的。例如下面的口語(yǔ)句子:

        句(1): 你們這個(gè)是多長(zhǎng)時(shí)間一班?

        句(2): 你們這個(gè)是多長(zhǎng)時(shí)間去一次海南?

        句(1)中的“這個(gè)”指代屬于句子主語(yǔ)“你”的某樣?xùn)|西,例如“大巴”。而句(2)則是說(shuō)話人為維持話語(yǔ)連續(xù)性而加入的冗余成分。為了防止噪聲信息的引入,特征選取的窗口不能太大,因此句(1)和句(2)中的“這個(gè)”的上下文信息完全一致,但卻代表不同的含義。這說(shuō)明無(wú)論是代詞性質(zhì)的冗余,還是副詞性質(zhì)的冗余,在相當(dāng)大程度上是由長(zhǎng)距離的上下文信息、前后句子的信息以及句子本身的語(yǔ)義關(guān)系決定,而不是它周?chē)脑~或詞性所能夠單純決定的。在滿足冗余詞匯識(shí)別原則的條件下,我們選擇CRFs來(lái)進(jìn)行prt^rdp冗余詞匯的識(shí)別。

        7 對(duì)翻譯性能的影響

        7.1 語(yǔ)料分析及評(píng)價(jià)標(biāo)準(zhǔn)

        我們隨機(jī)選擇了旅館咨詢(xún)領(lǐng)域的兩段口語(yǔ)對(duì)話76句、機(jī)場(chǎng)信息問(wèn)詢(xún)領(lǐng)域的三段對(duì)話78句以及餐館訂餐領(lǐng)域的三段對(duì)話76句,共230句口語(yǔ)對(duì)話語(yǔ)句,使用最大熵模型識(shí)別語(yǔ)氣詞性質(zhì)的冗余詞匯,使用CRFs識(shí)別其他種類(lèi)的冗余詞匯并進(jìn)行相應(yīng)處理。

        在230句測(cè)試語(yǔ)料中,共有119句含有冗余詞匯;冗余詞匯共有205個(gè),占全部詞匯總數(shù)的 13.9%,其中語(yǔ)氣詞性質(zhì)的冗余詞匯共有141個(gè),占冗余詞匯總數(shù)的68.7%,其他性質(zhì)的冗余詞匯共64個(gè),占31.3%。

        由于上述語(yǔ)料沒(méi)有對(duì)應(yīng)的翻譯答案,我們使用人工主觀打分的方法對(duì)結(jié)果進(jìn)行評(píng)測(cè)。打分標(biāo)準(zhǔn)使用第二次國(guó)際口語(yǔ)翻譯評(píng)測(cè)(IWSLT)所采用的打分標(biāo)準(zhǔn),即把流暢性、充分性以及語(yǔ)義保持性劃分為5個(gè)等級(jí)進(jìn)行打分[14],評(píng)價(jià)指標(biāo)如表9所示。

        表9 人工主觀打分評(píng)價(jià)標(biāo)準(zhǔn)

        7.2 實(shí)驗(yàn)

        本文分別使用目前翻譯質(zhì)量較好的SYSTRAN和Google翻譯系統(tǒng)進(jìn)行實(shí)驗(yàn)。冗余詞匯處理完成后,我們使用這兩個(gè)翻譯系統(tǒng)對(duì)處理后的230句口語(yǔ)句子進(jìn)行翻譯。

        每個(gè)翻譯系統(tǒng)對(duì)每個(gè)漢語(yǔ)口語(yǔ)句子都會(huì)得到三句英語(yǔ)譯文,分別對(duì)應(yīng)刪除冗余詞匯前(記作BeProc),利用統(tǒng)計(jì)方法識(shí)別并刪除冗余詞匯后(記作AfProc),以及刪除人工標(biāo)注的完全正確的冗余詞匯后(記作CorrectProc)的漢語(yǔ)句子。

        每個(gè)口語(yǔ)句子都由兩個(gè)打分人員進(jìn)行獨(dú)立打分。打分完成后,對(duì)所有句子的對(duì)應(yīng)指標(biāo)求平均值,SYSTRAN和Google兩個(gè)翻譯系統(tǒng)在刪除冗余詞匯前后的翻譯人工打分結(jié)果見(jiàn)表10、表11。

        表10 SYSTRAN系統(tǒng)翻譯結(jié)果

        表11 Google系統(tǒng)翻譯結(jié)果

        從表10、表11中可以看出,刪除冗余詞匯前后,兩個(gè)系統(tǒng)譯文的充分性指標(biāo)基本上沒(méi)有變化,而流暢性和語(yǔ)義保持性指標(biāo)卻相應(yīng)提高,這說(shuō)明在對(duì)口語(yǔ)句子進(jìn)行自動(dòng)翻譯時(shí),冗余現(xiàn)象的存在并不會(huì)引起信息的大量丟失,但卻能夠影響譯文的流利程度并引入誤導(dǎo)信息。對(duì)比兩個(gè)系統(tǒng)的BeProc和CorrectProc結(jié)果,在充分性變化不大的情況下,漢語(yǔ)口語(yǔ)句子的英語(yǔ)譯文的流暢性和語(yǔ)義保持性都有了不同程度的改善,這說(shuō)明預(yù)先刪除冗余詞匯能夠改善口語(yǔ)的譯文質(zhì)量。BeProc和AfProc的對(duì)比結(jié)果表明,我們的基于統(tǒng)計(jì)的冗余詞匯識(shí)別方法能夠幫助改善漢語(yǔ)口語(yǔ)的英語(yǔ)譯文質(zhì)量。

        7.3 翻譯結(jié)果分析

        通過(guò)對(duì)刪除冗余詞匯前后的翻譯打分結(jié)果進(jìn)行分析,我們發(fā)現(xiàn)冗余詞匯處理主要從以下兩個(gè)方面改善了譯文質(zhì)量:

        1) 避免了引入誤導(dǎo)信息。

        例: 口語(yǔ)句子“奧您不訂今天的是嗎”

        冗余處理前SYSTRAN和Google系統(tǒng)的翻譯結(jié)果分別為:

        SYSTRAN: Austria you do not subscribe today right

        Google: Austria today is that you do not set right

        由于冗余詞匯“奧”的存在引入了誤導(dǎo)信息“Austria”,而刪除冗余詞匯后結(jié)果變?yōu)椋?/p>

        SYSTRAN: You do not subscribe today right

        Google: You do not set are you today

        消除了誤導(dǎo)信息。

        2) 使得譯文較為順暢,且能夠基本保留原文語(yǔ)義。

        例: 句子: “對(duì)就是櫻花西街馬路的西邊兒”

        冗余處理前SYSTRAN和Google系統(tǒng)的翻譯結(jié)果分別為:

        SYSTRAN: To is west the oriental cherry the street street west

        Google: West Street is the cherry on the west side of the street children

        翻譯系統(tǒng)把冗余詞匯“就是”作為句子動(dòng)詞,背離了原文語(yǔ)義,且譯文不順暢。刪除冗余詞匯后的結(jié)果為:

        SYSTRAN: To oriental cherry west street street west

        Google: Cherry Street on the west side of the road

        冗余詞匯處理后再進(jìn)行翻譯,譯文順暢且基本保留了源句子的含義。

        刪除冗余詞匯之后譯文總體質(zhì)量得到了改善,但對(duì)于某些口語(yǔ)句子,冗余詞匯的刪除有時(shí)會(huì)導(dǎo)致譯文質(zhì)量的下降。一個(gè)原因是受翻譯系統(tǒng)本身的影響。例如口語(yǔ)句子“哦就是飛機(jī)還在鄂爾多斯呢是吧”,刪除冗余詞匯之后的句子變?yōu)椤帮w機(jī)還在鄂爾多斯是吧”,兩者語(yǔ)義完全相同,Google系統(tǒng)給出的譯文分別為“Oh, the aircraft is still in it, right Erdos”和“Ordos is the right aircraft is also”。雖然輸入漢語(yǔ)句子語(yǔ)義相同,但冗余詞匯處理前的句子翻譯結(jié)果基本符合原文語(yǔ)義,但處理后的翻譯結(jié)果卻與原文語(yǔ)義大相徑庭。這說(shuō)明Google系統(tǒng)對(duì)于有些口語(yǔ)句子的語(yǔ)義無(wú)法保有忠實(shí)性,SYSTRAN系統(tǒng)也有類(lèi)似的問(wèn)題,這里不再贅述。

        另一個(gè)原因是冗余詞匯有時(shí)可以作為對(duì)話子句[1]*對(duì)話子句是指一個(gè)對(duì)話語(yǔ)句中所包含的分句,而對(duì)話語(yǔ)句指從說(shuō)話人開(kāi)始講話到講完停下或被對(duì)方強(qiáng)行打斷為止所說(shuō)的全部?jī)?nèi)容。開(kāi)始或結(jié)束的標(biāo)志,也可以作為重復(fù)或修訂等口語(yǔ)現(xiàn)象出現(xiàn)的標(biāo)志。刪除這些冗余詞匯后會(huì)使翻譯系統(tǒng)無(wú)法判定對(duì)話語(yǔ)句之間的界限,或者重復(fù)、修訂等現(xiàn)象的出現(xiàn),從而導(dǎo)致譯文質(zhì)量下降。例如: 句子“到這兒可能四點(diǎn)吧大概”,刪除冗余詞匯之前SYSTRAN系統(tǒng)的翻譯結(jié)果為: To here possible four probably,而刪除冗余詞匯之后的結(jié)果為: To here possible four general ideas。當(dāng)然,Google系統(tǒng)也有相同的問(wèn)題出現(xiàn)。

        對(duì)于刪除冗余詞匯后所導(dǎo)致的譯文質(zhì)量下降的問(wèn)題,一方面需要通過(guò)發(fā)展基于真實(shí)口語(yǔ)對(duì)話語(yǔ)料的機(jī)器翻譯系統(tǒng)來(lái)解決,而另一方面則可以通過(guò)識(shí)別標(biāo)點(diǎn)符號(hào)位置來(lái)判定對(duì)話子句間的界限,以及將冗余、重復(fù)、修訂等特殊語(yǔ)言現(xiàn)象同時(shí)進(jìn)行識(shí)別處理來(lái)解決,這也將是我們下一步要進(jìn)行的工作之一。

        8 結(jié)論及展望

        本文對(duì)漢語(yǔ)口語(yǔ)對(duì)話語(yǔ)料中的冗余現(xiàn)象進(jìn)行了分析和分類(lèi),并利用最大熵模型、支持向量機(jī)以及條件隨機(jī)場(chǎng)模型等統(tǒng)計(jì)方法分別對(duì)口語(yǔ)句子中的冗余詞匯進(jìn)行了識(shí)別和處理,并取得了較好的效果。同時(shí),本文對(duì)冗余詞匯處理前后的口語(yǔ)句子進(jìn)行了自動(dòng)翻譯,翻譯結(jié)果證明,如果在對(duì)口語(yǔ)句子進(jìn)行自動(dòng)翻譯前預(yù)先對(duì)冗余詞匯進(jìn)行識(shí)別處理,則能夠改善口語(yǔ)句子的譯文質(zhì)量。

        在下一步工作中,我們將探索對(duì)于冗余詞匯識(shí)別更為有效的方法以及特征信息,并考慮對(duì)口語(yǔ)句子中的其他特殊現(xiàn)象進(jìn)行自動(dòng)識(shí)別和處理。

        [1] 宗成慶.統(tǒng)計(jì)自然語(yǔ)言處理[M].清華大學(xué)出版社,2008.

        [2] M.Johnson, E. Charniak, and M. Lease. An improved model for recognizing disfluencies in conversational speech[C]//Proc. Rich Text 2004 Fall Workshop(RT-04F), 2004.

        [3] M. Lease and M. Johnson. Early deletion of fillers in processing conversational speech[C]//Proceedings of the HLT-NAACL, 2006:73-76.

        [4] E. Fitzgerald, F. Jelinek, and K. Hall. Reconstructing false start errors in spontaneous speech text[C]//European Association for Computational Linguistics, 2009:255-263.

        [5] E. Fitzgerald, F. Jelinek, and K. Hall. Integrating sentence- and word-level error identification for disfluency correction[C]//ACL, 2009:765-774.

        [6] Keyan Zhou, Aijun Li, Zhigang Yin, Chengqing Zong. CASIA-CASSIL: a Chinese Telephone Conversation Corpus in Real Scenarios with Multi-leveled Annotation[C]//Proceedings of LREC, 2010:2407-2413.

        [7] 宗成慶, 吳華, 黃泰翼,等. 限定領(lǐng)域漢語(yǔ)口語(yǔ)對(duì)話語(yǔ)料分析[C]//計(jì)算語(yǔ)言學(xué)文集(全國(guó)第五屆計(jì)算語(yǔ)言學(xué)聯(lián)合學(xué)術(shù)會(huì)議論文集),1999: 115-122.

        [8] 解國(guó)棟. 統(tǒng)計(jì)口語(yǔ)解析方法研究[D]. 中國(guó)科學(xué)院自動(dòng)化所博士論文, 2004.

        [9] Adam L. Berger, Stephen A.Della Pietra, Vincent J. Della Pietra. A maximum entropy approach to natural language processing[J]. Computational Linguistics, 1996,22(1):39-71.

        [10] J.N. Darroch and D. Ratcliff. Generalized iterative scaling for log-linear models[J]. Annals of Mathematical Statistics. 1972,43: 1470-1480.

        [11] S. D. Pietra, V. D. Pietra and J. Lafferty. Inducing features of random fields[J]. IEEE Transactions on Pattern Analysis and Machine Intelligence. 1997,19:380-393.

        [12] V. Vapnik. The nature of statistical learning theory[M]. Springer. 1995.

        [13] J. Lafferty, A. McCallum, and F. Pereira. Conditional random fields: probabilistic models for segmenting and labeling sequence data[C]//Proc. of ICML, 2001: 282-289.

        [14] M. Eck and C. Hori. Overview of the IWSLT 2005 Evaluation Campaign[C]//Proceedings of IWSLT. 2005:11-32.

        [15] 左云存, 宗成慶. 基于語(yǔ)義分類(lèi)樹(shù)的漢語(yǔ)口語(yǔ)理解方法[J]. 中文信息學(xué)報(bào), 2006, 20(2):8-15.

        [16] 解國(guó)棟, 宗成慶, 徐波. 面向中間語(yǔ)義表示格式的漢語(yǔ)口語(yǔ)解析方法[J]. 中文信息學(xué)報(bào), 2003, 17(1): 1-6.

        猜你喜歡
        語(yǔ)料口語(yǔ)詞匯
        本刊可直接用縮寫(xiě)的常用詞匯
        一些常用詞匯可直接用縮寫(xiě)
        本刊可直接用縮寫(xiě)的常用詞匯
        酒中的口語(yǔ)詩(shī)
        文苑(2018年22期)2018-11-19 02:54:18
        提高口語(yǔ)Level 讓你語(yǔ)出驚人
        基于語(yǔ)料調(diào)查的“連……都(也)……”出現(xiàn)的語(yǔ)義背景分析
        口語(yǔ)對(duì)對(duì)碰
        華語(yǔ)電影作為真實(shí)語(yǔ)料在翻譯教學(xué)中的應(yīng)用
        《苗防備覽》中的湘西語(yǔ)料
        國(guó)內(nèi)外語(yǔ)用學(xué)實(shí)證研究比較:語(yǔ)料類(lèi)型與收集方法
        国产av一区二区三区丝袜| 亚洲av无码一区二区乱孑伦as| 欧美日韩一卡2卡三卡4卡 乱码欧美孕交 | 色播久久人人爽人人爽人人片av| 91天堂素人精品系列全集亚洲 | 日本女优中文字幕有码| 日本久久伊人特级黄色| 欧美性猛交xxxx富婆| 另类一区二区三区| 中文字幕视频二区三区| 男女无遮挡高清性视频| 四虎影视永久地址www成人| 成年女人A级毛片免| 一区二区在线观看视频亚洲| 亚洲av无码乱码国产麻豆| 国产精品久久久久久久久免费| 亚洲精品理论电影在线观看| 男女性生活视频免费网站| 欧美巨鞭大战丰满少妇| 亚洲自偷自拍熟女另类| 日韩不卡av高清中文字幕| 精品国产亚洲一区二区三区四区 | 亚洲AV无码久久久一区二不卡 | 日韩一二三四精品免费| 国产尤物自拍视频在线观看| 色五月丁香五月综合五月| 激情内射亚洲一区二区三区爱妻 | 久久久久欧洲AV成人无码国产| 日本一区不卡在线观看| 人与人性恔配视频免费| 日本精品视频二区三区| 久久精品黄aa片一区二区三区| 五月婷婷激情小说| 中文乱码字幕人妻熟女人妻| 国产极品视觉盛宴| 一道久在线无码加勒比| 亚洲又黄又大又爽毛片 | 国产一级一厂片内射视频播放 | 亚洲av男人免费久久| 给你免费播放的视频| 日韩精品一区二区亚洲av|