亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        文本風格轉(zhuǎn)換綜述

        2022-04-12 07:03:36賈熹濱劉思良胡長建
        北京工業(yè)大學學報 2022年4期
        關(guān)鍵詞:平行文本內(nèi)容

        賈熹濱,劉思良,胡長建,李 讓

        (1.北京工業(yè)大學信息學部,北京 100124;2.聯(lián)想集團北京研究院,北京 100085)

        風格轉(zhuǎn)換任務(wù)在人工智能許多子領(lǐng)域都有著廣泛的研究,包括計算機視覺[1-2]領(lǐng)域和自然語言處理[3-15]領(lǐng)域.

        風格轉(zhuǎn)換最早的研究是在計算機視覺領(lǐng)域中,Gatys等[1]認為藝術(shù)畫作是由畫家在內(nèi)容和風格中構(gòu)成復雜的圖像來創(chuàng)造獨特的視覺體驗,人工智能系統(tǒng)無法具備同樣的能力.受到計算機視覺領(lǐng)域的其他任務(wù)的啟發(fā),深度神經(jīng)網(wǎng)絡(luò)的視覺模型在某些計算機視覺的任務(wù)中可以達到接近于人類的表現(xiàn).借助深度神經(jīng)網(wǎng)絡(luò)對圖片提取內(nèi)容與風格信息,再通過內(nèi)容重構(gòu)和風格重構(gòu)可實現(xiàn)在藝術(shù)畫作與真實照片之間的圖像風格轉(zhuǎn)換.

        在自然語言處理領(lǐng)域中,風格轉(zhuǎn)換的研究起步較晚.文本風格相較圖像風格定義更為寬泛,例如:文章和文章的摘要[16]、禮貌的表達和粗魯?shù)谋磉_[17]、積極的表達和消極的表達[7]都可以視為2種不同的風格.實現(xiàn)方法可以大體分為解耦與基于一步映射兩大類.早期的文本風格轉(zhuǎn)換任務(wù)受圖像風格轉(zhuǎn)換任務(wù)相關(guān)研究的啟發(fā),將研究的重點放在如何解耦文本中的風格與內(nèi)容.近幾年也有一些研究者認為文本的內(nèi)容和風格特征的解耦是非必須的,提出讓模型直接學習不同文本風格間的映射關(guān)系,實現(xiàn)文本的風格轉(zhuǎn)換,推動文本風格轉(zhuǎn)換研究進一步發(fā)展.另外,隨著表示學習突飛猛進的發(fā)展,預訓練語言模型在各項自然語言處理的任務(wù)上取得了巨大的成功[18].基于預訓練語言模型的文本風格轉(zhuǎn)換方法[10]為文本風格轉(zhuǎn)換任務(wù)提供了新的研究思路.

        本文梳理了近幾年文本風格轉(zhuǎn)換算法的研究工作,首先,從文本風格轉(zhuǎn)換任務(wù)的數(shù)據(jù)集入手,按照是否具有平行語料,介紹平行數(shù)據(jù)集和非平行數(shù)據(jù)集;然后,依次介紹平行和非平行數(shù)據(jù)集上的相關(guān)工作;最后,展望文本風格轉(zhuǎn)換任務(wù)未來的發(fā)展,嘗試為研究人員建立一個比較完整的研究領(lǐng)域視圖,為相關(guān)領(lǐng)域的研究者提供幫助.

        1 文本風格轉(zhuǎn)換任務(wù)概述

        自然語言生成作為人工智能領(lǐng)域一項重要的技術(shù),已經(jīng)廣泛應(yīng)用于各類實際場景中,包括機器翻譯、對話生成等.以往的自然語言生成模型往往存在一些缺陷,無法根據(jù)實際需求生成文本,距離真正的人工智能還有著一定的差距.尋找可控自然語言生成方法成為近年來的研究重點.

        可控自然語言生成是指模型能根據(jù)特定的風格和內(nèi)容生成文本.風格可控包括控制句子的長度[19]、情感[20]、時態(tài)[20]等;內(nèi)容可控包括基于對話中的角色信息[21]、維基百科中的常識信息[22]等控制文本的生成.文本風格轉(zhuǎn)換任務(wù)作為可控自然語言生成的子任務(wù),是一種在保留句子內(nèi)容信息完整的基礎(chǔ)上控制句子的風格,生成具有指定風格的句子的任務(wù).通常指定的風格和句子原有風格是對立的.

        文本風格轉(zhuǎn)換在實際場景中有著廣泛的應(yīng)用.在智能客服場景中,根據(jù)用戶的情緒生成具有相關(guān)聯(lián)情感的回復能有效提高用戶的體驗.另外,在書面語言的修改及糾錯的場景中,文本風格轉(zhuǎn)換也發(fā)揮著重要作用.模型將書面語言和口語化語言作為2種相互轉(zhuǎn)換的風格,通過學習二者間的不同,為用戶提供書面語言的糾錯或改寫的服務(wù).

        然而,文本風格轉(zhuǎn)換任務(wù)的發(fā)展過程是曲折的,仍存在著三大問題阻礙文本風格轉(zhuǎn)換任務(wù)的發(fā)展.

        其一,缺乏平行的數(shù)據(jù)集.傳統(tǒng)的文本生成模型是在平行數(shù)據(jù)集上訓練的,各類任務(wù)在有監(jiān)督的訓練中取得了巨大的成功[23-24].由于文本風格轉(zhuǎn)換任務(wù)本身的復雜性,很難構(gòu)建合適的平行數(shù)據(jù)集.以Yelp[3]數(shù)據(jù)集為例,它是文本風格轉(zhuǎn)換最早的主流數(shù)據(jù)集.數(shù)據(jù)源于用戶在Yelp平臺上對飯店服務(wù)的評價.Yelp數(shù)據(jù)集將評價分為積極和消極2種.每一條評價對應(yīng)用戶一次消費體驗,很難找到對立風格中與之相對應(yīng)的句子構(gòu)建平行語料.

        其二,無法解決梯度回傳問題.傳統(tǒng)的風格轉(zhuǎn)換任務(wù)的訓練可分為2個階段:先由生成器生成目標風格的樣本,再由判別器對生成的樣本計算風格損失,通過反向傳播,回傳判別損失,實現(xiàn)風格轉(zhuǎn)換.該模式在圖像風格轉(zhuǎn)換中取得了巨大的成功[1-2].在文本風格轉(zhuǎn)換任務(wù)中,文本的表示是離散化的.在文本生成的過程中,每一個時間步都需要選擇當前時間步最大概率的詞作為該時間步的輸出,導致梯度消失難以微分,無法通過反向傳播實現(xiàn)梯度回傳,需要借助其他方法解決梯度回傳問題.

        其三,缺乏全面的自動評價指標.在文本風格轉(zhuǎn)換任務(wù)中,評價指標包括風格轉(zhuǎn)換的準確率、內(nèi)容的保存程度及流利度3個方面.在衡量模型的優(yōu)劣時,會將人工評價和自動評價的結(jié)果共同作為評價的依據(jù).人工評價是指找一批以數(shù)據(jù)集中的語言作為母語或?qū)υ撜Z言有一定能力的人,從3個方面為生成樣本打分,能夠準確地測試出模型各指標的表現(xiàn)差異.因為人工評價存在成本高、主觀性強、難以復制的缺點,所以在衡量不同模型間的差異時,還是以自動評價標準作為主要參考.自動評價指的是借助統(tǒng)計模型或神經(jīng)網(wǎng)絡(luò)模型分別從單一維度評價生成結(jié)果,計算成本低,評估速度快,可信度高.當前的自動評價方法都是只對單一維度評價,在采用自動評價指標為模型打分時,每個指標只能反映單個維度模型的表現(xiàn),無法全面地評價模型的表現(xiàn).多維度的評價指標將有助于文本風格轉(zhuǎn)換任務(wù)的進一步發(fā)展.

        為了解決這些問題,研究者們尋找了許多解決辦法.針對缺乏平行語料,采用無監(jiān)督的自然語言生成方法在非平行語料下訓練模型.另外,一些研究者還針對某些特定風格,開發(fā)平行語料的數(shù)據(jù)集,有效地緩解了缺乏平行數(shù)據(jù)的問題.針對文本的離散表示,通常的解決辦法有3種:第1種采用Gumbel-Softmax[25],通過重參數(shù)化采用連續(xù)分布近似文本的離散分布,避免離散化數(shù)據(jù)導致的無法梯度回傳問題;第2種,避開每個時間步的采樣,將每個時間步生成的詞表分布作為該時間步生成的詞向量,該方法也是文本風格轉(zhuǎn)換任務(wù)中最常用的處理離散化數(shù)據(jù)的方法;第3種,采用強化學習方法,解決不可微分問題,通過獎懲機制引導模型的生成.針對缺乏自動評價指標的問題,Zhang等[26]將Bert[18]作為自動評價模型,該模型能夠綜合文本內(nèi)容與流利度這2個評價維度對樣本打分,能夠更全面地評價模型.

        2 數(shù)據(jù)集

        研究者根據(jù)不同的實際場景,選擇一些風格特征明顯的場景構(gòu)建數(shù)據(jù)集,包括正面與負面、浪漫與人文、學術(shù)與新聞、男性與女性等.根據(jù)數(shù)據(jù)集中是否具有平行語料,將當前的數(shù)據(jù)集分為平行數(shù)據(jù)集和非平行數(shù)據(jù)集.

        平行數(shù)據(jù)集的構(gòu)成包括2種風格特征的文本數(shù)據(jù),不同風格特征的文本數(shù)據(jù)具有一對一的映射關(guān)系,每一句話都可找到風格特征不同、內(nèi)容特征相同的另一句,兩句互為標簽.在此類數(shù)據(jù)集中,模型可進行有監(jiān)督訓練.與之類似,非平行數(shù)據(jù)集包含2種不同風格特征的文本數(shù)據(jù),但不同風格的文本數(shù)據(jù)之間沒有對應(yīng)關(guān)系.因此,在非平行數(shù)據(jù)集中的文本風格轉(zhuǎn)換模型只能在無監(jiān)督的條件下訓練.本文在表1中列舉了一些文本風格轉(zhuǎn)換研究相關(guān)的數(shù)據(jù)集.

        最早的平行數(shù)據(jù)集是由Xu等[30]在2012年提出的基于寫作風格的平行數(shù)據(jù)集,將莎士比亞的寫作風格和現(xiàn)代寫作風格當作2種對立的風格特征,構(gòu)建平行數(shù)據(jù)集.之后Carlson等[34]在2018年提出基于《圣經(jīng)》語言風格與現(xiàn)代語言風格的數(shù)據(jù)集.在統(tǒng)計與比較多個版本的《圣經(jīng)》后,總結(jié)不同版本《圣經(jīng)》的語言風格,在《圣經(jīng)》的語言風格與現(xiàn)代語言風格之間構(gòu)建平行數(shù)據(jù)集.Rao等[31]在2018年提出基于書面表達的平行數(shù)據(jù)集.針對人們的書寫習慣,將書面形式的表達和非書面形式的表達作為2種不同的風格,模型可以在該數(shù)據(jù)集上學習和訓練,為非母語者提供寫作幫助及為兒童教育提供幫助,具有廣泛的應(yīng)用前景.

        非平行數(shù)據(jù)集中研究最多的是Yelp和Amazon數(shù)據(jù)集.Yelp數(shù)據(jù)集是2017年Yelp挑戰(zhàn)賽上由官方提供,通過眾包的方式選擇數(shù)據(jù)集中風格比較明顯的文本構(gòu)建的積極與消極的數(shù)據(jù)集.Yelp是國外類似于大眾點評的應(yīng)用,顧客會在Yelp上對餐廳打分.Amazon數(shù)據(jù)集原本是在文本分類任務(wù)中應(yīng)用的數(shù)據(jù),在2018年,Li等[8]將該數(shù)據(jù)集率先應(yīng)用在文本風格轉(zhuǎn)換任務(wù)中.Amazon數(shù)據(jù)集是源自于亞馬遜網(wǎng)購平臺的產(chǎn)品評價,包括積極的評價和消極的評價.

        從表1可以發(fā)現(xiàn),平行數(shù)據(jù)集的數(shù)據(jù)量通常小于非平行數(shù)據(jù)集的數(shù)據(jù)量,規(guī)?;拘?個數(shù)量級.這是因為平行數(shù)據(jù)集的構(gòu)建需要大量的人工標注.相對來說,非平行數(shù)據(jù)集更容易獲取.

        表1 文本風格轉(zhuǎn)換數(shù)據(jù)集Table 1 Text style transfer datasets

        在文本風格轉(zhuǎn)換任務(wù)的研究中,缺乏平行數(shù)據(jù)集的問題一直阻礙著文本風格轉(zhuǎn)換研究的發(fā)展.因此,當前文本風格轉(zhuǎn)換的研究主要集中在非平行數(shù)據(jù)集.

        3 基于平行數(shù)據(jù)集的文本風格轉(zhuǎn)換方法

        在文本風格轉(zhuǎn)換任務(wù)的方法中,大多數(shù)基于平行數(shù)據(jù)集的研究都是將文本風格轉(zhuǎn)換任務(wù)當作標準的序列到序列(Seq2Seq)的文本生成任務(wù),具體做法是將2種不同風格特征、相同語義信息的數(shù)據(jù)集類比為機器翻譯任務(wù)中成對的翻譯語料,參照機器翻譯生成方法實現(xiàn)文本的風格轉(zhuǎn)換.

        Jhamtani等[35]的工作是較早出現(xiàn)的基于平行數(shù)據(jù)集的文本風格轉(zhuǎn)換研究.該工作在Xu等[30]提出的莎士比亞數(shù)據(jù)集上,參考生成式文本摘要的復制機制[36],提出在標準的序列到序列模型中增加指針網(wǎng)絡(luò)[37],有效提升了文本風格轉(zhuǎn)換效果.

        在Rao等[31]提出基于書寫正式的數(shù)據(jù)集后,大量基于平行數(shù)據(jù)集文本風格轉(zhuǎn)換的研究都集中在該數(shù)據(jù)集.Niu等[38]在2018年將多語言引入文本風格轉(zhuǎn)換任務(wù)中,提出借助書寫形式敏感的機器翻譯模型在英語與法語翻譯的過程中加入風格控制.采用多任務(wù)的訓練方式,一方面約束機器翻譯模型的翻譯能力,另一方面約束生成的文本具有指定的風格,通過學習不同語言中包含的共同的語言知識有效地提升文本風格轉(zhuǎn)換的質(zhì)量.這也是自然語言生成領(lǐng)域中常見的提升模型生成質(zhì)量的方式.與Niu等[38]的研究工作相同,Xu等[39]同樣采用了多任務(wù)的思想,通過多個損失函數(shù)訓練模型在保留足夠多語義內(nèi)容的基礎(chǔ)上,實現(xiàn)文本風格的轉(zhuǎn)換.

        隨著GPT2[40]在自然語言生成任務(wù)中顯示出的卓越性能,Wang等[41]將GPT2模型應(yīng)用于文本風格轉(zhuǎn)換任務(wù),與以往的研究不同,該項工作主要關(guān)注的是非正式文本到正式文本的改寫.首先采用基于規(guī)則的方式處理非正式的文本,得到基于規(guī)則的正式文本,再將非正式的文本和基于規(guī)則的結(jié)果作為GPT2模型的輸入,通過解碼器解碼得到生成結(jié)果.Zhang等[42]認為書寫正式數(shù)據(jù)集的規(guī)模較小,阻礙了書寫糾錯這一文本風格轉(zhuǎn)換任務(wù)的發(fā)展,因此,在Wang等[41]的工作基礎(chǔ)上,提出對現(xiàn)有數(shù)據(jù)集進行數(shù)據(jù)增強,通過多個現(xiàn)有的模型在數(shù)據(jù)增強數(shù)據(jù)集訓練后在多個評價指標上的提升,證明了該數(shù)據(jù)增強手段的有效性,同時在該數(shù)據(jù)集上提出新的方法.

        4 基于非平行數(shù)據(jù)集的文本風格轉(zhuǎn)換方法

        基于非平行數(shù)據(jù)集的文本風格轉(zhuǎn)換方法,主要采用基于無監(jiān)督文本生成方法.整體的研究思路可以分為兩大類.

        第1類研究思路認為句子應(yīng)當包含語義內(nèi)容和文本風格兩部分,文本風格轉(zhuǎn)換任務(wù)實質(zhì)上就是二者分離、重組,即先分離語義內(nèi)容和文本風格,保留句子中的語義內(nèi)容,修改句子的文本風格,再重新組合.如何成功將兩部分完整分離,實現(xiàn)語義內(nèi)容與風格特征的解耦,就成為需要主要解決的問題.沿著語義內(nèi)容與風格特征解耦的研究思路,一些研究人員認為可在提取文本特征時采取一些手段解耦,從而獲取風格獨立的語義內(nèi)容.文本特征分布的空間稱為隱空間,因此,這類方法稱為基于隱空間解耦的方法.另外一些研究者認為可利用句子本身的構(gòu)成特點及人的語言習慣,通過對句子中詞的修改實現(xiàn)內(nèi)容特征與風格特征的解耦.例如,在“這里做的菜很難吃”“這里做的菜很棒”這兩句話中具有相同的語義內(nèi)容,而表達的風格卻是相反的.決定整個句子風格傾向的就是“難吃”和“棒”這2個詞.將決定句子風格傾向的詞匯與句子中剩余部分分離,就能實現(xiàn)內(nèi)容特征與風格特征的分離.因為是通過分割句子實現(xiàn)的解耦,類比隱空間解耦的方法,所以此類方法稱為顯性解耦的方法.

        第2類研究思路認為句子中的內(nèi)容特征和風格特征是相互包含的,無法徹底分離.模型可以在不同風格的數(shù)據(jù)間學習映射關(guān)系,避免對語義與風格解耦,實現(xiàn)文本風格的轉(zhuǎn)換.因此,這類文本風格轉(zhuǎn)換方法稱為基于一步映射的方法.

        4.1 基于隱空間解耦的方法

        在基于隱空間解耦的文本風格轉(zhuǎn)換的工作中,主要解決2個問題:一是如何從文本特征中分離出與風格無關(guān)的內(nèi)容特征,二是如何控制生成句子的風格.在這些工作中,第1個問題的解決方法包括對抗學習、基于機器翻譯模型、隱空間分離等方法;第2個問題的解決方法可分為基于風格屬性碼和基于隱空間分裂的風格控制方法.下面根據(jù)風格控制方法的差異,依次介紹基于隱空間解耦的文本風格轉(zhuǎn)換研究.

        4.1.1 基于風格屬性碼的風格控制方法

        此類方法的實現(xiàn)過程是采用額外的結(jié)構(gòu)化的風格屬性碼控制生成文本的風格.在實現(xiàn)內(nèi)容特征與風格特征解耦后,將風格獨立的內(nèi)容特征的隱空間特征與目標風格的風格屬性碼拼接作為解碼器的輸入,或者采用不同的解碼器生成對應(yīng)風格的句子.

        Fu等[3]采用循環(huán)神經(jīng)網(wǎng)絡(luò)(recurrent neural network,RNN)提取文本特征,將序列到序列模型作為基本模型,引入多任務(wù)框架與對抗學習的思想實現(xiàn)風格與內(nèi)容的解耦.模型結(jié)構(gòu)如圖1所示.在模型訓練過程中,采用迭代的方式逐步實現(xiàn)解耦,增加多層感知機作為風格特征判別器,對文本特征進行分類.如果判別器能正確分類,說明文本特征仍然包含風格信息.為了進一步分離內(nèi)容與風格,可將判別器和特征提取器進行對抗訓練.首先,訓練特征判別器,固定編碼器參數(shù),更新判別器參數(shù);然后,使判別器能夠準確判斷文本特征中是否還包含著風格,再固定判別器參數(shù),更新編碼器,降低判別器分類的準確率,減少文本特征中包含的風格信息.通過重復這2步,文本特征中的風格信息不斷減少,實現(xiàn)內(nèi)容與風格的解耦.在風格的控制方法上,該工作提供了2種思路:方案一為多解碼器模型,采用的是初始化狀態(tài)的方法控制風格,為每個不同的風格都分配了對應(yīng)的解碼器;方案二為風格向量模型通過風格向量進行控制,將目標的風格向量s與內(nèi)容特征組合作為解碼器的輸入,控制生成樣本的風格.

        圖1 多解碼器模型和風格向量模型[4]Fig.1 Multi-decoder model and style-embedding model[4]

        Prabhumoye等[4]提出借助神經(jīng)機器翻譯模型得到與風格無關(guān)的內(nèi)容向量,模型結(jié)構(gòu)如圖2所示.在模型訓練前,先在具有中性風格的翻譯語料中訓練英譯法和法譯英神經(jīng)機器翻譯模型;將源風格的句子(英語)通過預訓練的英譯法模型翻譯成法語的句子作為法譯英的模型的輸入,通過法譯英模型提取文本特征作為風格獨立的內(nèi)容特征.作者認為2個翻譯模型是在中性風格語料中訓練的,可以減少2種風格語料對模型的影響,從而學習到與風格無關(guān)的內(nèi)容特征.因此,通過法譯英模型提取的文本特征就是風格獨立的內(nèi)容特征.在風格的控制上,采用了初始化狀態(tài)的方法,通過對應(yīng)風格的解碼器控制目標風格樣本的生成.

        圖2 基于機器翻譯解耦的文本風格轉(zhuǎn)換模型Fig.2 Text style transfer model based on machine translation disentangle

        Dai等[6]的模型結(jié)構(gòu)如圖3所示.這項工作的思想源于圖像風格轉(zhuǎn)換Cycle-GAN[2],將轉(zhuǎn)換風格后的樣本重新轉(zhuǎn)換為原來的風格,計算與原有樣本的差異,從而保證轉(zhuǎn)換過程中信息沒有丟失.該模型的訓練分為2步:1)對文本建模,學習提取文本特征.與一般的自編碼器不同,將文本特征與隨機初始化的風格向量拼接作為解碼器的輸入,計算重構(gòu)損失Lself;2)控制風格實現(xiàn)風格轉(zhuǎn)換.采用2個損失函數(shù)Lstyle、Lcycle控制句子風格的轉(zhuǎn)換和轉(zhuǎn)換過程中內(nèi)容的保留.在訓練中,將文本特征與目標風格向量拼接生成目標風格的句子,再利用判別器判斷生成樣本的風格,計算判別風格與實際的目標風格之間的差異Lstyle,引導生成文本的風格向目標風格靠近.為了保證轉(zhuǎn)換過程中語義信息不丟失,將生成的文本與原有的風格向量結(jié)合重新生成原有的句子,計算重新生成的句子與輸入句子的差異Lcycle.另外,還采用Transformer代替原有的RNN作為編解碼器,有效地提升了文本風格轉(zhuǎn)換的生成質(zhì)量.

        圖3 Style Transformer模型Fig.3 Style Transformer model

        4.1.2 基于隱空間分裂的風格控制方法

        此類方法認為同一風格的數(shù)據(jù)集具有相同的風格特征,可對相同風格的句子提取統(tǒng)一風格特征,將文本特征的隱空間表示分裂,一部分代表風格獨立的內(nèi)容特征,另一部分代表風格特征.然后,再通過對風格特征的替換和文本特征的重組,控制文本生成的風格.

        John等[7]對隱空間解耦做了進一步的改進和提升,提出了Disentangled模型.將內(nèi)容特征與風格特征視為2個獨立的隱空間分布,并將文本特征投影到2個隱空間,分別代表內(nèi)容特征和風格特征.模型結(jié)構(gòu)如圖4所示.

        圖4 Disentangled模型Fig.4 Disentangled model

        在訓練階段,將文本特征分別投影到不同的隱空間中,得到風格特征s和內(nèi)容特征c.然后,為了保證2個隱空間相互獨立,設(shè)計2個判別器用于計算某個隱空間特征中包含的風格信息和內(nèi)容信息.針對內(nèi)容隱空間特征,最小化內(nèi)容損失Jmul(c),最大化風格損失Jdis(s).針對風格隱空間,最小化風格損失Jdis(c),最大化內(nèi)容損失Jmul(s),促使風格空間中包含更多的風格信息和更少的內(nèi)容信息.另外,計算隱空間內(nèi)容損失采用的是詞袋損失[43]的方法.將輸入句子去除停用詞和風格詞,得到詞袋特征,將詞袋特征當作標簽,再基于隱空間特征預測詞袋特征.如果隱空間包含的內(nèi)容信息足夠多,就能完整地預測出文本的詞袋特征,同時去除輸入文本的停用詞和情感詞也保證了得到的詞袋特征沒有包含風格信息.計算隱空間內(nèi)容損失的方法與Fu等[3]的工作類似,在此就不做贅述.

        在推理階段,需要用目標風格的特征代替原有風格的特征,模型采用對大量相同風格句子的風格特征求和取平均的方法,作為該種風格的特征表示,替換原有風格特征,控制生成句子的風格.

        4.2 基于顯性解耦的方法

        在基于顯性解耦的研究工作中研究者將決定句子整體風格的詞匯稱作風格標記,通過改變句子中的風格標記實現(xiàn)句子的風格轉(zhuǎn)換.

        顯性解耦的方法可以分為3步:第1步,刪除風格標記,對數(shù)據(jù)進行預處理,通過刪除句子中原有風格的標記獲取風格獨立語義內(nèi)容的文本表示.第2步,檢索目標風格的風格標記,用于替換原有風格標記.第3步,生成目標風格句子,將第2步檢索到的目標風格標記填入原有風格標記的位置.

        4.2.1 刪除原有風格標記

        Li等[8]提出一種簡單易行的方法以找到句子中的風格標記.在數(shù)據(jù)集中,計算每個詞在2種風格數(shù)據(jù)集中出現(xiàn)的次數(shù),其中風格標記與剩余詞在不同數(shù)據(jù)集中出現(xiàn)的頻率存在顯著的差異,再根據(jù)這一差異區(qū)分出風格標記與剩余詞.具體公式為

        (1)

        式中:Count()代表詞u在數(shù)據(jù)集Dv中出現(xiàn)的次數(shù);λ代表平滑稀疏,保證數(shù)據(jù)集Dv中沒有出現(xiàn)的詞也能分配一定的權(quán)重;s(u,v)代表詞u在數(shù)據(jù)集Dv中對于風格v的貢獻度,當s(u,v)大于某個閾值時,將詞u作為風格v的風格標記.

        采用自注意力機制的風格分類器,為文本中的每個詞分配權(quán)重,權(quán)重越高的詞對句子的風格貢獻度越大,將文本風格貢獻度高的詞作為風格標記,公式為

        a=Softmax(w·tanh(WHT))

        (2)

        r=a·H

        (3)

        y=Softmax(W′·r)

        (4)

        先為句子中的每個詞分配權(quán)重a,由每一時間步的隱狀態(tài)通過全連接和Softmax得到;再將權(quán)重與每一時間步的隱狀態(tài)相乘,得到加權(quán)后的隱狀態(tài)c;最后,通過Softmax得到句子每個詞匯的貢獻度,即句子的風格概率分布.將所有權(quán)重大于閾值的詞作為風格標記,其中將閾值設(shè)定為平均權(quán)重.Xu等[9]還將上述的2種方法融合,將詞頻與自注意力詞權(quán)重相乘,更精確地找到句子中的風格標記.另外,Wu等[10]認為長短期記憶(long short-term memory,LSTM)網(wǎng)絡(luò)模型不夠魯棒,提取特征效果有待提高,并用實驗證明刪除風格標記過程中會刪掉一些重要的上下文或遺漏一些風格標記.因此,提出采用Transformer[44]選擇刪除對象,結(jié)果顯示能夠更準確地識別句子中風格標記.

        Sudhakar等[11]提出一個判斷方法,公式為

        px=pθc(s|x)

        (5)

        px,ti=pθc(s|x,ti)

        (6)

        (7)

        先通過預訓練好的風格分類器(基于自注意力機制的分類器)計算句子x的風格s的概率px.再計算去掉詞ti后文本的風格概率px,ti,將2個風格概率的差Sti作為刪除詞ti的風格重要性.之后按照重要性從大到小的順序依次刪除k個詞匯得到剩余文本的風格概率pxk,ti,計算k個詞對句子風格的影響,直到整個文本的風格概率小于閾值α.最后,將刪除的k個詞作為該文本的句子.為了避免無法完整刪除風格標記情況的出現(xiàn),設(shè)定了刪除的風格標記應(yīng)當大于閾值β,并詳細論證了2個閾值的大小對刪除風格標記的影響.

        4.2.2 尋找目標風格標記

        在刪除輸入文本中原有風格標記后,需要在另一種風格的數(shù)據(jù)集中尋找能夠與之相對應(yīng)的目標風格標記.在此處將去除原有風格標記的剩余部分稱為模板,一種常用的尋找目標風格標記的方法是用原有的風格數(shù)據(jù)集中的模板匹配目標風格數(shù)據(jù)集中的模板.如果目標風格數(shù)據(jù)集中有一些模板與處理后的模板的語義相似度高,二者對應(yīng)風格標記也應(yīng)是相互對應(yīng)的.為了將模板與目標風格數(shù)據(jù)集中其相似的模板匹配,一般都是通過句子向量的余弦相似度來尋找.常用的計算句子向量的方式包括基于詞頻的TF-IDF,以及采用預訓練詞向量的GloVe[45],通過對句子中所有詞的詞向量求和取平均后,得到句子向量.

        4.2.3 生成目標風格句子

        生成目標風格句子的方法大致可以分為2類:一類是直接將檢索到的目標風格模板對應(yīng)的風格標記填入原有目標風格的位置;另一類是采用編解碼器作為生成模型,以原有模板和檢索到的目標風格標記作為輸入,生成目標風格句子.

        Li等[8]提出4種策略生成目標風格句,按照生成方式的不同可以分為 “基于模板”“僅檢索”“僅刪除”“刪除與檢索”,如圖5所示.前2種方法屬于第1類生成方法,其中“基于模板”方法是將目標風格標記c(xt,vt)替換輸入文本中的原有風格標記vs;“僅檢索”方法是將對立風格數(shù)據(jù)集中模板間相似度最高的句子xt直接作為輸出結(jié)果.后2種方法屬于第2類生成方法.“僅刪除”方法是直接將原有模板c(x,vs)作為編解碼器的輸入,生成目標風格句子;“刪除與檢索”方法是在目標風格數(shù)據(jù)集中找到模板間相似度最高的模板,將匹配到模板的目標風格標記c(xt,vt)與原有模板c(x,vs)組合作為編解碼輸入,生成目標風格句子.

        圖5 4種文本風格轉(zhuǎn)換方法[8]Fig.5 Four methods in text style transfer[8]

        Wu等[10]借助預訓練語言模型Bert,結(jié)合Bert的預訓練任務(wù)掩蓋式語言模型(mask language model,MLM),將原有風格標記視為需要掩蓋的詞,目標風格標記視為需要預測的詞.以Bert作為基礎(chǔ)模型,借助預訓練語言模型中的知識,將檢索與填充融合成一步,提升了文本風格轉(zhuǎn)換的質(zhì)量.

        4.3 基于一步映射的方法

        基于一步映射的方法指的是采用端到端的生成方法,將文本特征視為一個整體,避免對文本中風格與內(nèi)容特征的分離.通過學習不同風格句子之間存在的映射關(guān)系,實現(xiàn)風格轉(zhuǎn)換.具體實現(xiàn)可以分為3種方式:基于機器翻譯、基于強化學習和基于隱空間編輯的生成方法.

        4.3.1 基于機器翻譯的方法

        Zhang等[12]受到無監(jiān)督機器翻譯研究的啟發(fā),將基于非平行語料數(shù)據(jù)集的文本風格轉(zhuǎn)換任務(wù)視為無監(jiān)督的機器翻譯.采用迭代回譯的方式提升翻譯質(zhì)量,先構(gòu)建偽平行語料,作為迭代回譯的初始輸入.通過計算詞向量的余弦相似度學習不同風格詞之間的對應(yīng)關(guān)系,建立對應(yīng)詞表.按照詞表替換原文本中的詞,得到偽平行語料.構(gòu)建完成的偽平行語料作為平行語料,由模型再生成另一種風格的句子,再將回譯生成的結(jié)果作為第2輪模型的輸入.在回譯過程中通過語言模型與分類器引導迭代回譯,在迭代中不斷提升風格轉(zhuǎn)換質(zhì)量.

        Jin等[13]同樣采用迭代回譯的方法,區(qū)別在于該模型通過檢索構(gòu)建偽平行語料.在計算不同風格數(shù)據(jù)集間文本的語義相似度后,將超過某個預先設(shè)定閾值的句子與原有文本構(gòu)成偽平行語料對.在迭代回譯的過程中,比較該輪生成的結(jié)果與檢索結(jié)果和源句之間的詞移距離(word mover’s distance,WWD)[46],將距離更近的句子作為下一輪的偽平行語料,避免在迭代回譯過程中出現(xiàn)模型崩潰的情況.

        4.3.2 基于強化學習的方法

        Luo等[14]認為在沒有并行數(shù)據(jù)的情況下解耦很難分離句子的內(nèi)容與風格,并提出了一個雙向強化學習框架(如圖6所示),將2種風格間文本相互轉(zhuǎn)換的過程視為一種雙向映射的學習任務(wù).針對文本的風格轉(zhuǎn)換和文本內(nèi)容保持設(shè)計2個獎勵函數(shù),由得分引導模型學習風格間的映射.同時,參考迭代回譯的思想,提出偽退火教師教學算法,每次將上一輪的生成結(jié)果作為偽平行語料,再借助偽平行語料進行下一輪的訓練,迭代提升模型的生成質(zhì)量.在2個基準數(shù)據(jù)集的實驗?zāi)P椭腥〉昧撕芎玫男Ч?

        圖6 基于雙向強化學習約束的文本風格轉(zhuǎn)換模型訓練流程[14]Fig.6 Training process of text style transfer model based on two-way reinforcement learning constraints[14]

        4.3.3 基于隱空間編輯的方法

        Liu等[15]認為可以在隱空間中直接學習不同風格文本隱空間特征存在的映射關(guān)系,編輯隱空間特征,實現(xiàn)風格轉(zhuǎn)換.其創(chuàng)新點在于可以直接利用分類器的梯度回傳影響隱空間特征.通過迭代的方式不斷修改隱空間特征,直到分類器能將轉(zhuǎn)換后的特征識別成目標風格,從而學習到隱空間中不同風格的分布間的映射.為了限制隱空間編輯的迭代過程中的參數(shù)的更新幅度,在損失函數(shù)中增加正則項,避免由于更新幅度過大導致的信息丟失.

        4.4 各類研究工作的比較與分析

        在表2中列舉了各類風格轉(zhuǎn)換的研究工作在Yelp數(shù)據(jù)集上的實驗結(jié)果,其中參考-BLEU指的是計算生成結(jié)果與預設(shè)的參考結(jié)果的相似度(BLEU是一種衡量生成樣本質(zhì)量的評價標準,會在5.1.2節(jié)詳細介紹),輸入-BLEU指的是計算生成樣本與輸入數(shù)據(jù)間的相似度,這2項指標用于衡量生成樣本中內(nèi)容的保留度.準確率指的是生成樣本中具有指定風格的比例,由訓練好的分類器對生成樣本打分,衡量風格轉(zhuǎn)換的成功率.

        由表2可得到一些結(jié)論:第一,對實驗結(jié)果分析后可推斷模型的準確率與原文-BLEU值存在負相關(guān),即包含原有內(nèi)容越多越容易被判斷為原風格.這意味著這些模型在訓練時可能會采取犧牲一個指標來換取另一個指標的提升的策略,需要在模型訓練的時候加以平衡.第二,無論是按照哪一種研究思路的工作,當前最優(yōu)的實驗結(jié)果差別不大,但不同的研究思路在各個指標上的表現(xiàn)有所不同.隱空間解耦在訓練過程中會采用重構(gòu)損失來減少風格轉(zhuǎn)換過程中內(nèi)容的損失,此類生成方式可比較自然地完成文本風格轉(zhuǎn)換,在參考-BLEU指標上表現(xiàn)出較大優(yōu)勢.顯性解耦中的一些風格轉(zhuǎn)換方法是通過修改或添加風格詞匯實現(xiàn)的,在風格的轉(zhuǎn)換上能表現(xiàn)出較高成功率,如果原文與參考結(jié)果差異過大,可能會導致參考-BLEU得分較低.基于一步映射的風格轉(zhuǎn)換方法是通過迭代訓練實現(xiàn)的,在保證語義內(nèi)容不丟失的情況下不斷向目標風格靠近,因此,此類工作在2個指標上表現(xiàn)比較均衡.第三,Transformer模型的加入能夠有效地提升生成樣本的質(zhì)量,尤其是在Wu等[10]中引入了基于Transformer的預訓練語言模型,借助豐富的語言知識,在不同指標上都有所提升.

        表2 文本風格轉(zhuǎn)換在Yelp數(shù)據(jù)集上的實驗結(jié)果Table 2 Experimental results of text style transfer on Yelp dataset

        在模型的可解釋性上,基于隱空間解耦和基于一步映射的方法模型存在可解釋性較差、不易訓練、訓練過程不可控制等問題,而基于顯性解耦的方法模型具有可解釋性好,容易調(diào)優(yōu)、調(diào)試和改進的優(yōu)點.

        在模型時空復雜度的比較上,3種方法如果采用同種編解碼器,空間復雜度是一樣的.在時間復雜度的比較中,因為基于一步映射的方法需要大量的迭代訓練,所以該方法的時間復雜度高于基于隱空間解耦的方法.基于顯性解耦的方法需要對數(shù)據(jù)進行預處理,該方法的時間復雜度高于基于隱空間解耦的方法.另外,決定模型的時空復雜度的另一個重要因素是編解碼器采用何種模型.采用Transformer模型會帶來更大的參數(shù)量,同時,會大幅增加模型的訓練時間.

        在文本風格轉(zhuǎn)換任務(wù)中存在各種類型的數(shù)據(jù)集,一些句子的風格可能是由句子整體決定的.此類數(shù)據(jù)集難以分離句子中的內(nèi)容特征與風格特征,可以采用基于一步映射的方法.對于一些句子結(jié)構(gòu)比較簡單的數(shù)據(jù)集,基于隱空間解耦和基于顯性解耦的方法都可以應(yīng)用在這些數(shù)據(jù)集中.

        5 評價指標

        評價文本風格轉(zhuǎn)換生成質(zhì)量的方法通常分為人工評價和自動評價2種,均是從生成文本的風格轉(zhuǎn)換準確率、內(nèi)容的保留度以及文本的流利度3個方面進行評價.這一觀點得到了廣泛的認可[47-48].

        5.1 自動評價指標

        5.1.1 風格轉(zhuǎn)換準確率

        風格轉(zhuǎn)換準確率是評價風格轉(zhuǎn)換模型的一個重要指標,它是指在所有的生成文本中,風格轉(zhuǎn)換成功的句子所占的比例.準確率越高代表模型的風格轉(zhuǎn)換效果越好.一般采用的方法是用預訓練的文本分類器對生成的句子進行分類.在實際應(yīng)用中,研究者則會采用不同的模型作為分類器.Shen等[5]使用TextCNN[49]模型作為分類器,測試表明,在數(shù)據(jù)集中進行預訓練可以獲得90%以上的分類精度.

        5.1.2 內(nèi)容的保留度

        隨著對生成句子進一步分析,研究者發(fā)現(xiàn)即使生成的句子在風格轉(zhuǎn)換準確率這一指標上得分較高,轉(zhuǎn)移風格后的句子內(nèi)容與輸入句子的內(nèi)容并不相關(guān),文本風格轉(zhuǎn)換也是失敗的.對于保存程度的測量,研究者們提出了很多方法,其中BLEU[50]是使用最廣泛的方法.BLEU是評估輸出句子與參考句子之間字或詞重疊程度的指標,代表了2個句子的相似程度,BLEU分數(shù)越高,表示2條文本越相似,代表模型內(nèi)容保存得越好.此外,還有一種基于詞嵌入的度量方式,通過Word2Vector[51]或GloVe[45]獲得風格轉(zhuǎn)換前后句子的向量表示,將向量表示之間的余弦相似度作為內(nèi)容保留度的評價標準.在Bert[18]模型被提出后,一些研究者提出可以采用語境化的詞嵌入代替靜態(tài)的詞嵌入,并采用Bert模型對內(nèi)容的保留度打分,可以獲得更準確的評價標準,即BertScore[26].

        5.1.3 流利度

        僅從風格轉(zhuǎn)換準確度和內(nèi)容給出的保留度評價,仍然無法保證生成的句子足夠好.如果生成的句子完全不符合人類的閱讀習慣,風格轉(zhuǎn)換模型還是失敗的.因此,判斷句子是否流暢也很有必要.Mir等[47]在真實句子和風格轉(zhuǎn)換句子樣本上訓練了一個基于單字的神經(jīng)邏輯回歸分類器,判斷生成的句子是真實的還是模型生成的.最后,計算通過分類器的句子數(shù)占所有轉(zhuǎn)換生成句子的比例,并給出流暢度分數(shù).另外,采用困惑度來衡量生成句子的流利度也是一種評價流利度的方法.一般采用預訓練的語言模型對句子打分,越符合人類閱讀習慣的困惑度越低.

        5.1.4 自動評價指標存在的缺點與改進

        上述3種方法均在單個維度評價模型的生成質(zhì)量,無法從多個維度反映整體模型的質(zhì)量,因此,可以聯(lián)合多種評價方法來評價模型.比如:計算準確率和BLEU的幾何平均值和諧波平均值,對模型的綜合能力打分.

        除此之外,在以困惑度作為評價流利度的指標時,可能會遇到生成樣本中存在一些比較罕見的單詞,導致作為評價指標的困惑度升高,錯誤地評價模型.除了采用人工評價作為補充,目前沒有更好的解決辦法.

        5.2 人工評價

        自動評價的結(jié)果可以快速地提供模型的評價指標,但是自動評價無法提供模型進一步訓練的修正意見,無法直觀地反映風格轉(zhuǎn)換過程中出現(xiàn)的問題.人工評價可以彌補這一缺陷,人工分析生成樣本可為模型訓練提供更多意見.關(guān)于人工評價,研究人員需要先找到一些具有語言背景的工作人員評價模型.一般來說,研究人員會找到3~6個人對每個句子進行打分.使用Stent等[52]提出的1~5利克特量表對句子的3個指標進行打分.評估過程需要對樣本充分打亂順序,從中取出足夠的樣本,同時,保證每個評估者無法知道句子的來源.

        6 展望

        風格轉(zhuǎn)換的任務(wù)實質(zhì)上是改寫句子的風格.從狹義上講,風格轉(zhuǎn)換的任務(wù)是二值屬性間的風格轉(zhuǎn)換,比如:積極到消極、書面語言與非書面語言.從廣義上講,風格轉(zhuǎn)換可以包括多個風格之間的轉(zhuǎn)換[53],以及文章與文章主題間的轉(zhuǎn)換[54],或者細粒度上的風格轉(zhuǎn)換[55].除此之外,目前大多數(shù)的工作都是基于單句的文本風格轉(zhuǎn)換.在實際應(yīng)用中,句子通常還有上下文,轉(zhuǎn)換單句的時候需要考慮上下文才能實現(xiàn)更自然的風格轉(zhuǎn)換樣本.Cheng等[33]提出基于上下文內(nèi)容一致性的文本風格轉(zhuǎn)換任務(wù).

        隨著大規(guī)模預訓練語言模型的發(fā)展,預訓練模型在許多下游任務(wù)中顯示出優(yōu)越性[18],將預訓練語言模型應(yīng)用到風格轉(zhuǎn)換任務(wù)中,可能會推動風格轉(zhuǎn)換任務(wù)的發(fā)展.

        本文基于當前文本風格轉(zhuǎn)換任務(wù)的發(fā)展現(xiàn)狀總結(jié)出以下3個方面的挑戰(zhàn).

        6.1 更復雜的風格轉(zhuǎn)換任務(wù)

        在自然語言處理的實際應(yīng)用中,二元屬性的風格轉(zhuǎn)換不能滿足所有實際應(yīng)用場景的需要.因此,研究者提出一些更復雜的文本風格轉(zhuǎn)換任務(wù).第1類,多風格間的轉(zhuǎn)換任務(wù).Helbig等[53]將句子中的情感屬性作為一種風格,提出一種端到端的基于詞典替換的六分類情感轉(zhuǎn)換模型.模型分為2部分:一部分負責找到需要替換的詞,另一部分負責填詞,保證新的句子包含目標情感.另外,增加了打分模塊,對多個生成結(jié)果從情感風格、內(nèi)容保留以及流利度這三方面打分,將得分最高的句子作為最后的結(jié)果.從模型的實驗結(jié)果上看,只能處理一些簡單的句子,主要目的是將二元的文本風格轉(zhuǎn)換任務(wù)擴展到多元.第2類,將不同的文體作為風格.Yang等[54]提出在摘要和文章這2種文體之間實現(xiàn)風格轉(zhuǎn)換.與一般的文本風格轉(zhuǎn)換任務(wù)不同,文本風格是由整段文字決定的.為了彌補不同風格間數(shù)據(jù)的差異,補充上下文信息,該研究還引入了一個外部數(shù)據(jù)庫,實現(xiàn)了在摘要和正文間的轉(zhuǎn)換.第3類,Luo等[55]提出一種細粒度的風格轉(zhuǎn)換模型,在傳統(tǒng)粗粒度(正向或負向風格)的基礎(chǔ)上,增加細粒度的控制,可以控制風格表達的程度,表達更細膩的風格.

        6.2 基于上下文一致性的文本風格轉(zhuǎn)換

        以前風格轉(zhuǎn)換任務(wù)的工作主要研究對象是單句之間的風格轉(zhuǎn)換,沒有考慮句子在風格轉(zhuǎn)換后對上下文的影響.因此,Cheng等[33]提出一個新的文本風格轉(zhuǎn)換任務(wù),即基于上下文的文本風格轉(zhuǎn)換任務(wù).將上下文也作為控制樣本生成的條件,在單句風格轉(zhuǎn)換的基礎(chǔ)上,保持上下文的一致性.在該研究中,模型將上下文與原句信息共同作為編解碼器的輸入,另外,增加了判斷生成樣本是否與上下文一致的分類器,引導模型生成樣本.

        6.3 預訓練語言模型

        預訓練語言模型已經(jīng)證明了它們在各種自然語言處理任務(wù)中的能力,包括機器翻譯、文本分類、命名實體識別.特別是GPT2[40]在自然語言生成方面取得了顯著的成功.如果將預訓練模型所學知識應(yīng)用于語體遷移任務(wù)中,能有效地提高遷移句子的質(zhì)量,同時保證風格轉(zhuǎn)換句子的流暢性.

        猜你喜歡
        平行文本內(nèi)容
        內(nèi)容回顧溫故知新
        科學大眾(2022年11期)2022-06-21 09:20:52
        向量的平行與垂直
        平行
        逃離平行世界
        在808DA上文本顯示的改善
        基于doc2vec和TF-IDF的相似文本識別
        電子制作(2018年18期)2018-11-14 01:48:06
        主要內(nèi)容
        臺聲(2016年2期)2016-09-16 01:06:53
        再頂平行進口
        汽車觀察(2016年3期)2016-02-28 13:16:36
        文本之中·文本之外·文本之上——童話故事《坐井觀天》的教學隱喻
        如何快速走進文本
        語文知識(2014年1期)2014-02-28 21:59:13
        波霸影院一区二区| 国产在线av一区二区| 国产91精品在线观看| 国产精品无码素人福利| 成人性生交大片免费看96| 日韩少妇激情一区二区| 国产欧美日韩专区| 2021精品综合久久久久| 国产一区二区三区日韩精品| 高清国产国产精品三级国产av| 国产成人无码a在线观看不卡| 肉体裸交137日本大胆摄影| 无码中文字幕加勒比一本二本| av深夜福利在线| 少妇极品熟妇人妻高清| 国产一区二区黑丝美胸| 免费国产黄网站在线观看视频| 国产无遮挡裸体免费视频 | 蓝蓝的天空,白白的云| 亚洲午夜成人精品无码色欲 | 国产香蕉97碰碰视频va碰碰看| 久久久久久免费播放一级毛片| 日本大片在线一区二区三区| 好大好爽我要高潮在线观看| 美女脱了内裤张开腿让男人桶网站| 国产99久久久久久免费看| 91在线在线啪永久地址| 久久久久国产精品四虎| 亚洲永久精品日韩成人av| 精品国产一区二区三区av| 人妻 色综合网站| 最新四色米奇影视777在线看| 中文字幕日产人妻久久| 日韩av中文字幕波多野九色 | 中文字幕乱码亚洲一区二区三区| 亚洲人成网站18禁止| 伊人久久久精品区aaa片| 无码中文字幕加勒比一本二本| 青青草久热手机在线视频观看| 国产一区二区三区亚洲| 精品福利一区二区三区免费视频|