亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于HMM算法的英語形音匹配可視分析

        2021-08-12 08:32:56
        關(guān)鍵詞:音素視圖發(fā)音

        段 青 青

        (中國石油大學(xué)(華東)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院 山東 青島 266500)

        0 引 言

        英語作為一種信息交流的載體,在國家之間的交流學(xué)習(xí)中具有非常重要的作用,為了更好適應(yīng)時(shí)代的發(fā)展需求,提高自身英語水平,快速掌握發(fā)音規(guī)則成為高效學(xué)習(xí)英語的一個(gè)突破口[1]。然而英語中吸收了大量的外族語言,并以大膽的觀念與靈活的方式借用或創(chuàng)造新詞,導(dǎo)致英語發(fā)音規(guī)則出現(xiàn)多樣性和混沌性的特征,復(fù)雜的發(fā)音模式成為英語學(xué)習(xí)者學(xué)習(xí)英語的一大障礙。

        針對(duì)上述問題,多位學(xué)者進(jìn)行了相關(guān)研究:Chiappe等[2]研究發(fā)現(xiàn)形音匹配(Grapheme-phoneme correspondence)在英語學(xué)習(xí)中可起到積極作用,所謂形音匹配,它的核心是字素-音素轉(zhuǎn)換(Grapheme-to-phoneme, G2P)過程,相對(duì)于其他學(xué)習(xí)方式,其在閱讀和拼讀陌生單詞方面表現(xiàn)出更大的優(yōu)勢;Hanna等[3]統(tǒng)計(jì)了10 000個(gè)高頻單詞的字素-音素特征,并根據(jù)特征重復(fù)概率為單詞列表建立難度指數(shù),通過直接向?qū)W習(xí)者提供形音匹配模式和難度指數(shù)來指導(dǎo)其對(duì)單詞的拼讀學(xué)習(xí)。近年來,隨著計(jì)算機(jī)自然語言處理技術(shù)的發(fā)展,形音匹配模式的量化統(tǒng)計(jì)早已通過計(jì)算機(jī)實(shí)現(xiàn)。G2P技術(shù)在機(jī)器音譯[4]和文字發(fā)音預(yù)測中表現(xiàn)出極大優(yōu)勢,從而得以廣泛應(yīng)用。例如:百度基于G2P研發(fā)的文本語音轉(zhuǎn)換(Test To Speech, TTS)系統(tǒng)Deep Voice[5],相比于傳統(tǒng)的多級(jí)處理模式,具有處理速度快、音素預(yù)測準(zhǔn)確、音域適應(yīng)性強(qiáng)等優(yōu)點(diǎn)。文獻(xiàn)[5]研究表明由于字素和音素的基數(shù)相對(duì)較小,在發(fā)音預(yù)測工作中,具有對(duì)齊信息的雙向神經(jīng)網(wǎng)絡(luò)模型對(duì)G2P有更好的適應(yīng)性,該模型的發(fā)音預(yù)測準(zhǔn)確率高達(dá)94%,較傳統(tǒng)方式有所提升。

        前人研究表明了形音匹配規(guī)則和字素-音素轉(zhuǎn)換不僅適用于英文學(xué)習(xí)者的拼讀學(xué)習(xí),而且適用于機(jī)器的文字發(fā)音預(yù)測。然而其中多數(shù)研究為單純的數(shù)據(jù)量化,復(fù)雜的統(tǒng)計(jì)信息不僅不利于學(xué)習(xí)者的記憶,反而易使其失去學(xué)習(xí)興趣。

        針對(duì)上述問題,本文結(jié)合英語學(xué)習(xí)與發(fā)音預(yù)測兩個(gè)領(lǐng)域的研究成果,以形音匹配為中心,選取字素和音素作為共享單元[6]進(jìn)行探究,使用隱馬爾可夫算法模型對(duì)單詞的形音匹配與發(fā)音模式進(jìn)行分析,探究字素發(fā)音受窗口長度與方向影響的影響程度。除此之外,針對(duì)傳統(tǒng)研究方法中量化數(shù)字復(fù)雜、理解性差等缺陷,如圖1所示,本文采用可視化圖形界面以直觀、形象、可交互的方式將量化數(shù)據(jù)呈現(xiàn)給用戶,在激發(fā)學(xué)習(xí)者探究興趣的同時(shí),幫助其快速、形象地理解字素-音素模式,從而有效地提高學(xué)習(xí)者的英語能力。

        圖1 系統(tǒng)主界面

        本文主要工作如下:

        (1) 提出一種基于時(shí)序與模式的可視分析方法,探索了窗口大小和方向?qū)Σ煌炙匕l(fā)音穩(wěn)定性的影響。

        (2) 根據(jù)模式對(duì)字素進(jìn)行聚類。相似的上下文模式在表示空間中具有更近距離,模式相似的字素會(huì)成簇出現(xiàn)。

        (3) 統(tǒng)計(jì)單個(gè)字素在不同模式下的發(fā)音數(shù)量,探究字素對(duì)應(yīng)發(fā)音受不同位置字素的影響情況,分析字素結(jié)合發(fā)音的穩(wěn)定性。

        (4) 統(tǒng)計(jì)單個(gè)或多個(gè)字素在不同模式下的發(fā)音數(shù)量,比較多個(gè)字素之間在不同模式下的發(fā)音穩(wěn)定性與共有模式數(shù)量。探究其準(zhǔn)確率對(duì)字素在形音匹配模式上的相近關(guān)系。

        1 相關(guān)工作

        1.1 英語發(fā)音

        神經(jīng)網(wǎng)絡(luò)技術(shù)已經(jīng)逐漸應(yīng)用到多個(gè)領(lǐng)域,在語音識(shí)別技術(shù)方面也表現(xiàn)出比較大的優(yōu)勢。神經(jīng)網(wǎng)絡(luò)技術(shù)主要模擬了人類的神經(jīng)元活動(dòng)原理,將人類所特有的自主學(xué)習(xí)、想象能力綜合到英語語音識(shí)別中,為語音識(shí)別開辟了一道新的途徑。自主學(xué)習(xí)需要人為給予智能系統(tǒng)一個(gè)固定的規(guī)則,使其通過學(xué)習(xí)后對(duì)輸入的信息根據(jù)規(guī)則進(jìn)行改造,從而輸出人類想要的結(jié)果[7]。例如,基于TensorFlow的循環(huán)神經(jīng)網(wǎng)絡(luò)構(gòu)建的發(fā)音預(yù)測系統(tǒng)、基于Keras 開發(fā)的英語單詞發(fā)音預(yù)測LSTM模型均能通過端到端的訓(xùn)練得到更為準(zhǔn)確的結(jié)果。

        目前較為成熟的智能系統(tǒng)多以形音匹配關(guān)系為核心,借助字素-音素的轉(zhuǎn)換模式可進(jìn)行文字發(fā)音預(yù)測、文本語音轉(zhuǎn)換等工作。Deep Voice系統(tǒng)就是利用字素和音素之間的匹配模式加快了深度神經(jīng)網(wǎng)絡(luò)的訓(xùn)練速度,解決了TTS系統(tǒng)開發(fā)耗費(fèi)大量人力與時(shí)間的問題,也滿足了系統(tǒng)應(yīng)用的實(shí)時(shí)性要求。該系統(tǒng)的核心是使用連接時(shí)序分類器分割音素邊界,將文本轉(zhuǎn)換為音素序列后對(duì)序列進(jìn)行重音、持續(xù)時(shí)間和基頻的標(biāo)注。這些音素的標(biāo)注信息更加貼近人類對(duì)語言的表達(dá)機(jī)制,因此形音匹配法更加適用于解決語音合成、語音識(shí)別和翻譯問題[8]。

        然而,目前而言,神經(jīng)網(wǎng)絡(luò)模型蘊(yùn)含的量化數(shù)據(jù)較為復(fù)雜,難以深入理解,而英語學(xué)習(xí)者則希望知道模型究竟從數(shù)據(jù)中學(xué)到何種知識(shí),從而產(chǎn)生最終的決策。因此,本文將采用可解釋、易于接受的可視化交互方法對(duì)英語的發(fā)音模式進(jìn)行展示。

        1.2 可視化分析

        盡管前人已經(jīng)在形音匹配模式上做了許多研究,但發(fā)音模式的數(shù)據(jù)可視化分析研究相對(duì)較少。研究表明人類從外界獲得的信息中80%以上都來自于視覺系統(tǒng)[9],且數(shù)據(jù)正在變得無處不在、觸手可及,但數(shù)據(jù)創(chuàng)造的真正價(jià)值在于能否進(jìn)一步提供數(shù)據(jù)分析[10]。

        可視化在數(shù)據(jù)分析和信息理解中具有重要作用,數(shù)據(jù)可視化也早已應(yīng)用到人類社會(huì)活動(dòng)中,如約翰·斯諾制作的倫敦霍亂地圖、拿破侖進(jìn)攻俄羅斯軍事分析圖、衛(wèi)報(bào)數(shù)據(jù)中的世界煙草地圖集,以及《衛(wèi)報(bào)》制作的伊拉克戰(zhàn)爭報(bào)道等,均使用可視化對(duì)數(shù)據(jù)進(jìn)行展示。數(shù)據(jù)可視化一方面可更加準(zhǔn)確地對(duì)信息進(jìn)行梳理,讓受眾易獲得信息;另一方面通過圖表的表現(xiàn)形式,幫助受眾獲取文本無法直觀獲取到的信息[11]。

        隨著計(jì)算機(jī)運(yùn)算能力的提升,數(shù)據(jù)分析的效率大大提高,但是數(shù)據(jù)分析仍離不開機(jī)器和人的相互協(xié)作與優(yōu)勢互補(bǔ)。在分析數(shù)據(jù)時(shí)要以人作為需求主體,得出符合人類的認(rèn)知規(guī)律的方法,需將形象的可視分析與認(rèn)知抽象的機(jī)器分析相結(jié)合,幫助受眾洞悉數(shù)據(jù)背后隱藏的信息并轉(zhuǎn)化為可運(yùn)用的知識(shí)[12-13]。目前,綜合認(rèn)知理論、科學(xué)、信息可視化及人機(jī)交互技術(shù)的數(shù)據(jù)挖掘技術(shù)被廣泛用于數(shù)據(jù)分析領(lǐng)域。

        綜上所述,符合人類的認(rèn)知習(xí)慣的分析和表現(xiàn)方法,可以輔助人們更為直觀、高效、形象地洞悉大數(shù)據(jù)背后的信息、知識(shí)與智慧[14]。因此,本文采用數(shù)據(jù)可視化的形式將分析結(jié)論以交互圖表的形式進(jìn)行展示。

        1.3 Hidden Markov Model(HMM)算法

        隱馬爾可夫模型HMM用于描述統(tǒng)計(jì)現(xiàn)象,這些現(xiàn)象可被視為產(chǎn)生可觀察符號(hào)的隱藏狀態(tài)序列[15]。

        一個(gè)HMM包含一個(gè)可觀察層和一個(gè)隱藏層。可觀察層是待識(shí)別的觀察序列,用觀察值輸出概率描述;隱藏層是一個(gè)馬爾可夫過程,用狀態(tài)轉(zhuǎn)移概率進(jìn)行描述。HMM模型主要解決評(píng)估、學(xué)習(xí)和解碼問題[16]。一階HMM中計(jì)算狀態(tài)轉(zhuǎn)移概率時(shí),假設(shè)狀態(tài)序列中的每一個(gè)狀態(tài)只與前一個(gè)狀態(tài)有關(guān);計(jì)算觀察值的輸出概率時(shí),假設(shè)任意時(shí)刻觀察輸出概率只依賴于系統(tǒng)當(dāng)前時(shí)刻所處的狀態(tài),其過程由矩陣A、B和向量π組成。矩陣A包含隱藏狀態(tài)的轉(zhuǎn)移概率,矩陣B包含給定隱藏狀態(tài)的觀測符號(hào)出現(xiàn)的概率,向量π包含隱藏狀態(tài)的初始概率[17]。

        本文將隱馬爾可夫模型理論應(yīng)用于形音匹配過程,將系統(tǒng)使用語言的拼寫作為輸入(隱藏狀態(tài)序列),將自然語言的發(fā)音作為系統(tǒng)的輸出(觀察),由此探究自然語言的詞內(nèi)特征與隱馬爾可夫模型的對(duì)應(yīng)關(guān)系[15]。與深度學(xué)習(xí)的不可解釋性相比,隱馬爾可夫模型具有良好的數(shù)據(jù)透明性,因此本文沒有采用深度學(xué)習(xí)模型進(jìn)行分析。

        1.4 數(shù)據(jù)降維方法

        針對(duì)字素在多個(gè)模式下發(fā)音的狀態(tài)觀測矩陣維數(shù)過高和無特征的特點(diǎn),對(duì)其降維方法展開研究。

        基于t-SNE的降維算法,是一種非監(jiān)督降維算法, 無須預(yù)先傳入項(xiàng)目的分類標(biāo)簽信息。與PCA、SVD 等線性映射降維算法相比,t-SNE可以更好地在低維空間內(nèi)表達(dá)高維變量之間復(fù)雜非線性關(guān)系[18]。其算法核心思想是在對(duì)高維空間中的點(diǎn)構(gòu)建概率分布的同時(shí),在低維空間中映射這些點(diǎn)的概率分布,兩個(gè)概率分布之間盡可能相似,從而達(dá)到降維的目的。

        本文使用t-SNE降維方法所得狀態(tài)觀測矩陣低維空間的映射點(diǎn)有明顯的聚類表現(xiàn),并且在多個(gè)樣本上的降維結(jié)果顯現(xiàn)出一定的規(guī)律性[19]。

        2 數(shù)據(jù)處理流程

        本節(jié)首先描述了數(shù)據(jù)集的分解流程,在此基礎(chǔ)上闡述了隱馬爾可夫算法在不同窗口下的處理流程。

        2.1 字素音素分解流程

        (1) 根據(jù)目的所需,獲取朗文字典中的詞匯的拼寫、音標(biāo)以及詞性等相關(guān)屬性。

        (2) 根據(jù)詞性以及詞匯的大小寫情況對(duì)詞匯的縮寫以及專有名詞進(jìn)行剔除。

        (3) 將剔除后的數(shù)據(jù),根據(jù)威爾遜閱讀系統(tǒng)解碼、編碼規(guī)則將詞匯和音標(biāo)進(jìn)行拆分,形成字素-音素聯(lián)合單元。對(duì)于一個(gè)給定的字素,其對(duì)應(yīng)的音素通常是不唯一的。由于劃分過程中存在兩個(gè)相同的字素相連的情況,無法精準(zhǔn)確定發(fā)音由前后哪個(gè)字素所得,因此在劃分時(shí)將相鄰相同字素進(jìn)行了合并。通常,字素和音素序列長度相等,且一一對(duì)應(yīng)。在這些排列中,一個(gè)字素可能對(duì)應(yīng)一個(gè)沒有發(fā)音的空音素、一個(gè)單一的音素或一個(gè)復(fù)合音素。復(fù)合音素是兩個(gè)音位的連接。

        (4) 將詞匯中的特例額外劃分,保證劃分的準(zhǔn)確性。

        2.2 HMM窗口處理

        HMM根據(jù)窗口值大小w大于1與等于1兩種情況做區(qū)分處理,其區(qū)別在于:

        (1) 在t+1時(shí)刻的狀態(tài)qt+1的轉(zhuǎn)移概率依賴于w-1個(gè)狀態(tài)的影響。例如,窗口大小w=2(L/R=1/0)時(shí),t+1時(shí)刻的狀態(tài)qt+1依賴于t時(shí)刻的狀態(tài)qt和t-1時(shí)刻的狀態(tài)qt-1,其中L/R中的L和R分別表示觀察字素左側(cè)和右側(cè)的字素長度。

        (2) 在t時(shí)刻釋放觀察值Oi的輸出概率,不僅依賴于系統(tǒng)當(dāng)前所處的狀態(tài)Si,同時(shí)依賴于系統(tǒng)前一時(shí)刻所處的狀態(tài)Si-1。

        圖2表示的是窗口大小w=2(L/R=1/0)時(shí)的HMM模型。

        圖2 HMM在w=2(L/R=1/0)時(shí)的模型

        3 可視化分析

        本文首先根據(jù)數(shù)據(jù)的窗口大小,對(duì)字素發(fā)音的整體影響音素進(jìn)行統(tǒng)計(jì)分析,然后根據(jù)任務(wù)和設(shè)計(jì)目標(biāo), 提出并實(shí)現(xiàn)了一個(gè)基于形音匹配的可視分析系統(tǒng)。系統(tǒng)包含字素穩(wěn)定性分析視圖、詞云分析視圖、模式關(guān)聯(lián)圖、模式對(duì)比圖。可視分析以數(shù)據(jù)集中全部字素的總覽為起點(diǎn),對(duì)詞云中字素進(jìn)行篩選探索并對(duì)比較詞云中相鄰字素的發(fā)音變化和相似規(guī)律,最后對(duì)單個(gè)字素的發(fā)音模式根據(jù)窗口大小的變化進(jìn)行模式分析,以得出鄰接字素對(duì)目標(biāo)字素發(fā)音的影響規(guī)律。

        3.1 窗口大小解析

        本文對(duì)《朗文高階美語詞典》中經(jīng)過篩選的28 073個(gè)詞匯(對(duì)應(yīng)192 283個(gè)字素)進(jìn)行隱馬爾可夫模型發(fā)音預(yù)測。針對(duì)不同窗口大小w、左右兩邊不同數(shù)量的相鄰字素L/R、預(yù)測準(zhǔn)確發(fā)音的單詞數(shù)量#word與其占總詞匯數(shù)量的比例pword、匹配準(zhǔn)確音素的字素?cái)?shù)量#pron與其占總匹配對(duì)數(shù)量的比例ppron以及在相同窗口不同位置的相鄰字素影響下音素匹配準(zhǔn)確的單詞數(shù)量#wordw和概率pw情況進(jìn)行數(shù)據(jù)分析,分析所得結(jié)果表1所示。

        表1 受不同數(shù)量的鄰近字素影響時(shí)概率變化表

        續(xù)表1

        通過觀察表1中研究結(jié)果可以發(fā)現(xiàn),詞匯發(fā)音預(yù)測準(zhǔn)確率主要受兩個(gè)方面的影響:① 窗口大小。當(dāng)觀察字素兩邊分布相對(duì)一致時(shí),隨著w增加,實(shí)驗(yàn)所得發(fā)音準(zhǔn)確的詞匯數(shù)量以及正確匹配對(duì)的數(shù)量均呈上升趨勢。例如:w=2(L/R=1/0)與w=5(L/R=4/0)相比,準(zhǔn)確匹配音素的概率從70.82%上升到86.84%,準(zhǔn)確預(yù)測詞匯發(fā)音的概率從15.77%上升到41.05%。② 字素與待匹配字素相對(duì)位置關(guān)系。窗口大小不變時(shí),受影響字素與待匹配字素的相對(duì)位置不同,獲取到詞匯的準(zhǔn)確發(fā)音數(shù)量存在明顯差異。例如w=4(L/R=1/2)與w=4(L/R=3/0)相比,前者準(zhǔn)確匹配音素的概率為91.09%,而后者僅有83.56%。

        3.2 發(fā)音規(guī)律分析

        英語在字素的發(fā)音上不存在完全精準(zhǔn)的模式,因此對(duì)于多個(gè)字素,即使其隨窗口大小增加,發(fā)音模式穩(wěn)定性也無法達(dá)到100%。例如,字素在從窗口大小w=2時(shí)對(duì)應(yīng)的所有音素準(zhǔn)確率為98.50%;當(dāng)窗口增加到5時(shí),字素對(duì)應(yīng)的所有音素準(zhǔn)確率增加到99.01%,準(zhǔn)確率僅提高了0.51%。

        前文分析已得出,隨著窗口大小的增加,音素準(zhǔn)確率呈增長趨勢。然而窗口長度的過分增加,不僅對(duì)音素準(zhǔn)確率的提升效果不明顯,反而對(duì)大腦記憶增添負(fù)擔(dān),復(fù)雜的記憶工作會(huì)直接降低學(xué)習(xí)者學(xué)習(xí)英語的積極性。因此,應(yīng)當(dāng)合理選取窗口進(jìn)行可視化呈現(xiàn),以獲取音素準(zhǔn)確率與記憶成本間的最大平衡。

        3.3 字素穩(wěn)定性分析視圖

        字素穩(wěn)定性分析視圖采用對(duì)稱條形圖的不同柱狀長度呈現(xiàn)字典中所有字素在不同窗口大小和方向下的音素準(zhǔn)確率。

        圖中以縱坐標(biāo)軸為界,左半部分表示不同窗口大小下受左側(cè)字素影響強(qiáng)度不弱于右側(cè)時(shí)匹配的準(zhǔn)確率情況,右半部分表示不同窗口大小下受右側(cè)字素影響強(qiáng)度不弱于左側(cè)時(shí)匹配的準(zhǔn)確率情況。字素穩(wěn)定性分析視圖的計(jì)算基于隱馬爾可夫算法,視圖中所有字素均可結(jié)合窗口大小進(jìn)行對(duì)比分析。圖中柱狀長度由窗口大小與字素在窗口中的分布位置決定。

        對(duì)多個(gè)字素的匹配準(zhǔn)確率進(jìn)行對(duì)比分析,總結(jié)出字素發(fā)音穩(wěn)定性情況呈現(xiàn)以下幾種類別:相同窗口大小下受左側(cè)字素的影響程度強(qiáng)于右側(cè)、相同窗口大小下受右側(cè)字素的影響程度強(qiáng)于左側(cè)、字素匹配準(zhǔn)確率隨窗口大小的增加而顯著提升、字素匹配準(zhǔn)確率不受窗口大小影響而基本持平。

        3.4 字素詞云分析視圖

        詞云分析視圖是學(xué)習(xí)形音匹配模式的入口,圖中信息包括數(shù)據(jù)集中字素的二維分布與字素在模式上的相近關(guān)系。字素在詞云中的相對(duì)位置反映了字素之間模式的相似程度。字素的位置由數(shù)據(jù)集中字素的模式通過t-SNE降維方式獲取,對(duì)于模式差距較大的字素,在視圖中的距離也會(huì)偏大。在探究字素之間的關(guān)系時(shí),用戶可以根據(jù)降維可視化形成的簇進(jìn)行對(duì)比分析。

        3.5 字素模式關(guān)聯(lián)圖

        分析字素模式關(guān)聯(lián)圖可得單個(gè)字素的發(fā)音情況,視圖中根節(jié)點(diǎn)為所選字素,與根節(jié)點(diǎn)相連接的是該字素的所有發(fā)音情況,字素的發(fā)音由葉子節(jié)點(diǎn)和中心字素共同決定。葉子節(jié)點(diǎn)的大小與對(duì)應(yīng)字素的數(shù)量成正比,當(dāng)同一個(gè)葉子節(jié)點(diǎn)連接到不同的音素時(shí)(如圖中、、),表明該根節(jié)點(diǎn)與葉子節(jié)點(diǎn)字素結(jié)合時(shí)發(fā)音不穩(wěn)定。

        3.6 字素模式對(duì)比圖

        字素在不同模式下發(fā)音對(duì)比圖,對(duì)詞云中選取的字素進(jìn)行統(tǒng)計(jì)分析。本視圖主要針對(duì)多個(gè)字素的所有模式進(jìn)行分析,在橫坐標(biāo)排布上服從先共有模式,后私有模式。用戶可以從視圖中直觀地比較多個(gè)字素之間在不同模式下發(fā)音的穩(wěn)定性情況。研究發(fā)現(xiàn),兩個(gè)字素存在共有模式數(shù)量及其準(zhǔn)確率對(duì)字素在形音匹配模式上的相近關(guān)系起決定作用。

        本文通過該可視分析系統(tǒng)的四個(gè)交互圖表直觀體現(xiàn)了字素間的音素匹配模式,從而幫助用戶高效地學(xué)習(xí)英語形音匹配模式。

        3.7 可視化交互

        本系統(tǒng)通過可交互視圖集與可視化展示視圖集進(jìn)行數(shù)據(jù)聯(lián)動(dòng)的方式(可交互視圖集:字素穩(wěn)定性分析視圖、詞云分析視圖;可視化展示視圖集:模式關(guān)聯(lián)圖、模式對(duì)比圖),提供豐富的交互功能,滿足用戶的學(xué)習(xí)及研究需求。

        用戶可在字素穩(wěn)定性分析視圖選擇待分析的字素,點(diǎn)擊待分析字素后,模式關(guān)聯(lián)圖區(qū)域數(shù)據(jù)更新,變更為選定字素的模式關(guān)聯(lián)圖,向用戶展示當(dāng)前字素的詳細(xì)模式信息,幫助用戶學(xué)習(xí)字素發(fā)音規(guī)律,提高用戶拼讀能力;用戶可在詞云分析視圖選擇單個(gè)或多個(gè)字素,選中或退選字素后,模式對(duì)比圖區(qū)域進(jìn)行相應(yīng)數(shù)據(jù)更新,模式對(duì)比圖中會(huì)增加選中的字素分析曲線,刪除退選的字素分析曲線,最終呈現(xiàn)全部已選擇字素的發(fā)音模式,將字素間發(fā)音模式的相似程度直觀展示給用戶,輔助用戶關(guān)聯(lián)記憶或探索研究。鼠標(biāo)懸??梢燥@示相應(yīng)數(shù)據(jù)的詳細(xì)信息。

        4 案例分析

        雖然目前已有許多關(guān)于字素的發(fā)音模式研究, 但利用可視化技術(shù)進(jìn)行的相關(guān)研究相對(duì)較少。而且目前針對(duì)上下文字素對(duì)觀察字素發(fā)音影響的研究以及字素之間模式相似性的研究并不詳細(xì)。因此本文采用可視化技術(shù),通過可視交互圖表對(duì)觀察字素進(jìn)行發(fā)音模式分析和相似性對(duì)比。

        本文通過兩個(gè)案例來介紹系統(tǒng)的可用性與效率。案例一選取字素的發(fā)音模式進(jìn)行分析,案例二選取多個(gè)字素發(fā)音模式進(jìn)行對(duì)比。以下將對(duì)兩個(gè)案例分別介紹。

        4.1 案例1:字素的發(fā)音分析

        選取字素進(jìn)行分析,探究模式中位于不同字素后的發(fā)音數(shù)量占比和異常情況。該字素在自然拼讀法中存在以下模式:(1) 位于、、、

        之后時(shí)發(fā)/yu/音;(2) 位于、之后時(shí)發(fā)/u/音。

        4.1.1縱覽字素

        進(jìn)入字素的可視分析系統(tǒng)界面,從字素穩(wěn)定性分析視圖(圖1)中點(diǎn)擊對(duì)應(yīng)的字素進(jìn)行選擇操作,該字素所對(duì)應(yīng)的柱狀圖高亮顯示,如圖3所示。

        圖3 穩(wěn)定性分析

        圖3中使用對(duì)稱條形圖展示所有窗口下準(zhǔn)確匹配音素的概率,概率分布基本符合隨著窗口大小增加,準(zhǔn)確率增加的情況。在窗口方向上,為了與自然拼讀法中的模式進(jìn)行對(duì)比,本文選取受左側(cè)字素影響的情況進(jìn)行分析。

        條形圖左右對(duì)比可得,右側(cè)模式的影響強(qiáng)度普遍高于左側(cè)。當(dāng)窗口長度為2時(shí),形音匹配準(zhǔn)確率可達(dá)80%以上,相較于窗口大小為1時(shí)顯著提升,但窗口大小增至為3時(shí)變化不明顯。因此,選取窗口大小為2進(jìn)行字素發(fā)音模式分析最有效率。

        4.1.2模式分析

        模式關(guān)聯(lián)圖可直觀地展示出該字素發(fā)音存在三種情況。如圖4所示,分別是/u/、/yu/和//,其中音素/u/占比最大。當(dāng)查看單個(gè)發(fā)音情況時(shí),可以清晰了解到受影響字素的情況以及占比大小。當(dāng)字素發(fā)音為/yu/時(shí)不僅滿足字素模式(1),而且與其他字素的組合情況占比通過節(jié)點(diǎn)圓面積來進(jìn)行判斷。

        圖4 字素受左邊字素影響的模式關(guān)聯(lián)圖

        進(jìn)一步研究表明,字素受前一個(gè)字素影響時(shí),其發(fā)音存在不穩(wěn)定現(xiàn)象,該字素同時(shí)連接音素/u/、/yu/,此時(shí)無法確定的準(zhǔn)確發(fā)音,需要通過增加窗口大小或?yàn)g覽具體單詞進(jìn)一步探索。

        4.2 案例2:多字素發(fā)音模式對(duì)比

        選取多個(gè)字素發(fā)音模式進(jìn)行對(duì)比。該案例選擇的字素列表為[,]與[,]。以下將針對(duì)兩個(gè)字素列表中的字素進(jìn)行發(fā)音模式對(duì)比。

        4.2.1[,]對(duì)比分析

        通過詞云分析視圖選取列表中的字素,已選字素在詞云顏色加深顯示,在選取過程中,可根據(jù)字素在二維平面內(nèi)的相對(duì)位置了解字素之間的相近程度。圖1詞云分析視圖中字素之間的分布距離相對(duì)較近,說明兩者的發(fā)音模式有很大的相似度。為更好地了解這兩個(gè)字素相似性具體存在于哪些發(fā)音模式中,需從模式對(duì)比圖中進(jìn)行深入分析。

        借助前文得出的結(jié)論,本文同樣保持窗口長度為2,分別統(tǒng)計(jì),在所有模式中受右側(cè)字素影響時(shí)的發(fā)音準(zhǔn)確率。根據(jù)字素列表[,]、窗口大小w=2獲取到如圖5所示的模式對(duì)比圖,圖中:橫坐標(biāo)為影響模式(同時(shí)包含兩者的共有模式和各自的私有模式);縱坐標(biāo)為當(dāng)前模式下形音匹配準(zhǔn)確率,不同顏色圖例對(duì)應(yīng)不同字素的準(zhǔn)確率曲線。可以看出,字素的準(zhǔn)確率曲線在共有模式上具有相近的趨勢,這表明在多數(shù)模式下的相似性較強(qiáng)。兩者的發(fā)音差異僅在少數(shù)模式中體現(xiàn),如[_z]模式下的準(zhǔn)確率高達(dá)100%,而的準(zhǔn)確率僅有33%,這說明兩者在[_z]模式下相似性弱。

        圖5 [,]受右邊字素影響的模式對(duì)比圖

        4.2.2[,]對(duì)比分析

        對(duì)于字素列表[,],本文采用同樣的操作得到模式對(duì)比圖如圖6所示。分析可得,僅在少量共有模式中保持相近準(zhǔn)確率,如[_d]、[_n]和[_m]中兩字素準(zhǔn)確率同為100%。而在多個(gè)模式下,兩者的準(zhǔn)確率相差甚遠(yuǎn),如[_z]中字素的準(zhǔn)確率為100%,但僅有33%。將圖6與圖5對(duì)比可知,[,]的共有模式數(shù)量少于[,]。綜合以上兩結(jié)果可得,[,]的相似性關(guān)系強(qiáng)于[,],這也印證了詞云分析視圖(圖1)中[,]的空間距離遠(yuǎn)小于[,]的現(xiàn)象。

        圖6 [,]受右邊字素影響的模式對(duì)比圖

        5 用戶反饋

        本系統(tǒng)的研發(fā)過程中,與多位英語專家進(jìn)行了為期半年的溝通合作,不斷獲取反饋,并進(jìn)行系統(tǒng)迭代。最后由多位專家與不同英語能力層次的高校學(xué)生進(jìn)行實(shí)際操作與深入使用,對(duì)系統(tǒng)做出最終評(píng)價(jià)。

        5.1 系統(tǒng)設(shè)計(jì)

        本系統(tǒng)設(shè)計(jì)目標(biāo)明確、易用性強(qiáng),使用者在了解各個(gè)視圖的設(shè)計(jì)目標(biāo)、交互方式、功能意義后,很快熟悉整個(gè)系統(tǒng)并開始使用。

        通過分析多名使用者對(duì)本系統(tǒng)的操作反饋,得出結(jié)論:該系統(tǒng)可以幫助零基礎(chǔ)使用者迅速獲取字素發(fā)音模式的相關(guān)知識(shí),幫助有基礎(chǔ)的使用者提高自然拼讀法水平或掌握更多形音匹配模式,幫助專業(yè)英語研究者尋找具備發(fā)音模式相似性的字素,從而更深層次研究字素之間的關(guān)系,甚至可以引申至英語乃至印歐語系形音匹配發(fā)展的研究。

        使用者認(rèn)為該系統(tǒng)功能豐富、交互性強(qiáng),通過在多種維度上進(jìn)行統(tǒng)計(jì)分析,充分提取有效信息,可以滿足各類人群的不同需求,對(duì)英語學(xué)習(xí)者和英語研究者都有巨大的意義。

        5.2 可視與交互設(shè)計(jì)

        使用者們對(duì)本系統(tǒng)的多個(gè)可視圖表設(shè)計(jì)表達(dá)了見解,對(duì)于模式關(guān)聯(lián)圖,學(xué)生們表示該圖信息豐富,從字素前后模式角度對(duì)字素音素匹配模式進(jìn)行分析,直觀表達(dá)既定窗口下的模式及其影響力,同時(shí)可以通過字素穩(wěn)定性分析視圖來調(diào)整窗口大小,由此提取更深入的形音匹配模式;對(duì)于詞云分析視圖,學(xué)生們表示詞云的關(guān)聯(lián)交互功能可以通過模式對(duì)比圖分析字素發(fā)音模式的相似度。該系統(tǒng)創(chuàng)新性地將模式用可視化的方式展示,極大縮短了相似度分析所需的時(shí)間。

        專家對(duì)完善的可視化界面與豐富的交互功能作出了總體肯定,同時(shí)提出本系統(tǒng)過于注重字素音素的形音匹配而忽視讀音的輕重音節(jié)意義的問題,并對(duì)該問題提出了改進(jìn)意見。

        6 結(jié) 語

        本文通過使用隱馬爾可夫模型將字典中所有詞匯的字素、音素進(jìn)行量化統(tǒng)計(jì),考慮窗口方向與大小后選取合理窗口值對(duì)量化數(shù)據(jù)進(jìn)行降維與可視化;用簡單易懂的可視化形式將復(fù)雜枯燥的統(tǒng)計(jì)結(jié)果展示給英語學(xué)習(xí)者,學(xué)習(xí)者可以通過自身需求,借助系統(tǒng)的交互功能選取字素進(jìn)行發(fā)音學(xué)習(xí)。系統(tǒng)在發(fā)音規(guī)律方面可給予英語學(xué)習(xí)者明確有效的指導(dǎo),從根本上解決了詞匯拼讀難等問題,從而大幅提升學(xué)習(xí)者的閱讀能力。

        但本系統(tǒng)與目前獲取的量化數(shù)據(jù)在英語學(xué)習(xí)的簡化上還有很大的提升空間,需要進(jìn)一步探索。實(shí)驗(yàn)中對(duì)于部分單元音字素,在窗口大小達(dá)到w=4時(shí)依然未能達(dá)到80%的準(zhǔn)確率,而且單元音字素對(duì)應(yīng)的音素?cái)?shù)量相對(duì)較大。通過本文所用方法來進(jìn)行音素匹配過于繁瑣,該問題仍需合理的方案進(jìn)行解決。

        猜你喜歡
        音素視圖發(fā)音
        新目標(biāo)英語七年級(jí)(上)Starter Units 1-3 STEP BY STEP 隨堂通
        Hickory, Dickory, Dock
        依托繪本課程,培養(yǎng)學(xué)生英語音素意識(shí)
        小學(xué)英語課堂中音素意識(shí)與自然拼讀整合訓(xùn)練的探索
        ?不定冠詞a與an
        5.3 視圖與投影
        視圖
        Y—20重型運(yùn)輸機(jī)多視圖
        SA2型76毫米車載高炮多視圖
        Playing with h
        国产一级一片内射在线| 亚洲精品无码久久久久牙蜜区| 久久发布国产伦子伦精品| 亚洲精品aⅴ无码精品丝袜足| 经典亚洲一区二区三区| 国产自拍视频免费在线| 亚洲精品午夜无码专区| 国产成人v爽在线免播放观看| 午夜人妻中文字幕福利| 亚洲国产成人久久精品一区| 青青青爽在线视频观看| 天天躁人人躁人人躁狂躁| 日本一道dvd在线中文字幕 | 久久亚洲乱码中文字幕熟女 | 在线播放偷拍一区二区| 少妇人妻综合久久中文字幕| 九九久久精品无码专区| 亚洲一区二区三区av链接| 加勒比一区二区三区av| 永久免费毛片在线播放| 男男车车的车车网站w98免费| 亚洲国产精品久久九色| 手机av在线播放网站| 国产麻豆剧果冻传媒一区| 亚洲国产人在线播放首页| 无码成年性午夜免费网站蜜蜂| 在线精品国产亚洲av麻豆| 人与动牲交av免费| 久久国产精彩视频| 日韩av中文字幕少妇精品| 久久精品99国产精品日本| 性色av无码不卡中文字幕| 亚洲欧美成人在线免费| 国产精品亚洲一区二区三区16| 国自产精品手机在线观看视频| 日本不卡视频网站| 97久久久一区二区少妇| 中文字幕日韩精品有码视频| 又硬又粗又大一区二区三区视频| 久久精品女人天堂AV一个| 中文字幕乱码熟女人妻在线|