亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        一種語(yǔ)音識(shí)別的可定制云計(jì)算方法*

        2014-12-02 03:51:36賈玉輝張志楠
        關(guān)鍵詞:架構(gòu)語(yǔ)音服務(wù)器

        張 巍,賈玉輝,張志楠

        (中國(guó)海洋大學(xué)信息科學(xué)與工程學(xué)院,山東 青島 266100)

        語(yǔ)音識(shí)別始于1950年代初,當(dāng)時(shí),貝爾實(shí)驗(yàn)室的Davis等人研究成功了第一個(gè)可識(shí)別10個(gè)英文數(shù)字的語(yǔ)音識(shí)別系統(tǒng)-Adudry。1980年代末,美國(guó)卡內(nèi)基·梅隆大學(xué)用VQ/HMM方法實(shí)現(xiàn)了世界上第一個(gè)高性能的非特定人、大字表、連續(xù)語(yǔ)音識(shí)別系統(tǒng)—SPHINX[1]。在此期間語(yǔ)音識(shí)別處于實(shí)驗(yàn)室研究階段,市場(chǎng)上沒有成型的產(chǎn)品。直到1990年代初,隨著在系統(tǒng)的自適應(yīng)性、參數(shù)提取及優(yōu)化等技術(shù)上取得了一些關(guān)鍵性的進(jìn)展,語(yǔ)音識(shí)別技術(shù)進(jìn)一步成熟,并開始向市場(chǎng)提供產(chǎn)品[2]。從此語(yǔ)音識(shí)別開始從實(shí)驗(yàn)室逐步走向?qū)嵱谩2⑶?,在一些?yīng)用領(lǐng)域,它正迅速地成為一個(gè)關(guān)鍵的、而且具有競(jìng)爭(zhēng)力的技術(shù)。

        從產(chǎn)品的實(shí)現(xiàn)平臺(tái)上來(lái)看,當(dāng)前市場(chǎng)上的語(yǔ)音識(shí)別系統(tǒng)主要分為3種:嵌入式的語(yǔ)音識(shí)別系統(tǒng)、服務(wù)器模式的語(yǔ)音識(shí)別系統(tǒng)及云計(jì)算模式的語(yǔ)音識(shí)別系統(tǒng)。嵌入式語(yǔ)音識(shí)別系統(tǒng)[3]是指應(yīng)用各種先進(jìn)的的微處理器在板級(jí)或是芯片級(jí)用軟件或硬件實(shí)現(xiàn)語(yǔ)音識(shí)別技術(shù)。由于嵌入式平臺(tái)存儲(chǔ)資源少、性能低、實(shí)時(shí)性要求高,嵌入式語(yǔ)音識(shí)別系統(tǒng)只適合做算法要求相對(duì)簡(jiǎn)單,對(duì)資源的需求較少的語(yǔ)音識(shí)別,比如中小詞匯量的命令詞識(shí)別等。在服務(wù)器模式的語(yǔ)音識(shí)別系統(tǒng)中,終端只負(fù)責(zé)收集和傳導(dǎo)語(yǔ)音信號(hào),由服務(wù)器負(fù)責(zé)完成識(shí)別。這種模式可以做高性能的大詞匯量連續(xù)語(yǔ)音識(shí)別。并且對(duì)于大規(guī)模、多用戶和有大量識(shí)別需求的系統(tǒng),服務(wù)器模式提供了較為有效的解決方法。在一般情況下,服務(wù)器都選擇價(jià)格昂貴的巨型機(jī)或者大型機(jī)來(lái)充當(dāng),當(dāng)用戶訪問量較少時(shí),傳統(tǒng)的服務(wù)器模式,完全可以應(yīng)對(duì)。但隨著用戶訪問量的增加,所需服務(wù)器數(shù)量也會(huì)相應(yīng)增加,在這種情況下,公司的運(yùn)營(yíng)成本就會(huì)急劇攀升。隨著服務(wù)器數(shù)量的增加,服務(wù)器的管理就會(huì)變得非常復(fù)雜,并且服務(wù)器數(shù)目擴(kuò)充到一定數(shù)目,就可能會(huì)達(dá)到性能瓶頸,使得單純的增加服務(wù)器,對(duì)系統(tǒng)性能提升收效甚微。云計(jì)算模式的語(yǔ)音識(shí)別系統(tǒng)和服務(wù)器模式的語(yǔ)音識(shí)別系統(tǒng)類似,主要是有云端負(fù)責(zé)完成識(shí)別。相對(duì)于傳統(tǒng)的服務(wù)器架構(gòu),云[4]具有更好的擴(kuò)展性,成本更加低廉,并且可以具有超大規(guī)模,給用戶提供前所未有的計(jì)算能力。且不難得知,用來(lái)學(xué)習(xí)、訓(xùn)練的樣本數(shù)據(jù)集越大,語(yǔ)音識(shí)別系統(tǒng)的性能越好。這就需要解決大數(shù)據(jù)存儲(chǔ)及處理的問題。而云計(jì)算恰好能很好的解決這2個(gè)問題。云計(jì)算技術(shù)和語(yǔ)音識(shí)別相融合是1種新的趨勢(shì)。但現(xiàn)在基于云計(jì)算的語(yǔ)音識(shí)別技術(shù)正處于發(fā)展初期,技術(shù)仍未成熟,并且市場(chǎng)上的產(chǎn)品只提供面向通用領(lǐng)域的語(yǔ)音識(shí)別服務(wù)。無(wú)法對(duì)語(yǔ)音識(shí)別服務(wù)進(jìn)行定制。

        由上可知,嵌入式的語(yǔ)音識(shí)別系統(tǒng)功能極其簡(jiǎn)單,并且應(yīng)用范圍較窄;服務(wù)器模式的語(yǔ)音識(shí)別系統(tǒng)能提供較為復(fù)雜的功能,且可以應(yīng)對(duì)較多用戶的請(qǐng)求,但面對(duì)海量用戶請(qǐng)求卻無(wú)能為力;云計(jì)算模式的語(yǔ)音識(shí)別系統(tǒng)可以應(yīng)對(duì)海量用戶請(qǐng)求,且可以利用海量用戶數(shù)據(jù)優(yōu)化語(yǔ)音識(shí)別系統(tǒng)的性能,但由于其尚處于發(fā)展初期,基于云的語(yǔ)音識(shí)別服務(wù)提供商尚未提供可定制的語(yǔ)音識(shí)別服務(wù),他們的語(yǔ)音識(shí)別模型不能按照用戶的需求而更改,用戶不可根據(jù)自己的實(shí)際情況對(duì)語(yǔ)音識(shí)別模型進(jìn)行定制。如果模型可以定制,就可以提供針對(duì)特定領(lǐng)域的語(yǔ)音識(shí)別服務(wù),而無(wú)需關(guān)注其他領(lǐng)域,顯然這樣更容易獲取高識(shí)別率,更容易滿足特定用戶。針對(duì)以上情形,本文提出了1種面向特定領(lǐng)域的云計(jì)算方法,并簡(jiǎn)單實(shí)現(xiàn)了1個(gè)云計(jì)算架構(gòu)的語(yǔ)音識(shí)別系統(tǒng)(Speech Recognition System Based on Cloud Computing,SRSCC),可以對(duì)這些領(lǐng)域的用戶提供可定制的語(yǔ)音識(shí)別服務(wù),滿足用戶的個(gè)性化需求,改善用戶的使用體驗(yàn)。

        本文首先研究了MapReduce模型,并給出了語(yǔ)音識(shí)別的MapReduce流程。然后通過使用開源的流式MapReduce工具-Sector/Sphere[6-8]及主要用于語(yǔ)音識(shí)別研究的HTK[9]工具包,實(shí)現(xiàn)了語(yǔ)音識(shí)別技術(shù)與云計(jì)算技術(shù)的融合,即SRSCC系統(tǒng)。并在此基礎(chǔ)之上,給出了語(yǔ)音識(shí)別的可定制性方法,使得該系統(tǒng)能為特定領(lǐng)域的用戶提供可定制的服務(wù)。最后,通過實(shí)驗(yàn)評(píng)估了系統(tǒng)的性能及系統(tǒng)的可擴(kuò)展性。

        1 MapReduce編程模型

        1.1 模型介紹

        MapReduce[5]是 Google提出的1個(gè)編程模型,主要用于大規(guī)模數(shù)據(jù)的并行運(yùn)算,通過將MapReduce模型應(yīng)用到語(yǔ)音識(shí)別系統(tǒng),能加快系統(tǒng)對(duì)用戶請(qǐng)求的處理速度。MapReduce是1種處理大規(guī)模數(shù)據(jù)集的編程模型,同時(shí)它也是1種高效的任務(wù)調(diào)度模型,它主要有“Map(映射)”和“Reduce(化簡(jiǎn))”2個(gè)過程組成,這2個(gè)過程構(gòu)成了運(yùn)算基本單元[10-11]。Map函數(shù)用來(lái)指定對(duì)各分塊數(shù)據(jù)的每一個(gè)元素所進(jìn)行的操作,而reduce函數(shù)用來(lái)對(duì)各分塊數(shù)據(jù)處理的中間結(jié)果進(jìn)行歸約。用戶在設(shè)計(jì)分布式程序時(shí),只要實(shí)現(xiàn)map和reduce 2個(gè)函數(shù),至于其他細(xì)節(jié),比如如何將輸入的數(shù)據(jù)分塊、任務(wù)調(diào)度、機(jī)器容錯(cuò)以及節(jié)點(diǎn)間通信的管理等,都可交由MapReduce框架處理。

        MapReduce模型具有具有極強(qiáng)的容錯(cuò)性。集群中的每個(gè)worker節(jié)點(diǎn)會(huì)周期性的把完成的工作及狀態(tài)的更新報(bào)告發(fā)給master節(jié)點(diǎn),如果1個(gè)worker節(jié)點(diǎn)保持沉默超過1個(gè)預(yù)設(shè)的時(shí)間間隔,master節(jié)點(diǎn)就會(huì)把這個(gè)節(jié)點(diǎn)的狀態(tài)改為死亡,并把該worker節(jié)點(diǎn)上執(zhí)行的程序及數(shù)據(jù)遷移到其他worker節(jié)點(diǎn)上重新執(zhí)行。而當(dāng)master節(jié)點(diǎn)出錯(cuò)時(shí),可以根據(jù)最近的1個(gè)檢查點(diǎn)重新選擇1個(gè)節(jié)點(diǎn)作為master,并由此檢查點(diǎn)位置繼續(xù)運(yùn)行。

        1.2 語(yǔ)音識(shí)別的MapReduce過程

        隨著語(yǔ)音識(shí)別技術(shù)的廣泛應(yīng)用,語(yǔ)音識(shí)別必然會(huì)面臨海量請(qǐng)求所帶來(lái)的挑戰(zhàn)。比如面對(duì)億萬(wàn)用戶的請(qǐng)求如何更快的進(jìn)行處理、響應(yīng);如何存儲(chǔ)海量用戶數(shù)據(jù);如何使語(yǔ)音識(shí)別模型能處理更大的訓(xùn)練集,以獲得更高的識(shí)別率等等。MapReduce是1個(gè)可靠地容易進(jìn)行編程操作的大數(shù)據(jù)并行計(jì)算模型。如果把MapReduce模型應(yīng)用到語(yǔ)音識(shí)別上面,則可以輕松應(yīng)對(duì)這些挑戰(zhàn)。

        圖1給出了語(yǔ)音識(shí)別的1種MapReduce處理過程,圖中的wav11是用戶一上傳的第一個(gè)語(yǔ)音文件,wav12是用戶一上傳的第二個(gè)語(yǔ)音文件,result11和result22分別是2個(gè)語(yǔ)音文件對(duì)應(yīng)的識(shí)別結(jié)果,user1是用戶一,其他的雷同。這個(gè)處理過程顯示的是不同用戶上傳文件,通過MapReduce過程,生成該用戶所上傳語(yǔ)音的結(jié)果集,然后把這個(gè)結(jié)果集返給用戶。單個(gè)語(yǔ)音的識(shí)別結(jié)果在映射這一環(huán)節(jié)得出,然后在化簡(jiǎn)環(huán)節(jié),按照語(yǔ)音文件識(shí)別結(jié)果所對(duì)應(yīng)的用戶進(jìn)行規(guī)約,最終得到各個(gè)用戶所上傳語(yǔ)音的識(shí)別結(jié)果集。

        圖1 語(yǔ)音識(shí)別的MapReduce處理過程Fig.1 MapReduce process of speech recognition

        2 SRSCC語(yǔ)音識(shí)別系統(tǒng)

        2.1 系統(tǒng)組成

        SRSCC云端系統(tǒng)架構(gòu)主要包括3個(gè)部分:安全服務(wù)器、管理服務(wù)器、及奴隸節(jié)點(diǎn)。安全服務(wù)器主要負(fù)責(zé)維護(hù)用戶賬號(hào)、密碼、以及對(duì)每個(gè)文件或目錄的操作權(quán)限等。它也維護(hù)了1個(gè)IP地址列表,用來(lái)指出哪些奴隸節(jié)點(diǎn)可以加入系統(tǒng),從而使非法節(jié)點(diǎn)無(wú)法訪問和干擾系統(tǒng),保證整個(gè)系統(tǒng)的安全性。管理服務(wù)器主要主要負(fù)責(zé)維護(hù)存儲(chǔ)文件的元數(shù)據(jù)以及控制所有奴隸節(jié)點(diǎn)的運(yùn)行并且對(duì)用戶的請(qǐng)求作出響應(yīng)。管理服務(wù)器可以直接與安全服務(wù)器進(jìn)行通信,從而驗(yàn)證奴隸節(jié)點(diǎn)和用戶的合法性。奴隸節(jié)點(diǎn)上部署有語(yǔ)音識(shí)別環(huán)境,用戶上傳的錄音文件存儲(chǔ)在奴隸節(jié)點(diǎn)上,并且奴隸節(jié)點(diǎn)負(fù)責(zé)識(shí)別這些文件,生成識(shí)別結(jié)果。

        2.2 語(yǔ)音識(shí)別的Sphere處理流程

        Sphere被用來(lái)設(shè)計(jì)執(zhí)行用戶自定義函數(shù)。這些函數(shù)并行的以1種流的方式來(lái)處理Sector管理的數(shù)據(jù)。這意味著同一個(gè)用戶自定義函數(shù)會(huì)應(yīng)用到1個(gè)數(shù)據(jù)集的每一個(gè)數(shù)據(jù)記錄。這個(gè)過程是并行的,并且對(duì)數(shù)據(jù)集的每一段數(shù)據(jù)記錄的處理是獨(dú)立完成的(假若有足夠的處理器可以用)。

        圖2 語(yǔ)音識(shí)別的Sphere計(jì)算范式Fig.2 Computing paradigm of speech recognition

        語(yǔ)音識(shí)別的Sphere計(jì)算范式見圖2,識(shí)別請(qǐng)求和Sphere客戶端進(jìn)行通信,Sphere客戶端首先收集有關(guān)輸入流的信息,包括總的大小,文件的數(shù)目等等。其次Sphere客戶端通過尋找和處理函數(shù)同名的動(dòng)態(tài)鏈接庫(kù)文件的方式定位所需服務(wù)的提供者,或者SPEs(Sphere Process Engines,SPE數(shù)據(jù)處理邏輯單位,可以處理1個(gè)數(shù)據(jù)段,1組數(shù)據(jù)或者整個(gè)文件)。語(yǔ)音識(shí)別的動(dòng)態(tài)鏈接庫(kù)文件也存放在Sector系統(tǒng)中?;谶@些信息,Sphere客戶端把輸入流分割成數(shù)據(jù)段(本文中整個(gè)語(yǔ)音文件作為1個(gè)數(shù)據(jù)段來(lái)處理)。通常情況下數(shù)據(jù)段的數(shù)目要遠(yuǎn)大于SPEs的數(shù)目。在開始的作業(yè)中,給每一個(gè)SPE分配1個(gè)數(shù)據(jù)段并開始進(jìn)行處理。一旦處理過程完成,得出結(jié)果,再給這個(gè)SPE分配一個(gè)新的數(shù)據(jù)片段來(lái)處理。這個(gè)結(jié)果流(輸出數(shù)據(jù))或者返回給用戶,或者寫入存放在Sector的文件中,等待進(jìn)行下一步處理。

        2.3 SRSCC系統(tǒng)整體架構(gòu)

        在該系統(tǒng)中,用戶不與云端服務(wù)器直接交互,由Sphere客戶端充當(dāng)中間媒介。當(dāng)錄好音生成的文件上傳到客戶端時(shí),該客戶端就會(huì)登錄到Sector/Sphere云,把文件交予云端服務(wù)器的slave節(jié)點(diǎn)處理。雖然當(dāng)用戶較少時(shí),該架構(gòu)顯得有點(diǎn)繁瑣,但用戶訪問量較大時(shí),它就會(huì)發(fā)揮出高效的性能。在master的管理下,云客戶端直接與slave進(jìn)行交互,上傳數(shù)據(jù)。SRSCC語(yǔ)音識(shí)別系統(tǒng)整體架構(gòu)流程圖見圖3。

        3 可定制性實(shí)現(xiàn)

        3.1 語(yǔ)音識(shí)別的可定制性

        圖3 CCSR系統(tǒng)架構(gòu)流程圖Fig.3 Architecture flowchart of CCSR system

        所謂可定制性是指用戶可根據(jù)自身的需求,來(lái)定制自己所需要的產(chǎn)品和服務(wù),以滿足自己的個(gè)性化需要。比如軟件的可定制性就是指可根據(jù)用戶的具體情況,具體要求來(lái)設(shè)計(jì)軟件系統(tǒng),提供相應(yīng)服務(wù)。而語(yǔ)音識(shí)別的可定制性,在這里是指,用戶可以根據(jù)自己的實(shí)際需要來(lái)定制語(yǔ)音識(shí)別模型。通用的語(yǔ)音識(shí)別器,例如Google的語(yǔ)音搜索,用戶只能用來(lái)做識(shí)別,而不可能更改它的語(yǔ)言模型(Language Model)和聲學(xué)模型(Acoustic Model)。但可定制的語(yǔ)音識(shí)別器,可以更改語(yǔ)音模型和聲學(xué)模型。比如一些特定領(lǐng)域的用戶,只需使用自己特定領(lǐng)域的語(yǔ)音來(lái)進(jìn)行訓(xùn)練,無(wú)需關(guān)注其他領(lǐng)域的語(yǔ)音。這樣可使語(yǔ)音識(shí)別模型的生成變得更加簡(jiǎn)單和高效。并且在一般情況下比通用領(lǐng)域的語(yǔ)音識(shí)別識(shí)別模型具有更高的識(shí)別率。先前做過1個(gè)實(shí)驗(yàn)。只針對(duì)菜名進(jìn)行訓(xùn)練,得到1個(gè)只識(shí)別菜名的模型。經(jīng)過測(cè)試發(fā)現(xiàn),這個(gè)只面向菜名的語(yǔ)音識(shí)別器對(duì)菜名語(yǔ)音的識(shí)別正確率為87%,而Google語(yǔ)音搜索對(duì)菜名的識(shí)別正確率只有44%。

        3.2 實(shí)現(xiàn)方法

        針對(duì)有特殊需求,需要定制語(yǔ)音識(shí)別模型的用戶,本文在Sector系統(tǒng)中為其創(chuàng)建對(duì)應(yīng)的文件夾,以存放用戶自己的語(yǔ)音識(shí)別模型??梢酝ㄟ^以下2個(gè)途徑來(lái)實(shí)現(xiàn)語(yǔ)音識(shí)別模型的可定制性。一是用戶可以自己上傳語(yǔ)音識(shí)別模型到指定的文件夾下。由于本系統(tǒng)的語(yǔ)音識(shí)別環(huán)境是用HTK搭建的,而使用HTK生成語(yǔ)音識(shí)別模型有相對(duì)統(tǒng)一的規(guī)范。所以用戶可以使用HTK來(lái)錄制自己本領(lǐng)域的錄音訓(xùn)練樣本,并訓(xùn)練生成用來(lái)做語(yǔ)音識(shí)別的隱馬爾科夫模型,然后上傳到云端。當(dāng)用戶進(jìn)行語(yǔ)音識(shí)別時(shí),云端可根據(jù)用戶的IP地址找到其對(duì)應(yīng)文件夾下的語(yǔ)音識(shí)別模型進(jìn)行識(shí)別。二是用戶可以指定自己語(yǔ)音識(shí)別模型的識(shí)別范圍。當(dāng)使用語(yǔ)音識(shí)別模型進(jìn)行識(shí)別時(shí)只針對(duì)識(shí)別范圍內(nèi)的語(yǔ)音進(jìn)行加強(qiáng),從而逐步達(dá)到用戶對(duì)特定領(lǐng)域語(yǔ)音進(jìn)行識(shí)別的要求。

        4 實(shí)驗(yàn)評(píng)估

        實(shí)驗(yàn)室先前實(shí)現(xiàn)了1個(gè)C/S架構(gòu)的語(yǔ)音識(shí)別系統(tǒng)。下面做了2個(gè)實(shí)驗(yàn),一個(gè)是云架構(gòu)的語(yǔ)音識(shí)別系統(tǒng)和傳統(tǒng)的C/S架構(gòu)的語(yǔ)音識(shí)別系統(tǒng)進(jìn)行對(duì)比,證明云架構(gòu)的語(yǔ)音識(shí)別系統(tǒng)在用戶請(qǐng)求數(shù)較大時(shí)有更好的表現(xiàn);另一個(gè)是云架構(gòu)語(yǔ)音識(shí)別系統(tǒng)內(nèi)的對(duì)比,通過運(yùn)行不同的slave節(jié)點(diǎn)數(shù),證明云架構(gòu)語(yǔ)音識(shí)別系統(tǒng)具有一定的可擴(kuò)展性。由于錄音環(huán)節(jié),會(huì)花費(fèi)大量時(shí)間,且在錄音的過程中,云端和服務(wù)端都處于閑置狀態(tài),而本實(shí)驗(yàn)的主要目的是測(cè)試云端和服務(wù)端的性能。所以為了使云端和服務(wù)端一直運(yùn)行,達(dá)到性能極限,本實(shí)驗(yàn)去掉了錄音環(huán)節(jié),改為直接上傳已經(jīng)錄好的語(yǔ)音文件。

        4.1 實(shí)驗(yàn)環(huán)境

        為了驗(yàn)證SRSCC語(yǔ)音識(shí)別系統(tǒng)性能,本文選擇了4臺(tái)一般的PC機(jī)搭建了1個(gè)較小的Sector/Sphere云計(jì)算平臺(tái),詳細(xì)配置見表1。

        由表1可知,集群中部署了1個(gè)Security Server節(jié)點(diǎn),1個(gè)Master節(jié)點(diǎn),11個(gè)slave節(jié)點(diǎn)。對(duì)于C/S架構(gòu)的語(yǔ)音識(shí)別系統(tǒng)的服務(wù)器,本文選擇配置最高的PC1來(lái)充當(dāng)。

        表1 Sector/Sphere集群環(huán)境Table1 Sector/sphere cluster environment

        4.2 性能對(duì)比

        本實(shí)驗(yàn)主要對(duì)SRSCC語(yǔ)音識(shí)別系統(tǒng)和傳統(tǒng)的C/S架構(gòu)的語(yǔ)音識(shí)別系統(tǒng)進(jìn)行對(duì)比。所用實(shí)驗(yàn)數(shù)據(jù)為實(shí)驗(yàn)室人員錄制的12 000個(gè)菜名錄音文件。實(shí)驗(yàn)場(chǎng)景為每個(gè)系統(tǒng)有10個(gè)用戶連續(xù)上傳錄音文件,系統(tǒng)對(duì)錄音文件進(jìn)行處理,然后返回結(jié)果。通過改變用戶上傳的文件數(shù)量,來(lái)得到每個(gè)系統(tǒng)對(duì)不同數(shù)目請(qǐng)求的時(shí)間變化趨勢(shì)。然后對(duì)這種趨勢(shì)進(jìn)行對(duì)比,得出最終結(jié)論,具體結(jié)果見圖4。圖中橫軸為每個(gè)用戶上傳的文件數(shù),縱軸為總的處理時(shí)間(從上傳第一個(gè)文件,到最后一個(gè)文件返回結(jié)果)。TRA代表傳統(tǒng)C/S架構(gòu)的語(yǔ)音識(shí)別系統(tǒng),NCC代表云計(jì)算架構(gòu)的語(yǔ)音識(shí)別系統(tǒng),即SRSCC語(yǔ)音識(shí)別系統(tǒng)。由圖可知,雖然剛開始用戶請(qǐng)求量較少時(shí)兩者所用時(shí)間相差不大,但SRSCC語(yǔ)音識(shí)別系統(tǒng)的處理時(shí)間增長(zhǎng)速率要低于傳統(tǒng)服務(wù)器模式的語(yǔ)音識(shí)別系統(tǒng)。并且從圖中可以看出當(dāng)每個(gè)用戶的上傳量達(dá)到1 200個(gè)時(shí),傳統(tǒng)語(yǔ)音識(shí)別系統(tǒng)就遇到了性能瓶頸,時(shí)間增長(zhǎng)速率出現(xiàn)了拐點(diǎn)。可見看出云架構(gòu)的語(yǔ)音識(shí)別系統(tǒng)有效的推遲了拐點(diǎn)的到來(lái)。從而可以得出,SRSCC語(yǔ)音識(shí)別系統(tǒng)具有更好的性能,更有能力面對(duì)大用戶請(qǐng)求挑戰(zhàn),更符合語(yǔ)音識(shí)別的發(fā)展趨勢(shì)。

        4.3 節(jié)點(diǎn)數(shù)對(duì)性能的影響

        實(shí)驗(yàn)的數(shù)據(jù)集是12 000個(gè)錄音文件,并且只對(duì)這些錄音文件進(jìn)行簡(jiǎn)單的識(shí)別操作。圖5顯示的是識(shí)別這12 000個(gè)錄音文件所花費(fèi)的時(shí)間受集群節(jié)點(diǎn)數(shù)影響的情況。有圖5可知隨著節(jié)點(diǎn)數(shù)量的增加,識(shí)別這12 000個(gè)文件所花費(fèi)的時(shí)間在逐漸減少。雖然隨著節(jié)點(diǎn)的增加所用時(shí)間減少的速率逐步趨緩,但可以得出隨著數(shù)據(jù)集量的增加,可以通過增加節(jié)點(diǎn)數(shù)來(lái)提高語(yǔ)音系統(tǒng)的性能。這也從側(cè)面說(shuō)明了云計(jì)算架構(gòu)的語(yǔ)音識(shí)別系統(tǒng)具有一定的可擴(kuò)展性。

        圖4 傳統(tǒng)架構(gòu)和云計(jì)算架構(gòu)在語(yǔ)音識(shí)別上的性能對(duì)比Fig.4 Comparison between traditional architecture and cloud architecture in speech recognition

        圖5 集群節(jié)點(diǎn)數(shù)量的影響Fig.5 Effect of number of nodes

        5 結(jié)語(yǔ)

        本文結(jié)合 MapReduce編程模型,利用Sector/Sphere工具實(shí)現(xiàn)了SRSCC語(yǔ)音識(shí)別系統(tǒng),并給出了語(yǔ)音識(shí)別模型的可定制性方法。實(shí)驗(yàn)表明,SRSCC語(yǔ)音識(shí)別系統(tǒng)與傳統(tǒng)服務(wù)器模式的語(yǔ)音識(shí)別系統(tǒng)相比,具有更好的性能,更有能力面對(duì)大用戶請(qǐng)求所帶來(lái)的挑戰(zhàn)。并且該系統(tǒng)具有一定的可擴(kuò)展性。但本文所搭建的云計(jì)算系統(tǒng)規(guī)模較小,功能比較簡(jiǎn)單,下一步要完善系統(tǒng)的功能,擴(kuò)大系統(tǒng)規(guī)模,從而得到更好的結(jié)果。

        [1]Lee K F.Automatic Speech Recognition:The Development of the Sphinx System[M].Boston:Kluwer Academic Publishers,1989.

        [2]劉加.漢語(yǔ)大詞匯量連續(xù)語(yǔ)音識(shí)別系統(tǒng)研究進(jìn)展[J].電子學(xué)報(bào),2000,28(1):85-91.

        [3]方敏,浦劍濤.嵌入式語(yǔ)音識(shí)別系統(tǒng)的研究和實(shí)現(xiàn)[J].中文信息學(xué)報(bào),2004(6):73-75.

        [4]Michael Armbrust,Armando Fox,Rean Grith,et al.Above the clouds:A berkeley view of cloud computing[R].Technical Report UCB/EECS-2009-28,EECS Department,University of California,Berkeley,2009.

        [5]Dean J,Ghemawat S.MapReduce:Simplified data processing on large clusters[C].//Proc of the 6th Symp on Operating System Design and Implementation,Berkeley:USENIX Association,2004:137-150.

        [6]Robert Grossman,Yunhong Gu.Data Mining Using High Performance Data Clouds:Experimental Studies Using Sector and Sphere[C].SIGKDD 2008,Las Vegas:NV,2008.

        [7]Yunhong Gu,Li Lu,Robert Grossman,et al.Processing Massived Sized Graphs using Sector/Sphere,3rd Workshop on Many-Task Computing on Grids and Supercomputers[C].co-located with SC10,LA:New Orleans N,2010:15.

        [8]Yunhong Gu,Robert Grossman.Sector and Sphere:The design and implementation of a high performance data cloud[J].Theme Issue of the Philosophical Transactions of the Royal Society A:Crossing Boundaries:Computational Science,E-Science and Global E-Infrastructure,2009,v 367(1897):2429-2445.

        [9]Young S J,Evermann G,Gales M J F,et al.PC (2006)The HTK Book Version 3.4[M].Cambridge:Cambridge University Engineering Department,2006.

        [10]Dean J,Ghemawat S.Distributed Programming With MapReduce[M].//Oram A,Wilson G,eds.Beautiful Code,Sebastopol:O’Reilly Media Inc,2007:371-384.

        [11]Dean J,Ghemawat S.MapReduce:a flexible data processing tool[J].Communications of the ACM,2010,53(1):72-77.

        猜你喜歡
        架構(gòu)語(yǔ)音服務(wù)器
        基于FPGA的RNN硬件加速架構(gòu)
        功能架構(gòu)在電子電氣架構(gòu)開發(fā)中的應(yīng)用和實(shí)踐
        汽車工程(2021年12期)2021-03-08 02:34:30
        通信控制服務(wù)器(CCS)維護(hù)終端的設(shè)計(jì)與實(shí)現(xiàn)
        魔力語(yǔ)音
        基于MATLAB的語(yǔ)音信號(hào)處理
        電子制作(2019年14期)2019-08-20 05:43:38
        基于MQ3與MP3的價(jià)廉物美的酒駕語(yǔ)音提醒器
        電子制作(2019年9期)2019-05-30 09:42:10
        對(duì)方正在輸入……
        LSN DCI EVPN VxLAN組網(wǎng)架構(gòu)研究及實(shí)現(xiàn)
        得形忘意的服務(wù)器標(biāo)準(zhǔn)
        計(jì)算機(jī)網(wǎng)絡(luò)安全服務(wù)器入侵與防御
        国产精品综合一区久久| 亚洲女同精品一区二区久久| 五月天激情婷婷婷久久| 精品乱码卡1卡2卡3免费开放| 免费一级a毛片在线播出| 少妇深夜吞精一区二区| 精品亚洲一区二区三区四区五区 | 国产精品国产三级在线专区| 久久天堂精品一区二区三区四区 | 国产精品女直播一区二区| 成人午夜性a级毛片免费| 久久免费国产精品| 男女性搞视频网站免费| 中文字幕隔壁人妻欲求不满| 天天爽天天爽夜夜爽毛片| 日韩中文字幕欧美亚洲第一区| 国产精品亚洲av国产| 丝袜美腿亚洲综合一区| 又黄又爽又色视频| 丁香五香天堂网| 久久久久久久综合日本| 毛片精品一区二区二区三区| 一色桃子中文字幕人妻熟女作品 | 91久久精品一二三区蜜桃| 国产精品亚洲精品国产| 人妻少妇不满足中文字幕| 四虎欧美国产精品| 亚洲图文一区二区三区四区 | 中国丰满大乳乳液| caoporon国产超碰公开| 亚洲一区亚洲二区视频在线| 97午夜理论片影院在线播放| 久久99欧美| 亚洲码无人客一区二区三区| 一本无码中文字幕在线观| 女人色毛片女人色毛片18| 无码一区二区三区久久精品| 国产真实一区二区三区| 护士人妻hd中文字幕| 欧美日韩亚洲一区二区精品| 99蜜桃在线观看免费视频|