鄧城 張欽鋒 詹宏林 麥強(qiáng)
摘要:針對會議中采用的同聲傳譯系統(tǒng)存在設(shè)備鋪設(shè)麻煩,信號受到干擾重疊或用戶數(shù)量有限等問題,根據(jù)會議同聲傳譯系統(tǒng)在室內(nèi)使用的特點(diǎn),提出利用照明LED光源進(jìn)行可見光通信來實(shí)現(xiàn)信號的傳輸。綜合利用,STC單片機(jī)、LED驅(qū)動電路,LED燈、光電傳感器,藍(lán)牙模塊和樹莓派等硬件模塊,通過科大訊飛開放平臺進(jìn)行語音識別、轉(zhuǎn)寫、機(jī)器翻譯,實(shí)現(xiàn)了中英同聲傳譯功能。通過實(shí)驗(yàn)對系統(tǒng)可靠性進(jìn)行了驗(yàn)證,系統(tǒng)能夠準(zhǔn)確進(jìn)行語音翻譯,并通過LED燈將信息發(fā)送至接收端,完成同聲傳譯功能。
關(guān)鍵詞:LED可見光通信;機(jī)器翻譯;語音合成
中圖分類號:TN929 文獻(xiàn)標(biāo)識碼:A 文章編號:1007-9416(2019)11-0025-02
0 引言
隨著國際文化交流日益頻繁,各國語言存在差異,翻譯人員的需求劇增,而人工智能的高速發(fā)展,機(jī)器翻譯的準(zhǔn)確率越來越高,利用語音轉(zhuǎn)寫與機(jī)器翻譯可以實(shí)現(xiàn)同聲傳譯的功能。
目前會議采用的無線同聲傳譯系統(tǒng)的通信方式主要有紅外輻射式、藍(lán)牙傳輸式和射頻發(fā)射式。但由于在會場場地限制下,存在著安裝、調(diào)試很不方便,R容易被干擾,無法大量用戶同時使用等問題。
本文根據(jù)同聲傳譯會議系統(tǒng)的特點(diǎn)和應(yīng)用范圍,提出利用會場照明LED燈進(jìn)行通信的新方式,設(shè)計(jì)一套采用LED可見光通信技術(shù)的會場同聲傳譯系統(tǒng)。利用科大訊飛平臺,實(shí)現(xiàn)人工智能同聲傳譯,減少了對翻譯人員的依賴,并用了LED可見光通信技術(shù),通過LED燈光進(jìn)行高頻閃爍,進(jìn)行數(shù)據(jù)的傳輸。因?yàn)殚W爍頻率高,人眼無法識別,所以LED燈在正常照明的同時,還是實(shí)現(xiàn)了通信的功能。同時用戶只需要在燈光能照到的地方就可以接收到信號,實(shí)現(xiàn)了大用戶量實(shí)時通信,參會人數(shù)不受限制,可廣泛應(yīng)用于各種會議現(xiàn)場,具有一定市場前景。
1 系統(tǒng)工作原理與設(shè)計(jì)方案
1.1 系統(tǒng)工作原理
基于LED可見光通信的中英同聲傳譯系統(tǒng)是發(fā)言人通過麥克風(fēng)說完一句話后,翻譯器會將發(fā)言的語音翻譯成中文或者英文的文本,并通過無線通信發(fā)送至?xí)h室頂端的LED燈具,再以二進(jìn)制形式通過LED燈光發(fā)送。聽眾戴上安裝有接收器的耳機(jī),在會場LED燈光照射范圍內(nèi)就可以接收到信號,通過接收器解碼和語音合成后還原出中文或者英文的語音信號,并利用按鍵來選擇播放中文或者英文。
系統(tǒng)工作原理示意圖如圖1所示,主要由語音采集及人工智能翻譯,LED可見光通信信號發(fā)射,光信號接收與語音播放三個部分構(gòu)成。
語音采集及人工智能翻譯的工作原理是基于科大訊飛開放平臺進(jìn)行語音翻譯,通過麥克風(fēng)接收語音信號,將語音信號轉(zhuǎn)換為文本,再通過機(jī)器翻譯轉(zhuǎn)換為對應(yīng)的中英文本。
LED可見光通信信號發(fā)射的工作原理是通過微控制芯片來控制LED燈,以每秒數(shù)百萬次的閃爍,其中燈亮代表1,燈滅代表0。將文本以二進(jìn)制形式編碼調(diào)制成燈光信號,從而進(jìn)行有效的中文和英文的文本傳輸了。
光信號接收與語音播放的工作原理是通過光電傳感器接收LED燈的光信號,并將光信號轉(zhuǎn)換為電信號,經(jīng)過信號處理后,進(jìn)行語音合成播放。
1.2 系統(tǒng)設(shè)計(jì)方案
根據(jù)系統(tǒng)的工作原理,將系統(tǒng)框架分成了語音處理與翻譯端、LED可見光通信發(fā)射端,光信號接收與播放端,如圖2所示。
語音處理與翻譯端是通過樹莓派3B+將麥克風(fēng)的語音信號錄制為WAV格式,并將音頻文件上傳至科大訊飛開放平臺,通過平臺將語音轉(zhuǎn)換為文本,再將文本進(jìn)行機(jī)器翻譯為目標(biāo)語言文本,最后通過藍(lán)牙將文本發(fā)送LED燈具。
LED可見光通信發(fā)射端是通過藍(lán)牙模塊接收語音處理與翻譯端的文本信息后,利用單片機(jī)進(jìn)行編碼,并通過驅(qū)動電路將信息調(diào)制到LED燈光進(jìn)行發(fā)射。
光信號接收與播放端是通過PIN光電二極管將LED燈光信號轉(zhuǎn)換為電信號,再進(jìn)行IV轉(zhuǎn)換放大比較處理,通過單片機(jī)進(jìn)行解碼,并將用戶選擇的語言文本送到訊飛SX-TTSCv4.0語音合成模塊進(jìn)行語音合成播放。
2 系統(tǒng)軟件設(shè)計(jì)
2.1 語音翻譯處理流程
語音翻譯部分主要流程如圖3所示,首先樹莓派初始化,掃描錄音按鍵,判斷錄音鍵是否按下,如果按下開始錄音,反之繼續(xù)判斷。錄音完成后,判斷按鍵1(中文轉(zhuǎn)英文)和按鍵2(英文轉(zhuǎn)中文)是否按下,如果按下開始轉(zhuǎn)換并從串口發(fā)送數(shù)據(jù),反之就繼續(xù)錄音直到按鍵按下后結(jié)束(最長時間為1分鐘)。
2.2 語音轉(zhuǎn)寫處理流程
語音轉(zhuǎn)寫流程圖如圖4所示,首先調(diào)用預(yù)處理接口,上傳音頻文件的基本信息、分片信息及相關(guān)的可配置參數(shù)。調(diào)用成功,返回任務(wù)ID。預(yù)處理成功,調(diào)用文件上傳接口。
按預(yù)處理設(shè)置的分片信息依次上傳音頻切片,直到全部切片上傳成功;上一切片成功上傳,才可進(jìn)行下一切片的上傳操作。調(diào)用過程中若出現(xiàn)異常,可重試若干次。
全部文件切片上傳成功后,調(diào)用該接口,通知服務(wù)端進(jìn)行文件合并與轉(zhuǎn)寫操作。該接口不會返回轉(zhuǎn)寫結(jié)果,而是通知服務(wù)端將任務(wù)列入轉(zhuǎn)寫計(jì)劃。轉(zhuǎn)寫的結(jié)果通過getResult接口獲取。
2.3 機(jī)器翻譯處理流程
機(jī)器翻譯流程圖如圖5所示,首先通過接口密鑰基于hamc-sha256計(jì)算簽名,將簽名以及其他參數(shù)放在Http Request Header中,請求參數(shù)以及圖片數(shù)據(jù)放在Http Request Body中,以POST表單的形式提交,向服務(wù)器端發(fā)送Http請求后,接收服務(wù)器端的返回結(jié)果。
3 系統(tǒng)測試分析
為了驗(yàn)證發(fā)送端串口通過LED燈光發(fā)送的數(shù)據(jù)與接收端接收的數(shù)據(jù)是否一致,采用示波器測試發(fā)送端的串口發(fā)送數(shù)據(jù)的波形,再與接收端發(fā)送到科大訊飛語音芯片上的波形進(jìn)行對比,并且通過擴(kuò)音器來驗(yàn)證播放的語音。如圖6所示,為發(fā)送和接收端的示波器波形圖,可以發(fā)現(xiàn)發(fā)送端與接收端的數(shù)據(jù)波形是一致的,而且語音合成芯片成功播報(bào)出對應(yīng)的語音。
4 結(jié)語
本設(shè)計(jì)方案提出了一種能應(yīng)用于室內(nèi)會議場所的同聲傳譯系統(tǒng),該系統(tǒng)通過LED可見光通信進(jìn)行數(shù)據(jù)通信,解決了現(xiàn)有系統(tǒng)安裝調(diào)試麻煩,用戶數(shù)量有限的問題。通過對系統(tǒng)的工作原理分析,設(shè)計(jì)了一套完整的系統(tǒng)方案和系統(tǒng)軟件。通過實(shí)驗(yàn)驗(yàn)證了收發(fā)數(shù)據(jù)的一致性,該方案可以有效完成中英翻譯播放功能,并且實(shí)現(xiàn)了LED兼顧照明的同時完成通信功能,具有一定的市場應(yīng)用價值。
參考文獻(xiàn)
[1] 麥強(qiáng),卓惠佳,廖曉琳,劉洋.可見光通信調(diào)光技術(shù)研究[J].中國新通信,2018,20(24):16-18.
[2] 于正永,唐萬春.一種全雙工VLC無線導(dǎo)覽系統(tǒng)的設(shè)計(jì)及實(shí)現(xiàn)[J].無線光通信,2017(10):37-41.
[3] 王浪.室內(nèi)可見光通信LEDs選擇及調(diào)制技術(shù)的研究[D].長春:吉林大學(xué),2017.