毛躍輝
珠海格力電器股份有限公司 廣東珠海 519070
語音是人類交流最自然、最便捷的方式,因而也必然成為人機(jī)交互最自然的手段之一。常規(guī)空調(diào)搭載傳聲器陣列、語音模組、音箱等器件,并組成語音控制系統(tǒng),用于空調(diào)控制和人機(jī)交互,此類空調(diào)稱之為語音空調(diào)。語音空調(diào)人機(jī)交互技術(shù)包括前端聲學(xué)處理、語音識(shí)別(ASR)、語義理解(NLU)和語音合成(TTS)等,其中前端聲學(xué)處理尤為重要,是語音識(shí)別的先決條件。語音空調(diào)聲學(xué)處理主要包括前端聲學(xué)件(傳聲器陣列)設(shè)計(jì)及前端識(shí)別降噪處理(語音模組),聲學(xué)件設(shè)計(jì)的好壞,直接影響前端降噪效果,進(jìn)而影響語音音頻轉(zhuǎn)文本效果。
本文重點(diǎn)論述前端聲學(xué)件傳聲器陣列的設(shè)計(jì)選型方法、布放位置及相關(guān)整機(jī)工程應(yīng)用設(shè)計(jì)注意要點(diǎn),便于后續(xù)指導(dǎo)相應(yīng)語音產(chǎn)品開發(fā)。
消費(fèi)級(jí)傳聲器陣列應(yīng)用,主要面臨環(huán)境噪聲、房間混響、人聲疊加、模型噪聲、陣列結(jié)構(gòu)等問題,若應(yīng)用到語音識(shí)別場(chǎng)景,需要考慮陣列結(jié)構(gòu)與整機(jī)匹配、密封性,陣列與音箱的相對(duì)位置、空調(diào)內(nèi)部振動(dòng),以及避免振動(dòng)對(duì)傳聲器陣列干擾等問題。良好的聲學(xué)設(shè)計(jì)能保證傳聲器陣列采音質(zhì)量,有利于降噪算法處理。
圖1 語音信號(hào)處理流程圖
前端信號(hào)處理流程如圖1所示,從圖中可知,傳聲器陣列聲學(xué)處理處于十分重要的位置,其采音效果好壞,直接影響信號(hào)處理中回聲以及混響消除結(jié)果;其次,音箱發(fā)聲時(shí),信號(hào)通過空調(diào)內(nèi)部腔體傳播后直接傳輸?shù)絺髀暺麝嚵刑?,其與通過外部傳輸?shù)膫鬏斣肼暣嬖陲@著差異,影響回聲消除效果;另外,空調(diào)內(nèi)部振動(dòng)傳聲,也會(huì)影響語音空調(diào)喚醒與識(shí)別效果,且很難通過后期信號(hào)處理算法進(jìn)行消除,此點(diǎn)在設(shè)計(jì)時(shí)需做規(guī)避。
空調(diào)中主要運(yùn)動(dòng)部件包括壓縮機(jī)、電機(jī)、導(dǎo)風(fēng)板等,該部件在運(yùn)轉(zhuǎn)過程中會(huì)產(chǎn)生各種機(jī)械振動(dòng)及噪聲,空調(diào)上的傳聲器陣列在采集聲信號(hào)過程中,同時(shí)會(huì)采集這些干擾噪聲,將對(duì)信號(hào)處理、語音識(shí)別等過程帶來不利影響。為減弱這些干擾,需要綜合考慮傳聲器陣列拓?fù)浣Y(jié)構(gòu)設(shè)計(jì)、音箱布放位置對(duì)陣列影響、陣列與整機(jī)密封性匹配、內(nèi)部振動(dòng)影響陣列等多種因素。合理的聲學(xué)結(jié)構(gòu)設(shè)計(jì)能有效改善陣列陣元采音質(zhì)量,從源頭上降低噪聲干擾,從而降低降噪算法信號(hào)處理復(fù)雜度。
陣列選型設(shè)計(jì)時(shí)需注意:
(1)避免大音量時(shí)語音失真和回采音箱音量時(shí)被截幅,傳聲器最大錄音聲壓需要相應(yīng)提高。
(2)總諧波失真要盡量小,可參照工程經(jīng)驗(yàn)值:100 Hz~200 Hz,總諧波失真<10%;200 Hz~350 Hz,總諧波失真<5%;350 Hz以上,總諧波失真<3%。
(3)傳聲器本身引入噪聲對(duì)信號(hào)質(zhì)量有影響,必須保證高信噪比,一般選擇SNR≥67 dB。
(4)有效采樣比特位數(shù)優(yōu)先考慮選擇不小于16 bit陣元為宜。
(5)同一傳聲器陣列中選用的陣元均需采用同一檔位靈敏度及其公差,保證陣元電性能參數(shù)一致性。
(6)設(shè)計(jì)中要求拾音孔深度≤1.5 mm,拾音孔直徑盡可能大,最小要求2 mm;均勻線性陣列采用緊貼面板安裝方式,參照如圖2所示。
圖2 掛式空調(diào)線性陣列設(shè)計(jì)示意圖
(7)振動(dòng)對(duì)傳聲器陣列陣元拾音影響。當(dāng)音箱播放音量超出其線性發(fā)聲區(qū)域而引起結(jié)構(gòu)上振動(dòng),或由于內(nèi)部隔聲效果不佳導(dǎo)致振音由內(nèi)部結(jié)構(gòu)被陣列陣元采集,而不是通過外部聲學(xué)路徑傳輸,此時(shí)會(huì)導(dǎo)致傳聲器陣列采音質(zhì)量明顯受到影響,對(duì)后續(xù)信號(hào)處理、語音識(shí)別等過程造成嚴(yán)重干擾。
以AEC處理為例,內(nèi)部直接傳導(dǎo)振音強(qiáng)、弱對(duì)其處理效果影響是十分明顯的。如圖3、圖4所示,在同樣信號(hào)回聲比情形下,較強(qiáng)和較弱振動(dòng)直接傳導(dǎo)的算法前后處理效果對(duì)比。從圖3分析,振動(dòng)殘余會(huì)對(duì)AEC算法造成影響,有若干頻帶振動(dòng)分量的明顯殘余(人耳聽會(huì)有明顯的刺拉聲),進(jìn)而影響后端各項(xiàng)處理,此時(shí),需要在結(jié)構(gòu)設(shè)計(jì)時(shí)加以規(guī)避,圖4為經(jīng)過減振優(yōu)化后效果。
人為因子 是指人類在對(duì)植物資源的利用、改造和破壞過程中給植物帶來的有利或有害影響。這是一類特殊的因子,因?yàn)槿祟悓?duì)植物的作用是有意識(shí)的和有目的的,所以具有無限的支配力。
圖3 較強(qiáng)振動(dòng)直接傳導(dǎo)AEC算法處理前后效果對(duì)比
圖4 較弱振動(dòng)直接傳導(dǎo)AEC算法處理前后效果對(duì)比
對(duì)于振動(dòng)的影響,采用膠套進(jìn)行減振密封處理,一般采用硅材質(zhì),硅膠軟硬程度可根據(jù)實(shí)際結(jié)構(gòu)契合度進(jìn)行匹配調(diào)整,要求盡可能軟,便于起到良好的減振作用。
(8)陣列拓?fù)浣Y(jié)構(gòu)外聲音能以接近自由場(chǎng)方式直接到達(dá)每一個(gè)陣元,避免出現(xiàn)掩蔽效應(yīng)。陣元外表面要充分透聲,不能有聲反射區(qū)形成,可用阻尼布等材料覆蓋表面設(shè)計(jì),防水透聲同時(shí)可避免反射形成。
(9)陣列設(shè)計(jì)時(shí)要考慮陣元各拾音孔腔之間的獨(dú)立性,確保每個(gè)陣元孔腔是唯一進(jìn)聲孔。開發(fā)中可以采用簡(jiǎn)易方法進(jìn)行定性驗(yàn)證,即用手按住陣元拾音孔,拾音音量減小值≥10 dB。圖5為雙傳聲器陣列安裝時(shí)聲腔內(nèi)部與陣元之間結(jié)構(gòu)配合示意圖。
圖5 均勻線陣雙傳聲器陣列陣元與面板安裝方式結(jié)構(gòu)示意圖
(10)陣列與安裝位置面板間密封性匹配。傳聲器陣列陣元采用全向,空調(diào)運(yùn)行中將無法避免產(chǎn)生各種自噪聲,且被傳聲器陣列所采集,此類噪聲要加以規(guī)避。為此,需要進(jìn)一步對(duì)傳聲器拾音孔以外的部位進(jìn)行密封,保證人聲拾音僅由拾音孔通道進(jìn)入,而不去采集空調(diào)內(nèi)部的聲音,降低結(jié)構(gòu)內(nèi)部傳聲帶來的強(qiáng)干擾。
傳聲器陣列通常安裝于室內(nèi)機(jī)殼體內(nèi)部,并在表面開孔以進(jìn)行拾音。針對(duì)特定空調(diào)結(jié)構(gòu),需確定其主要噪聲(如蒸發(fā)器液流聲、電機(jī)運(yùn)轉(zhuǎn)聲等)和振動(dòng)異響(如面殼接合處不嚴(yán)所造成的摩擦等)的來源,并將傳聲器陣列布放在遠(yuǎn)離這些干擾源位置,同時(shí)輔以相應(yīng)隔音措施。圖6為掛式空調(diào)傳聲器陣列布放位置選擇示意圖。
圖6中示例的幾種陣列布放方式共同遵循原則:遠(yuǎn)離出風(fēng)口、振動(dòng)噪聲源以及音箱位置,便于獲得較高信號(hào)回聲比和良好聲學(xué)回聲抵消效果。
圖6 掛式空調(diào)傳聲器陣列安裝位置
圖6中左圖所示結(jié)構(gòu)相對(duì)遠(yuǎn)離空調(diào)內(nèi)機(jī)最大干擾源(出風(fēng)口),同時(shí)距離音箱(音箱位于左上角)擺放位置較遠(yuǎn),其拾音信噪比和信號(hào)回聲比相對(duì)較高,是一個(gè)較好的傳聲器陣列布放位置??紤]外觀效果,傳聲器陣列拾音需要在面板開孔,且開孔難以很好隱蔽,從而導(dǎo)致空調(diào)整體造型會(huì)受到影響。因而,在實(shí)施過程中,需要同步考慮將傳聲器陣列放置在出風(fēng)口底殼附近且出風(fēng)口下部(中圖方框示意)或底殼最底部(右圖方框示意)位置。
圖7 立式空調(diào)傳聲器陣列與音箱典型布放位置示意圖
如圖8,通過對(duì)傳聲器陣列和音箱在空調(diào)內(nèi)部模擬聲音泄露路徑分析,兩者布放設(shè)計(jì)要點(diǎn)總結(jié)如下:
(1)音箱結(jié)構(gòu)設(shè)計(jì)要避免引發(fā)失真,安裝及周圍關(guān)聯(lián)位置要進(jìn)行減振、隔聲處理,避免振動(dòng)對(duì)陣列造成影響;
(2)避免結(jié)構(gòu)內(nèi)聲音傳播,即音箱聲音不能在結(jié)構(gòu)內(nèi)直接泄露到陣列陣元處,只能通過結(jié)構(gòu)外空氣傳播至陣元。音箱和陣列布放在不同腔體,選用較好密封材料,單獨(dú)對(duì)傳聲器陣列進(jìn)行密封隔離;
(3)150 Hz~7 kHz頻率范圍的THD優(yōu)先考慮在1%以下,具體可結(jié)合工程應(yīng)用做實(shí)際調(diào)整。
圖8 空調(diào)內(nèi)部模擬聲音泄露傳播路徑圖
目前空調(diào)頭部基本為弧面結(jié)構(gòu),導(dǎo)致陣列適應(yīng)結(jié)構(gòu)設(shè)計(jì)也呈弧面形式,易出現(xiàn)某些邊界角度喚醒、識(shí)別明顯弱于說話人正面水平識(shí)別,主要原因有:
(1)傳聲器陣列安裝時(shí)與面板弧面拾音孔契合度不好,漏音,導(dǎo)致拾音不集中;
(2)傳聲器陣列各陣元間靈敏度存在較大差異,一致性不夠;
(3)結(jié)構(gòu)本身限制,對(duì)傳聲器陣列形成了遮擋或拾音孔位置偏離,影響陣元整體拾音。
對(duì)于上述影響因素,在陣列設(shè)計(jì)之初,注意陣元參數(shù)一致性,陣列拓?fù)浣Y(jié)構(gòu)選型以及裝配時(shí)與結(jié)構(gòu)契合度等多種保障措施協(xié)調(diào)配合。
以某款掛式語音空調(diào)為例進(jìn)行整機(jī)聲學(xué)工程試驗(yàn)驗(yàn)證,關(guān)鍵試驗(yàn)項(xiàng)有:①設(shè)備自身MIC錄音,REF信號(hào)幅值,REF信道底噪試驗(yàn);②REF和MIC錄音通道延時(shí)試驗(yàn);③MIC頻響曲線試驗(yàn);④MIC的總諧波失真(THD)試驗(yàn);⑤音箱總諧波失真(THD)試驗(yàn)。通過上述試驗(yàn),并結(jié)合實(shí)際語音識(shí)別性能(喚醒率、識(shí)別率、誤喚醒)測(cè)試,驗(yàn)證本文提出設(shè)計(jì)方法和關(guān)鍵技術(shù)要點(diǎn)可行性,試驗(yàn)效果如下(以下序號(hào)分別對(duì)應(yīng)上述試驗(yàn)項(xiàng)):
(1)不播放任何聲音,空調(diào)自身MIC錄音,REF信號(hào)幅值應(yīng)該為0 smpl,REF信道的底噪設(shè)計(jì)要求<100 Hz,相應(yīng)測(cè)試結(jié)果如圖9所示,基本趨于無信號(hào)。
(2)REF和MIC錄音通道延時(shí)設(shè)計(jì)要求<10 ms,如圖10所示,驗(yàn)證結(jié)果為2 ms。
(3)傳聲器頻響曲線(FR)測(cè)試,在200 Hz~1 kHz時(shí),測(cè)試差值為±1.7和±2.3;在1 kHz-8 kHz時(shí),測(cè)試差值為±4.4和±4.6,如圖11所示。
(4)傳聲器的總諧波失真(THD),設(shè)計(jì)要求在200 Hz~8 kHz時(shí),小于0.5%,目前測(cè)試結(jié)果分別為0.6%和0.52%,如圖12所示,略微超出設(shè)計(jì)要求,后續(xù)需要結(jié)合實(shí)際語音識(shí)別性能進(jìn)行綜合判斷。
圖9 空調(diào)MIC錄音時(shí)REF信號(hào)幅值
圖10 REF和MIC錄音通道延時(shí)
(5)音箱總諧波失真(THD),設(shè)計(jì)要求在100 Hz~200 Hz時(shí),THD<10%;在200 Hz~350 Hz時(shí),THD<5%;350 Hz以上時(shí),THD<3%,測(cè)試結(jié)果僅在4 kHz處有超標(biāo),測(cè)試結(jié)果為8.4%,如圖13所示,后續(xù)結(jié)合實(shí)際識(shí)別性能進(jìn)行綜合判斷。
通過對(duì)語音空調(diào)傳聲器陣列設(shè)計(jì)研究分析,提出設(shè)計(jì)方法和關(guān)鍵技術(shù)注意要點(diǎn),并在項(xiàng)目實(shí)施中經(jīng)過一系列工程試驗(yàn)驗(yàn)證,得到較好效果,總結(jié)傳聲器陣列設(shè)計(jì)和確認(rèn)步驟如下:
針對(duì)傳聲器陣列進(jìn)行設(shè)計(jì)選型評(píng)價(jià)。主要對(duì)傳聲器陣列、音箱聲學(xué)結(jié)構(gòu)設(shè)計(jì)評(píng)估,便于確認(rèn)陣元選型和陣列拓?fù)錁?gòu)型,明確陣列與聲腔及安裝結(jié)構(gòu)間匹配度,確認(rèn)陣列拾音孔深度和直徑大??;其次,確認(rèn)音箱選型、音箱構(gòu)型、出聲孔直徑和數(shù)量,確認(rèn)陣列與音箱布放相對(duì)位置。
進(jìn)行首次快速摸底測(cè)試評(píng)價(jià)。計(jì)算陣元和帶聲腔結(jié)構(gòu)傳聲器陣列之間錄音的諧波程度、密封性驗(yàn)證情況等,根據(jù)分析結(jié)果確定是否通過摸底測(cè)試。
系統(tǒng)性試驗(yàn)最終驗(yàn)收評(píng)價(jià)。針對(duì)試制機(jī)子進(jìn)行綜合指標(biāo)測(cè)試,包含陣元和陣列密封性、REF信號(hào)幅值、REF信道底噪、REF和陣元錄音通道延時(shí)、陣元頻響曲線、陣元總諧波失真(THD)、音箱總諧波失真(THD)試驗(yàn),確認(rèn)最終設(shè)計(jì)評(píng)價(jià)是否通過。
通過上述評(píng)價(jià)并結(jié)合語音識(shí)別性能試驗(yàn)測(cè)試,整體識(shí)別率達(dá)到95%以上,最終通過產(chǎn)品應(yīng)用確認(rèn),所設(shè)計(jì)的傳聲器陣列符合產(chǎn)品要求,可保證產(chǎn)品性能可靠性,滿足用戶使用要求。
圖11 傳聲器頻響曲線(FR)測(cè)試曲線
圖12 傳聲器總諧波失真(THD)測(cè)試曲線
圖13 音箱總諧波失真(THD)測(cè)試曲線