肖志健 南京樂韻瑞信息技術(shù)有限公司 喬紅巖 無錫韻茵信息科技有限公司
目前國內(nèi)的智能家電行業(yè)發(fā)展形態(tài)各異,有好有壞,普遍看到打著智能的稱號,并沒有帶來實(shí)際的用戶交互體驗(yàn)的改善。因此行業(yè)內(nèi)引進(jìn)了語音助手技術(shù),為智能家電行業(yè)帶來新的可能性。
語音助手是移動互聯(lián)網(wǎng)的一個配套功能,從手機(jī)、PC 為入口,慢慢延伸到各種弱電微系統(tǒng)中,將微機(jī)技術(shù)、網(wǎng)絡(luò)技術(shù)、通信技術(shù)、數(shù)字信號處理和云計(jì)算進(jìn)行結(jié)合,可以為人民提供語音交互方式的人機(jī)互動系統(tǒng),可以解放人們的雙手。由語音助手集成的智能家電能夠?qū)蛹噎h(huán)境帶來極大的便利,由此推動智能化的家居系統(tǒng)。
語音助手從性能上主要分為離線語音助手系統(tǒng),在線語音助手系統(tǒng)。離線語音助手依靠本地單芯片支持預(yù)制的部分指令,一般用在特定的應(yīng)用場景;在線語音助手依靠強(qiáng)大的云計(jì)算功能,一般用在復(fù)雜場景的交互上。
語音助手需要芯片和云計(jì)算的支持,在國內(nèi)外這塊業(yè)務(wù)提供的芯片公司、云服務(wù)公司相對較少,未能形成類似于手機(jī)芯片一樣的豐富選擇空間。并且目前缺少軟件+硬件交鑰匙的方案商,沒有大量的方案商愿意加入到這個行業(yè)中,去推這些語音助手在各個行業(yè)中的應(yīng)用,最終語音助手的落地會相對較困難。
語音助手的關(guān)鍵技術(shù)包含計(jì)算機(jī)科學(xué)和聲學(xué),要想在智能家電里面加入進(jìn)語音助手必須具備這2 項(xiàng)關(guān)鍵技術(shù),聲學(xué)部分的入門門檻相對高,所以這就限制了大部分想要進(jìn)入的行業(yè)公司。同時具備這2 項(xiàng)技術(shù)的公司又相對較少,并且聲學(xué)人才國內(nèi)外缺少嚴(yán)重。并且聲學(xué)需要特殊的實(shí)驗(yàn)室環(huán)境,實(shí)驗(yàn)設(shè)備動則10 多萬、幾十萬,所以聲學(xué)人才的培養(yǎng)相對困難 。
傳統(tǒng)的家電系統(tǒng)是通過單片機(jī)進(jìn)行控制,能做簡單的調(diào)節(jié)控制(例如:空調(diào),冰箱,全自動洗衣機(jī)),或者直接就是機(jī)械式的控制,依靠簡單的機(jī)械和電來控制(例如:機(jī)械式電飯煲,雙筒洗衣機(jī),機(jī)械式油煙機(jī))。這些設(shè)備有他的弊端,要么不能進(jìn)行定制式的修改,要么操作繁瑣,解放不了人們的雙手。而由語音助手技術(shù)進(jìn)行搭建的家電系統(tǒng)則體現(xiàn)出了非常大的優(yōu)勢,在人們一邊干活的時候只需要通過特定的指令就可以去觸發(fā)設(shè)備進(jìn)行特定的動作,實(shí)現(xiàn)全新的家居生活體驗(yàn)。
離線語音助手在功能上實(shí)現(xiàn)的相對較少,只能識別幾個到幾十個不等數(shù)量的關(guān)鍵字,語言上也只能用預(yù)制的一種或幾種語言,控制方式上也是固定的,識別環(huán)境要求相對比較嚴(yán)格。微電子部分硬件組成上一般是由麥克風(fēng)、語音識別芯片、功放芯片、喇叭等構(gòu)成,主要的費(fèi)用和研發(fā)事件都集中在語音識別芯片上,前期研發(fā)過程中需要進(jìn)行大量的關(guān)鍵詞的訓(xùn)練,并且提前預(yù)制這些關(guān)鍵詞到芯片中。就是這樣功能相對單一的語言助手,它的系統(tǒng)構(gòu)建成本較低,實(shí)現(xiàn)相對簡單,對于傳統(tǒng)的家電的生產(chǎn)企業(yè)來說,做一些簡單的技術(shù)改進(jìn)就可以嘗試用到新興的潮流技術(shù)。[2]例如:語音控制燈,語音控制插座,語音控制油煙機(jī)。例如:傳統(tǒng)方式上我們盡量將臥室的燈開關(guān)設(shè)計(jì)為雙開關(guān),并且一個開關(guān)還會盡量設(shè)計(jì)到床頭位置,對于一個睡覺來回翻滾的用戶,半夜起來找開關(guān)一定是特別痛苦的事情。如果使用離線語音燈控,只要設(shè)備供電狀態(tài)下,只要要簡單的來一句“XXX,開燈”就可以實(shí)現(xiàn)效果。因此離線語音助手在傳統(tǒng)家電的改善上起到很大的作用,對人們的生活便捷性進(jìn)行了提升。
不同于離線語音助手,在線語音助手更多的是依靠隱藏在網(wǎng)絡(luò)后面的云計(jì)算--看不見的大腦。它更多的關(guān)注于用的交互和體驗(yàn)上,它本身沒有關(guān)鍵詞的識別限制,可以說只要是能在搜索引擎里面找的內(nèi)容都可以通過在線語音助手來進(jìn)行互動交流。所以在最初設(shè)計(jì)的時候,在終端方面需要考慮聲學(xué)問題,要達(dá)到能正確識別用戶在講什么的效果;在云端方面需要有一套好的“大腦”能理解用戶的所講出來的詞并且思考后做出優(yōu)化的反饋。[3]例如:在冰箱上的語音助手系統(tǒng),用戶要吃水餃發(fā)現(xiàn)冰箱沒有肉了,用戶可以躺在沙發(fā)上對著冰箱說“XX,幫我在小區(qū)YY 店訂購1kg 五花肉送到家里來”,那么首先冰箱上的語音助手要準(zhǔn)確識別出用戶所講內(nèi)容,然后完整發(fā)給后臺“大腦”,由“大腦”連接用戶的賬號并安排下單。用戶只要等著接受賬單和五花肉。
我國目前的智能家電行業(yè)發(fā)展迅速,智能語音助手技術(shù)將會越來越多的應(yīng)用到智能化家電行業(yè)當(dāng)中來,在未來的系統(tǒng)集成方面具有非常重要的地位,智能家電也將為人們的生活帶來更多的便捷,但是目前語音助手技術(shù)的發(fā)展還存在著一些短板,因此更要不斷的對語音助手技術(shù)進(jìn)行更加深入的研究,開發(fā)更加合理、優(yōu)化便于應(yīng)用的語音助手全套方案,并且進(jìn)行產(chǎn)業(yè)生態(tài)鏈的完善,讓語音助手技術(shù)助力智能家電提升人們的生活質(zhì)量。