◎科大訊飛股份有限公司董事長(zhǎng) 劉慶峰
讓世界聆聽(tīng)我們的聲音
◎科大訊飛股份有限公司董事長(zhǎng) 劉慶峰
當(dāng)下,萬(wàn)物互聯(lián)的物聯(lián)網(wǎng)時(shí)代正在到來(lái)。以手機(jī)為標(biāo)志的移動(dòng)互聯(lián)網(wǎng)作為IT產(chǎn)業(yè)發(fā)展的第五次浪潮,正在洶涌澎湃地向著穿戴設(shè)備、智能家居、車聯(lián)網(wǎng)等方向發(fā)展。這是未來(lái)經(jīng)濟(jì)科技發(fā)展最大的風(fēng)口,已成為產(chǎn)業(yè)界的共識(shí)。未來(lái)三到五年內(nèi),物聯(lián)網(wǎng)將在全世界掀起新的產(chǎn)業(yè)浪潮。在無(wú)屏、移動(dòng)和遠(yuǎn)場(chǎng)狀態(tài)下,以語(yǔ)音為主,鍵盤、觸摸為輔的人機(jī)交互時(shí)代正在來(lái)臨。
從DOS到Windows,成就了微軟;蘋果則通過(guò)把觸屏交互做到極致,成為了全球最值錢的公司。然而,產(chǎn)業(yè)發(fā)展的下一步是以語(yǔ)音為主的交互時(shí)代。作為亞太地區(qū)最大的語(yǔ)音和人工智能公司,今天的科大訊飛正緊緊抓住這樣的大勢(shì)與機(jī)遇,努力成就更大的事業(yè)。
智能語(yǔ)音產(chǎn)業(yè)是一個(gè)高門檻的核心技術(shù)領(lǐng)域??拼笥嶏w在1999年創(chuàng)業(yè)之初,得到了微軟研究院院長(zhǎng)、國(guó)內(nèi)語(yǔ)音領(lǐng)域?qū)<?,以及有關(guān)政府部門和產(chǎn)學(xué)研界的大力支持,給予了很多很好的指導(dǎo)和建議,為科大訊飛的發(fā)展壯大提供了巨大的幫助。
2000年以前,中國(guó)智能語(yǔ)音市場(chǎng)全由國(guó)際巨頭控制。后來(lái),通過(guò)產(chǎn)學(xué)研合作,科大訊飛這樣一個(gè)由在校大學(xué)生創(chuàng)建的智能語(yǔ)音公司逐漸發(fā)展成為亞太地區(qū)最大的語(yǔ)音和人工智能上市公司,搶占了包括公安、電信等領(lǐng)域的主流市場(chǎng)80%的份額,民用市場(chǎng)如移動(dòng)互聯(lián)網(wǎng)領(lǐng)域60%的份額。這就是產(chǎn)學(xué)研創(chuàng)新體系發(fā)揮的重大作用。
智能語(yǔ)音交互包含三項(xiàng)關(guān)鍵技術(shù):一是語(yǔ)音合成,即把文字轉(zhuǎn)換成語(yǔ)音,讓機(jī)器開(kāi)口說(shuō)話;二是語(yǔ)音識(shí)別,即把語(yǔ)音轉(zhuǎn)換成文字,讓機(jī)器聽(tīng)懂人說(shuō)話,甚至能夠通過(guò)聲紋識(shí)別,分辨出說(shuō)話人的身份特征;三是智能語(yǔ)音交互系統(tǒng)要有會(huì)思考的“大腦”,讓機(jī)器不僅能聽(tīng)會(huì)說(shuō),還要能思考、會(huì)預(yù)測(cè)。
當(dāng)前,科大訊飛的智能語(yǔ)音技術(shù)發(fā)展迅速,已在語(yǔ)音合成、語(yǔ)音識(shí)別、口語(yǔ)評(píng)測(cè)、自然語(yǔ)言處理等多項(xiàng)技術(shù)上擁有國(guó)際領(lǐng)先的成果。首先是語(yǔ)音合成。按照當(dāng)前國(guó)際語(yǔ)音合成大賽的評(píng)分標(biāo)準(zhǔn),5.0分是專業(yè)的播音員水平,普通人說(shuō)話可以達(dá)到4.0分,基礎(chǔ)門檻是3.0分。在1998年,科大訊飛的語(yǔ)音合成系統(tǒng)得分就已達(dá)到3.0分,今天則達(dá)到了4.5分,合成的語(yǔ)音非常清晰流暢。
2006年,科大訊飛語(yǔ)音合成系統(tǒng)參加國(guó)際語(yǔ)音合成領(lǐng)域級(jí)別最高的Blizzard Challenge大賽,首次參賽即奪得冠軍,從2006到2013年,科大訊飛語(yǔ)音合成系統(tǒng)連續(xù)8年在國(guó)際語(yǔ)音合成比賽中獲得第一。2012年,科大訊飛語(yǔ)音合成系統(tǒng)讓計(jì)算機(jī)讀英語(yǔ)首次超過(guò)人類一般水平(4.0分)。2014年,國(guó)際語(yǔ)音合成比賽由合成英語(yǔ)改為合成印地語(yǔ),科大訊飛依然超過(guò)印度人、美國(guó)人,再次奪冠。在語(yǔ)音識(shí)別領(lǐng)域,NIST國(guó)際評(píng)測(cè)大賽是國(guó)際上規(guī)模最大、影響力最廣泛的評(píng)測(cè)比賽??拼笥嶏w自2008年開(kāi)始分別參加了說(shuō)話人識(shí)別和語(yǔ)種識(shí)別評(píng)測(cè)比賽。在說(shuō)話人識(shí)別比賽上,科大訊飛榮獲2008年說(shuō)話人識(shí)別評(píng)測(cè)大賽全球第一名,榮獲2010年核心測(cè)試綜合評(píng)價(jià)第二名;在語(yǔ)種識(shí)別比賽上,科大訊飛榮獲2009年高混淆方言識(shí)別指標(biāo)綜合排名冠軍、通用測(cè)試指標(biāo)綜合排名亞軍,榮獲2011年9個(gè)高混淆度方言評(píng)測(cè)中7個(gè)方言評(píng)測(cè)第一名。
智能語(yǔ)音技術(shù)有著非常廣泛的應(yīng)用場(chǎng)景。萬(wàn)物互聯(lián)時(shí)代,智能語(yǔ)音技術(shù)在任何地方都可以使用。聲紋和指紋一樣,具有獨(dú)一無(wú)二的特征,聲紋識(shí)別技術(shù)在安全領(lǐng)域有很好的應(yīng)用,對(duì)國(guó)家安全的意義非常重大。目前,“聲紋+人臉識(shí)別”的身份認(rèn)證已經(jīng)在很多領(lǐng)域應(yīng)用。最近產(chǎn)業(yè)界特別關(guān)注的熱點(diǎn)是汽車內(nèi)的語(yǔ)音交互。隨著車聯(lián)網(wǎng)的發(fā)展,語(yǔ)音將成為車載技術(shù)的剛需。車內(nèi)語(yǔ)音技術(shù)最難的是遠(yuǎn)程語(yǔ)音控制和汽車行駛過(guò)程中產(chǎn)生的大量噪音干擾,已成為業(yè)界攻關(guān)的難點(diǎn)。2015年4月,科大訊飛研發(fā)的中文車載語(yǔ)音應(yīng)用技術(shù)在由寶馬中國(guó)研發(fā)中心牽頭組織實(shí)施的“寶馬全球中文語(yǔ)音技術(shù)測(cè)試”中斬獲第一,全面領(lǐng)先國(guó)際競(jìng)爭(zhēng)對(duì)手nuance,成為業(yè)界唯一達(dá)到實(shí)用標(biāo)準(zhǔn)的技術(shù)。迄今,科大訊飛已經(jīng)與奧迪、寶馬、奔馳、通用、豐田、雷克薩斯、福特等國(guó)際車廠,以及國(guó)內(nèi)的江淮、奇瑞、上汽、廣汽、長(zhǎng)安、吉利、長(zhǎng)城等主流車廠建立了廣泛的合作關(guān)系,產(chǎn)品陸續(xù)在榮威350、長(zhǎng)城H6等20余款車型中配裝上市。
語(yǔ)音技術(shù)將來(lái)可以應(yīng)用在生活的方方面面。比如在手機(jī)應(yīng)用方面,普通人不用經(jīng)過(guò)任何事先的訓(xùn)練,打開(kāi)手機(jī)中的訊飛輸入法,不僅可以手寫、可以疊屏,還可以將直接說(shuō)出語(yǔ)音立即轉(zhuǎn)換成文字,并且平均識(shí)別準(zhǔn)確率達(dá)到95%以上。目前,訊飛輸入法已擁有2.8億用戶,日活躍用戶數(shù)超過(guò)5000萬(wàn)人。訊飛輸入法主要使用的是科大訊飛的語(yǔ)音識(shí)別技術(shù)。
此外,科大訊飛將語(yǔ)音識(shí)別、語(yǔ)音合成與人工智能技術(shù)結(jié)合起來(lái),推出了另一款應(yīng)用——靈犀語(yǔ)音助手,直接通過(guò)語(yǔ)音發(fā)出指令,打電話、發(fā)短信等功能都可以快速響應(yīng)。比如,對(duì)著手機(jī)說(shuō)出“幫我查昆明到北京的航班”、“我想聽(tīng)中國(guó)人”等,便能輕松實(shí)現(xiàn)所需要的功能。同時(shí),科大訊飛在語(yǔ)音翻譯技術(shù)方面也取得了可喜成果。語(yǔ)音翻譯需要語(yǔ)音識(shí)別、機(jī)器翻譯和語(yǔ)音合成這三個(gè)核心技術(shù),科大訊飛如今已做到了語(yǔ)音識(shí)別、語(yǔ)音合成全球第一,文字到文字的翻譯技術(shù)也是第一。
在實(shí)現(xiàn)了機(jī)器能聽(tīng)會(huì)說(shuō)之后,科大訊飛開(kāi)啟了高級(jí)人工智能——認(rèn)知智能的攻關(guān)項(xiàng)目??拼笥嶏w在人工智能方面的主要項(xiàng)目是承擔(dān)的“國(guó)家人工智能863計(jì)劃”,亦即“類人答題機(jī)器人”,也叫“高考機(jī)器人”。國(guó)內(nèi)幾乎60%的人工智能專家都在這個(gè)計(jì)劃里,這也是產(chǎn)學(xué)研合作的一個(gè)重要體現(xiàn)。目前,該項(xiàng)目已取得階段性的成果:一是翻譯,科大訊飛口語(yǔ)翻譯技術(shù)在2014年國(guó)際口語(yǔ)機(jī)器翻譯評(píng)測(cè)大賽(IWSLT)中獲得第一名,已經(jīng)能夠讓翻譯能力達(dá)到了相當(dāng)于大學(xué)英語(yǔ)6級(jí)水準(zhǔn)。二是在對(duì)英語(yǔ)高考試卷中關(guān)于口語(yǔ)、填空題、選擇題等測(cè)試方面,配有科大訊飛口語(yǔ)翻譯技術(shù)的機(jī)器已經(jīng)超過(guò)人工。目前,科大訊飛器智能閱卷技術(shù)已經(jīng)在安慶、合肥等地成功試點(diǎn)應(yīng)用。
今天,當(dāng)人們?cè)趶?qiáng)調(diào)產(chǎn)學(xué)研用結(jié)合時(shí),當(dāng)成果轉(zhuǎn)化依然面臨諸多制約瓶頸時(shí),科大訊飛早已邁開(kāi)步子搶得先機(jī),與清華計(jì)算所、中科院自動(dòng)化所等十幾家高校院所成立實(shí)驗(yàn)室,在研發(fā)領(lǐng)域保持國(guó)際領(lǐng)先地位;讓創(chuàng)新技術(shù)在合適的地方、以適當(dāng)?shù)姆绞绞褂茫蛟祛I(lǐng)先的產(chǎn)品、不斷解決用戶問(wèn)題……未來(lái),科大訊飛將繼續(xù)通過(guò)加強(qiáng)產(chǎn)學(xué)研合作不斷推進(jìn)技術(shù)和產(chǎn)品創(chuàng)新,領(lǐng)跑國(guó)內(nèi)智能語(yǔ)音與人工智能行業(yè)。
以科大訊飛多年的技術(shù)創(chuàng)新和產(chǎn)學(xué)研合作經(jīng)驗(yàn)來(lái)看,產(chǎn)學(xué)研合作應(yīng)以企業(yè)為主體,否則創(chuàng)新就沒(méi)有“發(fā)動(dòng)機(jī)”。首先,企業(yè)參與產(chǎn)學(xué)研合作要有清晰的產(chǎn)業(yè)發(fā)展目標(biāo),否則不可能做長(zhǎng)遠(yuǎn)的研究。其次,企業(yè)家要有科學(xué)家的思維。再者,企業(yè)參與產(chǎn)學(xué)研合作要有完善的股權(quán)期權(quán)等獎(jiǎng)勵(lì)激勵(lì)機(jī)制。企業(yè)要讓產(chǎn)學(xué)研合作伙伴掌握價(jià)值鏈的主導(dǎo)權(quán),讓其成為公司的主人。