亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        科大訊飛為什么是“最聰明的公司”

        2017-07-29 00:01:11王珊
        中國新聞周刊 2017年27期
        關(guān)鍵詞:劉慶峰音箱語音

        王珊

        語音功能解放了雙手和眼睛,擴展了永遠(yuǎn)在線的概念,只需要一個聲音的交流,就可以迅速高效地完成一些操作,傳統(tǒng)的鍵盤、手寫板或現(xiàn)在流行的視頻都不可能如此充滿想象力而且便利。

        以報道新興科技與創(chuàng)新商業(yè)為特色的《麻省理工科技評論》,在進入互聯(lián)網(wǎng)時代以后很受中國年輕一代技術(shù)男們的追捧,而這本雜志實際上已有118年的歷史了。

        2017年6月27日,《麻省理工科技評論》發(fā)布了“全世界最聰明的50家公司”榜單,其中排名全球第六、中國第一的,不是風(fēng)頭正勁的中國互聯(lián)網(wǎng)巨頭BAT中的任何一家,而是科大訊飛。

        該刊對科大訊飛的上榜理由是這樣描述的:“該公司旗下的語音助理技術(shù)是中國版的Siri。其可攜帶實時翻譯器則是一款杰出的人工智能應(yīng)用,克服了方言、俚語和背景雜音,可將漢語精準(zhǔn)地翻譯成十幾種語言。”

        科大訊飛董事長劉慶峰對“人工智能+”時代的趨勢總結(jié)道,“以語音為主導(dǎo),以鍵盤和觸摸屏為輔助的人機交互時代正在到來?!痹谒枥L的圖景里,未來的人工智能會像水和電一樣進入每個行業(yè),深刻地改變?nèi)祟惖氖澜纭_@其中,“語音是人工智能的重要入口”。他認(rèn)為,這是訊飛走紅的原因。

        “我們做的每件事都挺笨的”

        “我們很榮幸入選‘最聰明的公司,但是我覺得,科大訊飛在過去十幾年做的幾乎每件事都是挺笨的?!痹凇堵槭±砉た萍荚u論》揭曉“全世界最聰明50家公司”現(xiàn)場致辭時,科大訊飛高級副總裁江濤說。

        對于當(dāng)下的中國青年人來說,創(chuàng)業(yè)是一種時髦,然而對于訊飛來說,卻開始于近20年前。

        1999年,科大訊飛成立,18名成員全部是中國科學(xué)技術(shù)大學(xué)的畢業(yè)生。此時,恰逢全球語音技術(shù)產(chǎn)品化的第一波熱潮。微軟、IBM、英特爾和摩托羅拉都在中國成立了專門的語音研究基地,并把中文作為最重要的戰(zhàn)略主攻方向之一。

        然而,這一波熱潮并沒有真正熱起來。其原因,是受語音技術(shù)發(fā)展水平的限制。劉慶峰記得,當(dāng)時語音合成出來的效果是“一字一頓”的,連續(xù)性不好;而語音識別和語音解析則更多地停留在實驗室階段。

        語音技術(shù)如何賺錢,初創(chuàng)團隊誰都說不清楚。當(dāng)時,蘋果的Siri還沒出現(xiàn),距人機語音交互也還十分遙遠(yuǎn),但那時劉慶峰就認(rèn)為,語音技術(shù)遲早要面對大眾,融入人們的日常生活。如果說,語音合成是讓機器擁有人類的聲音,那么,語音識別和語音解析則是賦予了機器人的耳朵和大腦。讓機器能聽會說,成為訊飛成立之初就設(shè)定的目標(biāo)。

        按照當(dāng)時的估算,這項技術(shù)有著100億元左右的市場空間,但這只是幾個創(chuàng)業(yè)青年的簡單推算。劉慶峰回憶說,“我們當(dāng)時想,語音用在工商查詢系統(tǒng)中會有多大市場規(guī)模?我們的系統(tǒng)使用費用20萬元,全國400個工商局就是8000萬元,如果放到教育上豈不是更大?”

        不久,他們開發(fā)了一款名叫“暢言2000”的電腦軟件。這是一款能把語音自動轉(zhuǎn)換成文字的工具,甚至還可以讓用戶通過語音控制電腦,現(xiàn)在看來,這有點像訊飛后來一些產(chǎn)品的原型了。

        一開始,這款設(shè)計受到了很多人的喜愛,尤其是對電腦接受度低的離退休人群。但是很快劉慶峰就發(fā)現(xiàn)產(chǎn)品很難賺到錢。一方面是因為盜版橫行,另一方面,用戶年齡偏大,對電腦知之甚少,維護成本高。

        他們試圖將技術(shù)提供給中國電信等大公司來獲取利潤,對方卻不放心將單子交給一個十幾人組成的年輕團隊。后來,劉慶峰想辦法將技術(shù)嵌在包括華為在內(nèi)的大的技術(shù)平臺上,謀求與第三方的合作。這成為后來訊飛主要的商業(yè)模式。

        劉慶峰許下的上億元規(guī)模的市場空間并沒有成為現(xiàn)實,而且大筆的收入被投入到核心技術(shù)的進一步研發(fā)中了,創(chuàng)業(yè)成員只能拿到兩三千元的工資?,F(xiàn)實讓他們感到有些失望。同時,各種質(zhì)疑聲四起。劉慶峰則堅持,“我們不可能一步登天,只能腳踏實地。成功一定會來,但絕對不是現(xiàn)在?!?/p>

        直到2010年,公司推出了訊飛輸入法,以此宣告語音聽寫時代的到來。劉慶峰還記得發(fā)布會的地點是在北京的香格里拉飯店,當(dāng)時整個會場的人都很興奮。一位在場的記者用福州口音嘗試了訊飛輸入法后激動地說,“中國終于有個像Siri的產(chǎn)品出現(xiàn)了”。

        然而,訊飛輸入法并沒有預(yù)料中的那樣突飛猛進。劉慶峰很清楚,“當(dāng)時80%的識別率是在特定場景下實現(xiàn)的,然而,如果在噪聲環(huán)境或網(wǎng)絡(luò)環(huán)境不好的情況下,實際的識別率就只有60%了?!?p>

        中國電子信息博覽會上,小朋友體驗科大訊飛VR創(chuàng)新教學(xué)產(chǎn)品。

        當(dāng)時,訊飛剛剛將“深度學(xué)習(xí)”技術(shù)引入到語音識別中去,“機器學(xué)習(xí)”依然是最主要的計算方法。這個已經(jīng)發(fā)展數(shù)十年的技術(shù)對于語音的特征提取有著天然的局限性。其他條件也都還沒有準(zhǔn)備好。2010年,距離中國政府正式發(fā)布3G牌照僅僅一年的時間,國內(nèi)手機市場依然是以2G為主導(dǎo)。移動網(wǎng)絡(luò)的限制體現(xiàn)在數(shù)據(jù)傳送速度上,用戶說完話后,需要等待一段時間才能將語音變成文字。

        五年之后,一切都發(fā)生了變化。2015年,全球智能手機出貨量為12.93億部,年增長10.3%。2016年,這一數(shù)據(jù)為14.8億臺。截至2016年7月,中國移動電話4G用戶總數(shù)達(dá)到6.46億。

        與此同時,深度學(xué)習(xí)技術(shù)也迅速發(fā)展起來。深度學(xué)習(xí)通過建立、模擬人腦進行分析學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò),使得機器能從大量歷史數(shù)據(jù)中學(xué)習(xí)規(guī)律,從而對新的樣本做智能識別或?qū)ξ磥碜鲱A(yù)測,以達(dá)到具有人類一樣的思考能力。這一技術(shù)迅速地被應(yīng)用在語音識別、圖像識別等領(lǐng)域。

        語音技術(shù)一下子火了起來。智能語音在國外得到互聯(lián)網(wǎng)巨頭的重視。蘋果推出了Siri,谷歌發(fā)布了GoogleNow,微軟的Cortana也問世了。這些公司都希望通過語音助手來打開人工智能的入口。2016年9月,微軟執(zhí)行副總裁沈向洋在接受媒體采訪時表示,語音的徹底主流化已經(jīng)不是一個需要討論的問題,只是一個時間和習(xí)慣轉(zhuǎn)移的問題。

        “互聯(lián)網(wǎng)女皇”瑪麗·米克爾(Mary Meeker)發(fā)布2016年互聯(lián)網(wǎng)趨勢報告,用近四分之一的篇幅論述語音識別交互帶來的改變,將語音功能贊譽為“人機交互的新范式”。她說,語音功能解放了雙手和眼睛,擴展了永遠(yuǎn)在線的概念,只需要一個聲音的交流,就可以迅速高效地完成一些操作,傳統(tǒng)的鍵盤、手寫板或現(xiàn)在流行的視頻都不可能如此充滿想象力而且便利。

        劉慶峰終于等到了最好的時代。訊飛語音占領(lǐng)了各類會議的大屏幕,訊飛輸入法成為互聯(lián)網(wǎng)人的標(biāo)配。“許多人覺得人工智能突然火了,但我們其實一直在這個領(lǐng)域努力??拼笥嶏w看準(zhǔn)一個方向,就會不遺余力地走下去?!?/p>

        一切都朝著新的目標(biāo)努力,即機器不僅能聽會說,還能理解、會思考。在資金投入上,科大訊飛每年將銷售收入的25%投入研發(fā)中去,遠(yuǎn)超其他科技企業(yè)3%~5%的平均水平。不過,做出一款類似《超能陸戰(zhàn)隊》里的大白的產(chǎn)品,能夠完全理解人類的語言和行為,注定是一場漫長的戰(zhàn)役。

        比如說,既有的語音識別工具仍然不能勝任嘈雜或回聲繚繞的地方——訊飛的產(chǎn)品目前也只能保證5米內(nèi)的識別;如果硬件比較差,那就更糟糕了,對語音識別的結(jié)果會變得磕磕絆絆?!耙岩粋€人工智能的‘耳朵做成一般人的聽力水平并不難,問題是要讓這只耳朵在嘈雜環(huán)境下也能聽懂人說話,那就不是容易的事情?!眲c峰說。

        按照他的說法,人工智能可以分成三大階段,第一個階段叫計算智能,如計算機下象棋贏了國際象棋大師,代表了計算能力越來越強;第二個是感知智能,機器在視覺、聽覺上以及語音上超越人類;而下一步就是認(rèn)知智能,讓機器有學(xué)習(xí)和推理能力。只有這樣,人工智能才能帶來更多驚喜。

        “最聰明的公司”

        “最聰明的”訊飛到底有多聰明?在訊飛的“曉譯翻譯機”發(fā)布會現(xiàn)場,科大訊飛高級副總裁胡郁演示了該產(chǎn)品的功能。他邀請一位外國女士上臺。這位女士懂一點漢語,卻不能完成流利的交談。雙方都手持著一個翻譯機。胡郁說中文,對方則用英語。

        “你好,歡迎參加我們的發(fā)布會,請問你叫什么名字?”

        “我叫南希,我很榮幸能參加這場盛會?!?/p>

        “看了這么多產(chǎn)品,你覺得怎么樣?”

        “很精彩,我覺得好玩又有趣。”

        “有了這個設(shè)備后,你覺得還有必要學(xué)中文嗎?”

        “這個設(shè)備讓我震撼。我想推薦給我的朋友們,但是學(xué)習(xí)中文還是我最大的興趣?!?/p>

        “翻譯機擁有大學(xué)英語六級的水平,能起到日常交流的作用,但還不能取代同傳。”科大訊飛多語種翻譯業(yè)務(wù)線副總監(jiān)馬家領(lǐng)告訴《中國新聞周刊》。

        語音翻譯是集語音識別、口語翻譯和語音合成為一體的技術(shù)。隨著全世界互聯(lián)互通不可阻擋的趨勢,它被視為當(dāng)前移動互聯(lián)時代最受矚目的影響人類生活的重大技術(shù)之一。

        機器翻譯的歷史最早可以追溯到1954年。當(dāng)時,美國喬治敦大學(xué)與IBM公司聯(lián)合使用IBM-701計算機首次完成了英俄機器翻譯試驗,拉開了機器翻譯研究的序幕。此后幾十年間眾多不同的翻譯方法相繼出現(xiàn)。

        自20世紀(jì)80年代末以來,語音翻譯技術(shù)一直備受各國政府和研究機構(gòu)的關(guān)注和重視。1985年,美國航空航天局翻譯科主任 Timothy J.Rowe 就說過:“機器翻譯是明天就要掀起的浪潮,這一點已毫無疑問了。”然而,這一技術(shù)的發(fā)展并沒有預(yù)料的那么迅速。語音翻譯僅僅涉及天氣信息、觀光旅游、購物和旅館預(yù)訂等限定領(lǐng)域的實驗研究,主要以研究、系統(tǒng)演示和展示為主。

        人們頗為熟知的在線翻譯讓機器翻譯技術(shù)往前邁進了一步。它的工作原理是將整個句子切分多個詞組、短語,進行翻譯組合。比如,在中英文翻譯中,它會把中文、英文短語之間的影射關(guān)系建立起來,解決的是對齊問題,譯成小短語,以達(dá)到最大化的翻譯流利程度。不過,這種組合產(chǎn)生的翻譯方式因為較大的誤差而不實用。

        訊飛采用的技術(shù)將機器翻譯大大地往前推進了一步。它使用的是“編碼器-解碼器”模型,能夠?qū)卧~的特征進行提取,并具備語譯能力,這是基于人工神經(jīng)網(wǎng)絡(luò)的一種機器學(xué)習(xí)方法,能夠模擬人腦神經(jīng)的層級結(jié)構(gòu),從基礎(chǔ)層開始,每一層都對從上一層接收來的信息進行抽象,自動識別出語言的規(guī)則、模式。這也是目前業(yè)界都在努力研究的一個方向。

        在美國,谷歌、微軟都將神經(jīng)網(wǎng)絡(luò)應(yīng)用于機器翻譯領(lǐng)域,谷歌更是表示會將神經(jīng)網(wǎng)絡(luò)機器翻譯技術(shù)推廣到Google Translate支持的全部103個語種中。

        美國國家標(biāo)準(zhǔn)技術(shù)研究院(NIST)組織的機器翻譯大賽(Open Machine Translation Evaluation)被業(yè)界視為全球最權(quán)威的機器翻譯技術(shù)評測。2015年,在眾多巨頭的包圍下,科大訊飛取得了全球第一的成績,能夠做到字到字的完全準(zhǔn)確,包括語義理解準(zhǔn)確。而一年前,科大訊飛在2014年國際口語翻譯大賽(IWSLT)上獲得中英和英中兩個翻譯方向的全球第一名。

        現(xiàn)在,只要依靠手中比智能手機還要小的翻譯機,就可以出國旅游,甚至進行一些低難度的商務(wù)會談。人人都渴望的實時翻譯技術(shù)似乎已經(jīng)變成現(xiàn)實,更有人提出,機器翻譯或?qū)⑷〈晜髯g。

        不過,劉慶峰試圖給樂觀的人潑點冷水,“機器翻譯大賽,訊飛雖然獲得了第一名,但準(zhǔn)確率只有52%,跟人工翻譯還有很大差距?!眲c峰告訴《中國新聞周刊》。

        確實,在人工智能的武裝下,機器翻譯的準(zhǔn)確度有了很大的提高,在一定程度上可以達(dá)到“信”的標(biāo)準(zhǔn),但若想實現(xiàn) “達(dá)”和“雅”的要求,則有些力不從心。尤其是對于那些有多種修辭手法的詩歌、小說來說,要想實現(xiàn)較為精確的翻譯,難度就更大了。

        科大訊飛信息科技股份有限公司的訊飛研究院內(nèi),研發(fā)人員在實驗室監(jiān)測車內(nèi)噪聲環(huán)境下車裁語音導(dǎo)航的識別率。

        動動嘴就能過上智能生活?

        科大訊飛高級副總裁杜蘭描繪了未來使用語音實現(xiàn)各種人機交互的典型的一天:早上來到客廳,對智能電視說一句“回看昨晚的新聞聯(lián)播”,電視便按你的心意播放;隨后,你可以通過喚醒語音操控系統(tǒng),將家里的空氣凈化器、空調(diào)、加濕器等電器調(diào)整到最舒適健康的狀態(tài)。

        上午,要開一個重要會議,合作伙伴來自韓國、日本和美國等國家,翻譯機可以實時將多國語言轉(zhuǎn)化成文字并翻譯在大屏幕上,來自各國的參會者不用翻譯就能進行溝通。

        下班后,你駕駛著汽車問語音助手,怎么去最近的某銀行營業(yè)大廳,它將把快速搜索的結(jié)果推薦給你,并規(guī)劃好前往的路線。

        ……

        一切都顯得太智能、太美好了,在未來,動動嘴就能過上智能生活。更讓人興奮的是,當(dāng)智能手機、平板電腦、智能手表、智能電視以及更多日常物品接入互聯(lián)網(wǎng),這一切就已經(jīng)不遠(yuǎn)了。

        拓普研究所的數(shù)據(jù)顯示,2014年到2017年全球語音設(shè)備出貨量大幅度攀升。2014年全球出貨量不足500萬臺,到2017年出貨量將達(dá)到2500萬臺。預(yù)計到2020年,全球語音識別的市場規(guī)模將會從2015年的61.9億美元增長到200億美元。

        美國研究機構(gòu)BI Intelligence發(fā)布的《2016年全球物聯(lián)網(wǎng)發(fā)展研究報告》則預(yù)測,2020年全球?qū)⒂?40億臺設(shè)備接入互聯(lián)網(wǎng),平均每人有4個硬件設(shè)備。其中,語音使得智能家居成為物聯(lián)網(wǎng)時代最激烈的戰(zhàn)場。據(jù)研究機構(gòu)Research and Markets報告顯示,未來五年,全球智能家居設(shè)備和服務(wù)市場將每年以8%~10%的速度增長,到2018年市場規(guī)模將達(dá)到680億美元。

        那么,用什么當(dāng)作智能家居的入口呢?最先入局的是亞馬遜。2014年,亞馬遜推出智能音箱echo,它能夠接收來自房間各個角落的聲音,可在不到兩秒內(nèi)回應(yīng)諸如交通狀況等日?,嵤碌脑儐?。亞馬遜選擇音箱的原因很簡單,首先必須是家居設(shè)備,價格不能太貴,最好每個人都買得起;其次是共有需求。

        谷歌緊隨其后。2016年5月,谷歌發(fā)布了智能音箱Google Home。競爭到了2017年愈加白熱化。當(dāng)年5月,在48小時內(nèi),來自三家公司的音箱產(chǎn)品競相發(fā)布:微軟攜手三星旗下音響品牌哈曼卡頓,發(fā)布智能音箱Invoke;聯(lián)想集團發(fā)布中國版本智能音箱;亞馬遜在美國發(fā)布帶7英寸觸摸屏的Echo Show。6月28日剛剛發(fā)布的這款新品是音箱與平板電腦的結(jié)合。很明顯,這些大牌公司的目標(biāo)跟亞馬遜一樣,即通過音箱打造一個無所不在的電商模式。

        2015年,科大訊飛攜手京東發(fā)布了類似的產(chǎn)品叮咚音箱。劉慶峰覺得,音箱本身炫酷,又有時尚感,可以作為智能家居的一個入口。不過,在中國,他最看好的依然是電視屏幕。“電視有著成熟的商業(yè)模式和明確的應(yīng)用價值,家家戶戶都有一塊電視屏,現(xiàn)在只需要把他們激活就行了。在電視上花力氣,是會有回報的?!?/p>

        訊飛正在執(zhí)行的“訊飛超腦”計劃正在努力將一切變?yōu)楝F(xiàn)實,未來,你可以通過用語音指揮電視進行購物,也可以由此來控制家里的冰箱、洗衣機、熱水器;甚至將教育資源搬上電視。

        最近一年多以來,在資本的加持下,許多公司紛紛貼上了人工智能的標(biāo)簽。李開復(fù)曾在演講中提到,他見到過一個內(nèi)衣企業(yè),也聲稱自己是人工智能企業(yè)?!斑@是非常不正常的現(xiàn)象。現(xiàn)在,人工智能領(lǐng)域的泡沫化特別嚴(yán)重?!薄靶陆?jīng)濟100人”創(chuàng)始人兼CEO李志剛則表示“未來兩三年,95%以上的人工智能創(chuàng)業(yè)公司要倒閉”。

        為此,劉慶峰提議建設(shè)中國的人工智能聯(lián)盟。對于開發(fā)者來說,一個統(tǒng)一的標(biāo)準(zhǔn),能夠避免產(chǎn)品開發(fā)中的資源浪費,對于消費者來說也劃算;其次,有了標(biāo)準(zhǔn)之后,可以避免魚龍混雜。“人工智能不能只停留在概念,大家都說自己的產(chǎn)品好,但是缺乏評定標(biāo)準(zhǔn),老百姓和政府也搞不清楚,人工智能是浪潮還是泡沫,也很難說明白。有了標(biāo)準(zhǔn),一切都可以解決。”

        產(chǎn)業(yè)聯(lián)盟的成立也有利于中國企業(yè)聯(lián)合起來應(yīng)對國外的競爭。 《紐約時報》曾發(fā)文指出,美國正面臨挑戰(zhàn),其在機器人和人工智能領(lǐng)域一家獨大的想法已然過時,中國的公司正在一點點瓜分市場?!叭斯ぶ悄苷娴囊A,絕對不是一個企業(yè)取代另一個企業(yè),是一個產(chǎn)業(yè)鏈和一個產(chǎn)業(yè)鏈的競爭,是一個生態(tài)對一個生態(tài)的競爭。”劉慶峰說,目前國際范圍內(nèi)人工智能的對抗依然主要是中美兩國之間的對抗,想要贏得戰(zhàn)爭,必須要協(xié)同起來。

        猜你喜歡
        劉慶峰音箱語音
        KEF推出新一代LS50 Wireless Ⅱ音箱
        Polk(普樂之聲)推出高端Reserve系列音箱
        魔力語音
        小音箱,大精彩 B&W 805 D3尊貴版書架音箱
        基于MATLAB的語音信號處理
        電子制作(2019年14期)2019-08-20 05:43:38
        基于MQ3與MP3的價廉物美的酒駕語音提醒器
        電子制作(2019年9期)2019-05-30 09:42:10
        多一對音箱,多一份驚喜Marantz AV8805
        對方正在輸入……
        小說界(2018年5期)2018-11-26 12:43:42
        “科大訊飛”劉慶峰:創(chuàng)造千億市值的AI語音拓荒者
        “科大訊飛”劉慶峰:創(chuàng)造千億市值的AI語音拓荒者
        国产极品大秀在线性色| 韩国精品一区二区三区无码视频| 成年女人毛片免费视频| 国产午夜激无码AV毛片不卡| 中文字幕视频二区三区| 日本一区二区三区光视频 | 亚洲日韩av无码| 久久久久久av无码免费看大片| 亚欧同人精品天堂| 免费女女同黄毛片av网站| 婷婷色婷婷开心五月四| 韩国三级中文字幕hd| 亚洲欧美日韩国产综合一区二区| 草莓视频中文字幕人妻系列| 一区二区在线观看日本免费| 国产色视频一区二区三区不卡 | 亚洲av无码国产精品色午夜软件| 亚洲欧美乱综合图片区小说区 | 日韩精品极品视频在线免费| 高潮精品熟妇一区二区三区| 日韩精品无码一区二区三区四区 | 麻豆久久久国内精品| 亚洲av天堂在线免费观看| 免费av片在线观看网址| 女人被狂躁高潮啊的视频在线看| 国产精品亚洲五月天高清| 女优av福利在线观看| 亚洲激情一区二区三区不卡| 精品视频一区二区三区在线观看 | 在线播放国产女同闺蜜| 中文字幕在线人妻视频| 丰满少妇被啪啪到高潮迷轩| 正在播放强揉爆乳女教师| 97无码人妻福利免费公开在线视频| 国产午夜精品美女裸身视频69| 国产精品麻豆一区二区三区| 免费人成小说在线观看网站| 国产最新进精品视频| 久久精品国产亚洲av大全相关| 成年女人18毛片观看| 天天综合天天爱天天做|