劉沁娟
提起搜狗,大部分人第一時間想到的是它的輸入法與搜索,而在第三屆世界互聯(lián)網大會上,搜狗CEO王小川在“移動互聯(lián)網論壇”首次展示全場最精彩的“黑科技”——機器同傳,展示了實時機器翻譯技術,將演講嘉賓的中文講話實時語音識別并同步翻譯為英文在大屏幕上顯示。自此,人們打破了對搜狗的傳統(tǒng)印象。
當王小川說到“搜索的未來就是人工智能時代的皇冠”時,屏幕上實時顯示出了“In the future, search will be the Crown of the AI Era”。隨著他的話語逐漸完整,屏幕上顯示的內容也自動修改。這是全球首次基于神經網絡的實時機器翻譯技術在大型活動上的展示,效果可靠,準確率已接近人類同傳翻譯結果。
其實早在2011年,搜狗便開始深耕語音識別技術,至今已有5年時間的積累。目前,搜狗語音識別準確率超過97%,機器翻譯準確率在90%左右。2016年12月做人工評測時,搜狗機器翻譯在演講、旅游、閑聊、日??谡Z等領域,采用5分制人工評分能達到4.4分。
本刊近日專訪王小川,講使命談未來,他對這次的人工智能浪潮十分樂觀,篤信人工智能會讓生活更加美好。“搜狗的使命是讓表達和獲取信息更簡單。實際上,搜索就是在幫助人們獲取信息,而輸入法則在幫助人們進行表達。未來,搜狗會通過自然交互和知識計算,促進更多人工智能產品的落地,切實造福人類?!蓖跣〈ㄕf。
“人工智能對自然語言的理解是我們最需要的”
《網絡傳播》:搜狗正在全面轉向人工智能嗎?進行人工智能研發(fā)的初衷是什么?
王小川:很多人問我,搜狗是轉型做人工智能了嗎?其實,搜狗并沒有“轉向”人工智能,搜狗本身是做搜索引擎的,而搜索天生就具備人工智能基因。
縱觀搜索引擎的發(fā)展歷史,我們會發(fā)現(xiàn),原來的搜索是基于關鍵詞的搜索,用戶輸入一個關鍵詞,搜索引擎會返回10條鏈接,然后需要用戶對于信息逐條進行篩選,但關鍵詞并不是最好的搜索方法。搜索引擎往后的發(fā)展方向,會從關鍵詞搜索,變成由人來表達一個完整的句子,可以是問題或命令,再由機器找出其中的含義,最終由機器直接給出答案,或者是機器來執(zhí)行命令。人工智能在這個過程中發(fā)揮著巨大的作用。
《網絡傳播》:搜狗在人工智能領域已經發(fā)展到什么階段?未來方向是什么?
王小川:基于人工智能最前沿的深度學習技術,搜狗在包括語音識別、自然語言理解、圖像處理等方面,都已走在行業(yè)前端,并且相關技術已應用到了搜狗的產品中,包括搜索、輸入法、廣告系統(tǒng)等。比如,搜狗輸入法剛剛推出的“智能分享”功能,可以讓用戶在使用QQ、微信等產品聊天時,不必跳出聊天場景,直接在輸入法中查找相應的內容,并發(fā)送給對方,極大地提升了使用體驗。
人工智能對于自然語言的理解,是我們認為最需要做的,我們的主業(yè)是輸入法和搜索,都是和文字信息打交道,但對于語言的理解是人工智能里最難的事。
“人工智能讓我們的生活更加美好”
《網絡傳播》:人工智能已經走過60年的歷程。今年,谷歌研發(fā)的圍棋機器人AlphaGo戰(zhàn)勝了韓國棋王李世石,這讓很多人意識到,人工智能已經今非昔比。那么,人類為什么需要人工智能?人工智能會給我們的生活帶來哪些改變?
王小川:機器會幫助我們做一些簡單的體力、腦力勞動,人類會被解放出來,去做更加有創(chuàng)造性和更加需要想象力的事——人工智能會讓我們的生活更加美好。人工智能往下走主要是兩個體系,一個是虛擬世界,另一個是機器智能。前者指的是游戲、小說、音樂、視頻等文化創(chuàng)意產業(yè)領域的技術發(fā)展,把我們帶向了虛擬世界,這能讓人類找到自己的存在感;后者指機器智能將減少人的判斷,把決策交給機器,讓機器參與到人的決策之中。
《網絡傳播》:對霍金發(fā)出的“人工智能可能給中產階級帶來災難”的警示,你怎么看?
王小川:目前人工智能還需要依靠人的傳統(tǒng)經驗來訓練,但如果操作經驗或者是數(shù)據(jù)量不夠,機器還無法代替人類。人工智能能夠取代一些職業(yè),比如說棋手、審計、醫(yī)生等,在這些方面機器都可以做很好的輔助,但是對于大家沒見過的具有創(chuàng)造性的事情,比如規(guī)劃、科研等,對于機器來說還很難?,F(xiàn)在機器可以寫文章、畫圖,在科研層面展示出了一些魔力,但是還沒有到可以取代人的階段。更難的層級,人作為一個生命,生命有對環(huán)境的適應能力,還有自我的繁衍能力,機器還遠遠做不到。
“我對這次的人工智能浪潮十分樂觀”
《網絡傳播》:如果說2010年從搜狐分拆獨立是搜狗第一次蛻變,2013年引入騰訊戰(zhàn)略投資是第二次蛻變,那么,人工智能是否如外界所說,會為搜狗帶來第三次蛻變的機會?人工智能將在此次蛻變中起何作用?
王小川:我對于這次的人工智能浪潮十分樂觀,但是我也很緊張,也許我們自己做的搜索引擎就是會被顛覆的一部分。所以,我們會開始暢想未來的路在什么地方。我認為,搜索的未來就是人工智能時代的皇冠,隨著技術的突破,搜索引擎會自然而然演化成為問答引擎。除了搜索引擎做問答以外,輸入法的未來將向自動問答演變。
《網絡傳播》:互聯(lián)網紅利正在消退,中國互聯(lián)網也在向人工智能方面角逐,搜狗如何憑借技術紅利和數(shù)據(jù)紅利在這場競爭中取勝?
王小川:搜狗是一家搜索引擎公司,公司的性質決定了在過去十幾年的實踐中,搜狗積累了大量的數(shù)據(jù)資源、龐大的用戶量以及領先的算法,這些都是搜狗在競爭中的優(yōu)勢。
數(shù)據(jù)紅利方面,搜狗輸入法的語音識別技術背后是龐大的語料數(shù)據(jù)支持。目前,搜狗輸入法日均語音請求接近1.9億次,用戶每天產生的語料規(guī)模超過16萬小時,遠超國內任何語音公司使用的語料規(guī)模;技術紅利方面,搜狗本身的技術底蘊很深厚,2016年4月,搜狗向清華大學捐贈1.8億元,共同成立了天工智能計算研究院,這是企業(yè)首次與中國頂級高校一起集合全球頂級資源在人工智能學術和技術領域的合作,共同研發(fā)的成果也將運用到搜狗的產品中。