李世鵬
科大訊飛是目前亞太地區(qū)成立最早、最大的AI語音公司,擁有八千多名員工以及兩個國家工程實驗室。2017年,科大訊飛被《MIT技術評論》命名為世界上50個家最聰明的公司之一,科大訊飛在這50家公司中排在第六位,在中國排在第一位。
如今,人工智能已上升為國家戰(zhàn)略,更是掀起了人工智能的熱潮。中國在人工智能領域的發(fā)展實行“三步走”戰(zhàn)略:第一步,2020年我國部分人工智能達到世界水平;第二步,2025年人工智能成為國家主要生產力的驅動力;第三步,2030年我國人工智能與世界強國并駕齊驅。
科學家探索人工智能有兩個方向:一是運用大數(shù)據(jù)進行深度學習,包括基于深度神經(jīng)網(wǎng)絡進行計算;二是腦科學研究,該研究現(xiàn)正處在發(fā)展初期。目前大部分人講的人工智能還是基于大數(shù)據(jù)和深度學習。
人工智能發(fā)展也是一步一步發(fā)展來的,從計算智能到感知智能,最后到認知智能。感知智能中的很多問題已經(jīng)初步解決了,現(xiàn)在很多都是認知智能,也就是說怎么對內容進行認知,有什么數(shù)據(jù)訓練它,它就知道該做什么事情,遠遠沒有達到認知這層。但是通過腦科學的研究,現(xiàn)在慢慢地向認知智能這方面發(fā)展,但是認知智能還有很長的路要走。
在人工智能領域科大訊飛有一個大布局,我們分兩手抓。第一手抓基礎研究,我所在的人工智能研究院會在基礎算法、人工智能基本框架方面發(fā)力,做深層研究,跟世界上最先進的學校,包括兩個星期前跟MIT簽了合作協(xié)議。也就是說跟世界最牛的學校的教授、研究員們一起探索人工智能下一步發(fā)展的基礎研究。
另外,科大訊飛是一家腳踏實地的公司,我們的口號是頂天立地。立地就是要把人工智能技術運用到實踐中,提供更好的產品和服務。首先,科大訊飛是一個語音公司。在語音合成和語音識別上有很深的積累。我們試圖用人工智能來打破人跟機器以及人與人之間的交流障礙。一方面在語音合成上,科大訊飛一直走在世界前面,連續(xù)12年蟬聯(lián)世界語音合成競賽冠軍。另一方面是語音識別,2015年科大訊飛語音識別在世界上首次打敗速記員,2016年在語音識別競賽中取得第一。科大訊飛除了標準語音識別之外,還兼顧多種地方方言。
語音識別之后,下一步是如何打破人與人之間交流困難的瓶頸,這便涉及翻譯能力。科大訊飛把語音識別、翻譯及合成集成到產品里去,比如科大訊飛的翻譯機,該機可以實現(xiàn)中文與小語種互譯。另一個是會議翻譯系統(tǒng),我們的系統(tǒng)在今年轉播“兩會”的時候,實時把總理的漢語講話轉寫成漢字,同時翻譯成其他各種語言,包括少數(shù)民族語言。
科大訊飛不但是一家語音公司,現(xiàn)在還是一家視覺處理公司。2017年的國際測試科大訊飛位居第一,且是國內首家運用人工智能通過中國醫(yī)生資格考試并獲得456的高分。我們把這套系統(tǒng)應用于輔助治療,基于基礎醫(yī)學知識及以往診斷歷史大數(shù)據(jù),可以幫助醫(yī)生去診斷并發(fā)現(xiàn)一些醫(yī)生可能會忽視的病因,也可能會糾正一些誤判的病因。目前,這些技術已應用于實踐。
科大訊飛亦廣泛關注教育,即通過教學大數(shù)據(jù),包括老師的講稿、學生的作業(yè)、考試成績,進行分析并掌握每個學生知識的欠缺程度,具體就是知道學生在答題的過程中哪個部分出了問題,并且把有問題的知識點重新反映到知識圖譜里去,這樣對每個學生的弱項和強項有一個清晰的認識,老師可以根據(jù)系統(tǒng)針對性制定授課內容并根據(jù)每個學生對知識的掌握程度合理安排作業(yè),提高學習效率。我們還有一套語言測試自動打分系統(tǒng)。國內30個省的1.2萬個學校在使用該系統(tǒng),其中中學百強就有68所,去年有14個省的高考狀元是這套系統(tǒng)的用戶。
另外,我們有一套幫助司法部門的AI系統(tǒng)。該系統(tǒng)跟醫(yī)院輔助治療系統(tǒng)很像,基于司法判案立案的大數(shù)據(jù)形成輔助判案系統(tǒng),幫助法官、檢察官、律師更好進行判案。該系統(tǒng)最大的優(yōu)點是排除人情緒化判案、提高準確率。以上包括語音識別、翻譯及合成皆屬于感知智能層面,并未觸及認知智能。斯坦福大學一個SKAD測試,機器讀一篇文章,并回答提問。這是很難的工作,必須對內容充分理解才行??拼笥嶏w于2017年在SKAD測試獲得第一,但各方面都在變化,技術也需不斷更新。這些都需要認知技術革新來解決實際問題。傳統(tǒng)的圖靈測試已經(jīng)被打破,更難的是對常識性的東西進行測試。比如說一個爸爸舉不起他的兒子,人的直覺是因為兒子很重,如何讓機器把常識性的東西推算出來,那是很有挑戰(zhàn)性的一個問題。
最后,分享一下人工智能的開放平臺,跟今天的主題很相關??拼笥嶏w的AIUI平臺把AI技術開放給成千上萬開放者進行新的應用開發(fā),自2016年至今AIUI系統(tǒng)已擁有82萬個開發(fā)團隊,每天活躍用戶訪問量46億??拼笥嶏w是科學院AI聯(lián)盟的理事長單位,作為在智能語音方面國家四大平臺之一,科大訊飛聯(lián)合高校,已牽頭在合肥建一個產業(yè)園區(qū)。人工智能的發(fā)展需要全球通力合作,優(yōu)化資源配置,改變世界指日可待。
(根據(jù)演講內容整理,未經(jīng)本人審核)