尹穎堯
2017年年初,美國新媒體聯(lián)盟(the New Media Consortium,簡稱NMC)頒布了《地平線報告》(2017年大學(xué)版),首次將人工智能(Artificial Intelligent,簡稱AI)列入其中。這份報告從短期、中期和長期三個時間軸,預(yù)測未來將改變高等教育的六大科技。今年的人工智能被標(biāo)注在長期時間軸上。
人工智能時代真的到來了?它都要顛覆知識象牙塔高等教育了?前不久,記者采訪了人工智能創(chuàng)業(yè)者、海知智能CEO謝殿俠。
“我叫謝殿俠,大家都喊我老謝。”
老謝說,從AI角度解釋第一次見面和這句寒暄,就包括AI的三大基礎(chǔ)領(lǐng)域:人臉識別、語音識別和語義理解。為了解釋地通俗易懂,老謝科普了人工智能的三大技術(shù)要素:數(shù)據(jù)、計(jì)算能力和深度學(xué)習(xí)(deep learning)。此前受困于這三大技術(shù)要素,AI一直無法獲得巨大突破。近年來,數(shù)據(jù)量不斷增大,計(jì)算能力不斷提高,深度學(xué)習(xí)得以良好運(yùn)用,AI迎來第三次浪潮。目前,AI的人臉識別能力已經(jīng)超過肉眼,語音識別接近人的語音識別,而語義理解與人的還有一段不小的差距。
早在2015年,在實(shí)驗(yàn)室場景下,AI的人臉識別準(zhǔn)確率已經(jīng)超過了人類肉眼。肉眼識別準(zhǔn)確率大概是95%,而AI的準(zhǔn)確識別率已經(jīng)超過這個數(shù)字。老謝說,假如記者戴著AI眼鏡,雖與他初次見面,AI眼鏡也會準(zhǔn)確地告訴記者:對方是海知智能CEO謝殿俠。
在語音識別方面,人的語音識別準(zhǔn)確率大概是96%,而在理想實(shí)驗(yàn)室場景下,AI的語音識別準(zhǔn)確率目前在94%~95%之間,AI的語音識別準(zhǔn)確率已與人的相差無幾。有數(shù)據(jù)預(yù)測,在未來一兩年內(nèi),AI的語音識別準(zhǔn)確率將會達(dá)到99%,超過人的水平。那時,記者一邊采訪老謝,AI一邊將聲音轉(zhuǎn)化成文本,真正實(shí)現(xiàn)同步操作。而目前雖然市面上已有類似的語音轉(zhuǎn)寫軟件,但實(shí)際應(yīng)用場景下準(zhǔn)確率不夠高,仍需人工核對和修改。
AI雖聽得懂“謝殿俠”,也知道他是海知智能CEO,卻很難把“老謝”與“謝殿俠”對號入座。語義理解,仍是AI目前亟待攻克的方向。這是因?yàn)檎Z言表達(dá)非常復(fù)雜,而且一定要結(jié)合當(dāng)前使用環(huán)境、上下文來綜合判斷。
目前包括斯坦福大學(xué)、微軟亞洲研究院等在內(nèi)的大學(xué)和研究機(jī)構(gòu),都在研究語義理解,其中,閱讀理解是前沿中的前沿。在限定了條件的話題討論中,人的閱讀理解能力大概85分,而AI也許只有70分,15分的差距需要很長一段時間才能趕上。
AI的閱讀理解能力一旦與人的一樣,將會產(chǎn)生顛覆性革命。
AI的優(yōu)勢在于能抓取網(wǎng)頁上所有信息的意思,掌握古往今來的所有顯性文明。未來,各行各業(yè)解決問題的過程和方式也將與我們現(xiàn)在的不一樣。比如醫(yī)療領(lǐng)域,當(dāng)患者把癥狀告訴AI,AI能根據(jù)描述和檢查數(shù)據(jù)指標(biāo),結(jié)合此前學(xué)習(xí)的診療案例詳細(xì)解釋病情,乃至開藥方。AI可以看做一個超級大腦(superbrain),當(dāng)這臺超級大腦被細(xì)分到各個領(lǐng)域后,各個領(lǐng)域的歷史人物將被復(fù)活。比如孔子,AI可不是僅僅收集了儒家學(xué)說的所有知識,而是真正掌握了知識,能夠判斷、洞察、推理,還能與大家交流。
“孔老師,有人罵我怎么辦?”
AI會以儒家的觀點(diǎn),回答提問者。
總之,AI不僅能聽清和聽懂,還會讓機(jī)器有知識,甚至自我學(xué)習(xí)。
學(xué)語言的方式也將發(fā)生顛覆性變化,真正擺脫“人機(jī)交互”,實(shí)現(xiàn)“人人交互”,AI能夠完全替代native speaker(說母語的人)。
老謝說,這僅是他自己大膽的預(yù)測,不過AI對人類社會的顛覆性革命太劇烈、太徹底,我們無法想象未來三十年、五十年的AI時代的樣子。他認(rèn)為,若第一次工業(yè)革命對人類的影響是1的話,那么AI革命將是100萬。
在未來很多工作,比如傳統(tǒng)的分析報告師、客服將被機(jī)器替代,但同時AI時代一定能提供更多新的崗位。老謝建議,愿意展望AI時代的同學(xué),不妨讀一讀牛津大學(xué)歷史學(xué)博士尤瓦爾·赫拉利的《人類簡史》和《未來簡史》兩本書,從中構(gòu)思自己的AI時代,找到自己的AI定位。
作為一名AI創(chuàng)業(yè)者,老謝當(dāng)下所做的就足以震撼。
雖然通用人工智能還不能實(shí)現(xiàn),但在“特定用戶、特定場景、特定服務(wù)”之下,語義理解還是能極大地為人們帶來便捷。比如音樂點(diǎn)播這件事,以“搜索周杰倫的歌”為例。海知智能抓取了網(wǎng)頁上所有有關(guān)周杰倫的信息,分門別類,組成一個“周杰倫”的音樂知識圖譜,以便AI能夠理解。這個就相當(dāng)于給AI“學(xué)習(xí)”了一個強(qiáng)大的知識庫。當(dāng)輸入“我要聽周董的歌”時,海知智能不會像其他音樂網(wǎng)站的軟件說“沒有”,因?yàn)樗乐芏褪侵芙軅?。目前,老謝的AI已經(jīng)儲備2000萬個音樂知識圖譜。
像音樂這樣的特定領(lǐng)域,還有很多很多,比如天氣、交通、銀行客服、中小學(xué)教育。老謝還有一個更大的夢想,打造知識圖譜開源平臺,讓大家編寫、共享自己的知識圖譜,打造屬于自己的機(jī)器人(Bot)。endprint