Peter+Sayer
谷歌、IBM、微軟和亞馬遜網(wǎng)絡(luò)服務(wù)都將人工智能功能置入到他們的軟件堆棧中 IT領(lǐng)域的人工智能競爭非常激烈,微軟和谷歌在五月份各自的開發(fā)人員大會——Build和I/O上都展示了適用于企業(yè)的、功能強大的、始終可用的人工智能工具。 這不僅僅涉及到工作:現(xiàn)在人工智能軟件的象棋、圍棋,以及一些老的視頻游戲比任何人類玩得都好,甚至汽車也比我們很多人開得好。盡管這些超人類的表現(xiàn)還只是體現(xiàn)在很少的領(lǐng)域中,也要得益于數(shù)十年人工智能研究的應(yīng)用——越來越多的研究,例如Build和I/O,讓人工智能脫離實驗室,進(jìn)入到現(xiàn)實世界中。 同時,像蘋果Siri、微軟Cortana、Amazon.com的Alexa和三星電子的Bixby等虛擬助手的人工智能語音技術(shù)盡管表現(xiàn)得還沒有遠(yuǎn)超人類,但它們根本不需要超級計算機那么強的計算能力。企業(yè)可以在這些邊緣進(jìn)行競爭,例如開發(fā)Alexa的“技能”,讓Amazon Echo所有者與公司進(jìn)行互動,而不用致電其呼叫中心,或者使用各種基于云的語音識別和文本語音轉(zhuǎn)換“即服務(wù)”產(chǎn)品,開發(fā)自己成熟的自動呼叫中心。 人工智能的一些最早的工作旨在以計算機能夠處理和推理的方式來明確地模擬世界人類知識——即使是不能真正的理解。這導(dǎo)致了第一個基于文本的“專家系統(tǒng)”的商業(yè)化。這些早期的系統(tǒng)并不是像人類那樣通過專業(yè)知識,或者在職業(yè)生涯中通過經(jīng)驗學(xué)習(xí)而實現(xiàn)的。相反,首先是經(jīng)歷了人類對其他人類艱難的采訪過程,把他們的隱性知識提煉成明確的規(guī)則之后,把經(jīng)驗灌輸給人工智能。 近年來人工智能研究取得的最大進(jìn)步,最適合企業(yè)應(yīng)用的是讓機器學(xué)習(xí)從經(jīng)驗中獲取知識和理解。讓我們看看機器學(xué)習(xí)進(jìn)步的直接結(jié)果——去年,由谷歌DeepMind子公司開發(fā)的一個程序AlphaGo,令人震驚地以4-1擊敗了曾18次獲得世界圍棋冠軍的李世石。 機器學(xué)習(xí)開始于神經(jīng)網(wǎng)絡(luò)的建立——這種計算模型模擬神經(jīng)細(xì)胞或者神經(jīng)元在我們身體中傳播信息的方式。我們的大腦含有大約1000億個神經(jīng)元,每個神經(jīng)元與大約1000個其他神經(jīng)元相連接。人工神經(jīng)網(wǎng)絡(luò)模擬這些細(xì)胞的集合,每一個都有自己的輸入(輸入數(shù)據(jù))和輸出(該數(shù)據(jù)的簡單計算結(jié)果)。神經(jīng)元按照層來組織,每一層從前一層獲取輸入,并將其輸出傳遞給下一層。當(dāng)網(wǎng)絡(luò)正確地解決問題時,對于能正確預(yù)測答案的神經(jīng)元的輸出,提高其權(quán)重,通過這種方式,網(wǎng)絡(luò)得以學(xué)習(xí)。 分層越多的網(wǎng)絡(luò)會越準(zhǔn)確,也就是所謂的深度神經(jīng)網(wǎng)絡(luò)。早期的時候,它們對計算能力的要求非常高,很難滿足其要求。它們之所以沒有局限于研究,是由于GPU的并行處理能力——以前主要用于顯示游戲,而不是參與其中。 晶體管本身正是這樣做的 這些進(jìn)步為企業(yè)提供了處理大數(shù)據(jù)問題的新方法——但是在某種程度上,要開發(fā)出所需的技術(shù)本身就是一個大數(shù)據(jù)問題。 谷歌工程總監(jiān)Ray Kurzweil在3月份的Cebit全球大會上向與會者介紹說,我們?nèi)祟愃瞄L的是能從很少的幾個例子中進(jìn)行學(xué)習(xí)。 他說:“如果一個重要人物或者你的老板和你談過一兩次,那么,你就會從中學(xué)到一些東西,這就是人類智慧的力量。但是,在深度學(xué)習(xí)領(lǐng)域,有一句話是‘生命從十億個例子開始。” 換句話說,深度神經(jīng)網(wǎng)絡(luò)等機器學(xué)習(xí)技術(shù)需要觀察一個任務(wù)十億次才能做得比人類更好。 為任何事情找到十億個例子本身就是一個問題:AlphaGo的開發(fā)人員在互聯(lián)網(wǎng)上找到了數(shù)千個人類玩家的圍棋記錄,以支持其13層神經(jīng)網(wǎng)絡(luò)的初步訓(xùn)練,但是隨著它變得越來越強,讓它與其他版本的自己進(jìn)行對弈,產(chǎn)生新的比賽數(shù)據(jù)。 AlphaGo采用兩種類型的機器學(xué)習(xí)方法來贏得比賽。使用監(jiān)督學(xué)習(xí)方法分析人類的比賽,把神經(jīng)網(wǎng)絡(luò)應(yīng)該學(xué)習(xí)到的響應(yīng)標(biāo)記輸入數(shù)據(jù)——在個例子中,標(biāo)記是走出能夠致勝的一步棋。 然后,采用另一種稱之為強化學(xué)習(xí)的方法,讓AlphaGo自己和自己比賽。目標(biāo)仍然是贏得比賽,但沒有了輸入數(shù)據(jù)。使用第二神經(jīng)網(wǎng)絡(luò),讓AlphaGo自己去產(chǎn)生并評估每一步棋,在第二神經(jīng)網(wǎng)絡(luò)中,作為監(jiān)督學(xué)習(xí)網(wǎng)絡(luò),神經(jīng)元開始時有相同的權(quán)重,但是隨著它發(fā)現(xiàn)超過人類的策略后,而逐漸修改這些權(quán)重。 第三種方法,即無監(jiān)督學(xué)習(xí),在商業(yè)中比較有用,但在游戲比賽中不太實用。在這種模式下,不給神經(jīng)網(wǎng)絡(luò)關(guān)于其目標(biāo)的信息,而是讓它自己去研究數(shù)據(jù)集,把數(shù)據(jù)按類別分組,并找到它們之間的鏈接。使用這種方式的機器學(xué)習(xí)成為另一種分析工具:它可能會發(fā)現(xiàn)可以通過多種方式進(jìn)行游戲或者結(jié)束游戲,但是讓人類監(jiān)督人員作出判斷應(yīng)該怎么辦。 有很多公司,不論規(guī)模如何,提供了一些人工智能構(gòu)建模塊用于企業(yè)應(yīng)用程序和服務(wù)。小公司往往側(cè)重于具體任務(wù)或者行業(yè);而大公司眼光更高一些,其工具可用于一般的應(yīng)用。 很大程度上歸功于對Watson產(chǎn)品的大力宣傳,IBM在人工智能方面已經(jīng)深入人心——盡管它傾向于采用“認(rèn)知計算”這個術(shù)語。 Watson系列包括的工具可以用于創(chuàng)建聊天機器人,發(fā)現(xiàn)文本數(shù)據(jù)中的模式和結(jié)構(gòu),以及從非結(jié)構(gòu)化文本中提取知識等。IBM還通過具體行業(yè)信息訓(xùn)練了一些Watson服務(wù),為用戶提供醫(yī)療保健、教育、金融服務(wù)、商業(yè)、營銷和供應(yīng)鏈運營等定制服務(wù)。 IBM及其合作伙伴可以幫助把這些與現(xiàn)有業(yè)務(wù)流程集成在一起,或者開發(fā)人員自己去進(jìn)行開發(fā),因為可以從IBM Bluemix云服務(wù)門戶網(wǎng)站上通過API獲取大部分工具。 認(rèn)知也是微軟喜歡用的術(shù)語。在微軟認(rèn)知服務(wù)品牌下,它為開發(fā)人員提供了將機器學(xué)習(xí)技術(shù)整合到自己應(yīng)用程序中的API。這些包括把語音轉(zhuǎn)換成文本并理解其意思的工具;檢測和糾正文本中的拼寫錯誤;翻譯語音和文本;研究學(xué)術(shù)論文、其作者和出版刊物之間的關(guān)系。還有一個稱之為Bot Framework的服務(wù),用于構(gòu)建聊天機器人,并將它們連接到Slack、推特、Office 365郵件和其他服務(wù)。微軟還提供一個開源工具包,企業(yè)可以下載它,采用自己大量的數(shù)據(jù)集來訓(xùn)練他們的深度學(xué)習(xí)系統(tǒng)。 在5月初進(jìn)行開發(fā)時,它提供了以前只能預(yù)覽的服務(wù)版本,包括面部標(biāo)記API和自動“內(nèi)容主持人”,可以準(zhǔn)許或者阻止文本、圖像和視頻,將不好處理的案例轉(zhuǎn)發(fā)給人類進(jìn)行檢查。還有一種新的定制圖像識別服務(wù),企業(yè)可以利用它來訓(xùn)練識別他們感興趣的對象,例如工廠中使用的零件。 谷歌提供了很多機器學(xué)習(xí)技術(shù),這些技術(shù)曾作為谷歌云平臺的一部分在谷歌內(nèi)部使用。這些系統(tǒng)可用來進(jìn)行特定任務(wù)的訓(xùn)練,也可以作為干凈的白板用于對您的數(shù)據(jù)進(jìn)行訓(xùn)練,包括圖像、文本和視頻分析、語音識別和翻譯等。還有一種自然語言處理工具,能夠從聊天機器人和呼叫中心使用的文本中提取出情感和含義。甚至還有一個備受關(guān)注的工作搜索工具,根據(jù)求職者的位置、資歷和技能來匹配空缺的職位。 對于亞馬遜網(wǎng)絡(luò)服務(wù),它允許企業(yè)為Amazon Echo設(shè)備中嵌入的數(shù)字助理Alexa創(chuàng)建新的“技能”或者語音控制應(yīng)用程序,并提供了支持Alexa“即服務(wù)”的很多技術(shù)。最新的是呼叫中心即服務(wù),亞馬遜連接按照每次呼叫和每分鐘進(jìn)行計費。這實現(xiàn)了與亞馬遜語音識別和理解服務(wù)的集成,支持企業(yè)創(chuàng)建更復(fù)雜的交互式語音響應(yīng)(IVR)系統(tǒng)。 當(dāng)明天到來時 這些服務(wù)都已經(jīng)投入使用,但還有許多其他服務(wù)在等著我們。 例如,微軟已經(jīng)邀請企業(yè)測試其他幾項服務(wù)的“預(yù)覽”版本。這些包括Emotion API圖像分析工具,可以識別照片中臉部表達(dá)的情感,給憤怒、蔑視、厭惡、恐懼、幸福、悲傷和驚喜等表情分配相對的概率。(您可以發(fā)一個自拍照,去試試看。)采用改進(jìn)后的公司語音工具,企業(yè)可以調(diào)整引擎以適應(yīng)特定的區(qū)域或者環(huán)境(定制語音服務(wù)),甚至能識別揚聲器。 一款名為QnA Maker的新工具從文本語料庫中提取出常見問題,供聊天機器人作為參考答案。目前為止的結(jié)果還讓人感覺有點笨拙,這可能是源文本而不是QnA Maker的問題,QnA Maker很可能還沒有讀取十億個常見問題來展開自己的學(xué)習(xí)。 在3月份舊金山舉行的谷歌2017下一代云大會上,該公司發(fā)布了其云視頻智能API的私有測試版,支持測試人員通過搜索描述內(nèi)容的名詞或者動詞來查找相關(guān)的視頻剪輯。為進(jìn)一步激發(fā)對其服務(wù)的需求,谷歌與風(fēng)險投資公司“數(shù)據(jù)采集和涌現(xiàn)資本”合作成立了新機器學(xué)習(xí)初創(chuàng)公司,并在加利福尼亞州山景城開設(shè)機器學(xué)習(xí)高級解決方案實驗室,客戶可以在此與谷歌專家一起工作,應(yīng)用機器學(xué)習(xí)來解決自己的問題。 兩個月后,在谷歌I/O上,該公司展示了用于手機的TensorFlow Lite平臺,以及運行機器學(xué)習(xí)工作負(fù)載的更強大的處理器,即云TPU(張量處理單元)。它還公布了自己內(nèi)部使用的一些機器學(xué)習(xí)API的詳細(xì)信息。 雖然大公司在人工智能研究領(lǐng)域并沒有進(jìn)行壟斷,但對人才的競爭卻是非常激烈的。臉書有自己內(nèi)部的人工智能研究部門,組織內(nèi)部培訓(xùn)活動,以提高員工對機器學(xué)習(xí)的認(rèn)識。 一些從事人工智能研究的大公司愿意公布其研究結(jié)果,并在開源許可下發(fā)布了大部分代碼。即使是大家關(guān)注的神秘的蘋果公司也在去年年底發(fā)表了第一篇研究論文。 但他們并沒有放棄“皇冠上的寶石”。這些機器學(xué)習(xí)工具包和云服務(wù)都非常好,很顯然,未經(jīng)訓(xùn)練的神經(jīng)網(wǎng)絡(luò)對于典型的企業(yè)和對于16歲的高中畢業(yè)生來說都同樣有用。 就像參加招聘時經(jīng)驗很重要一樣,像谷歌、臉書、亞馬遜甚至蘋果和微軟這樣的公司正在收集Kurzweil所說的數(shù)十億個例子。被點擊的每一搜索結(jié)果,被接受的每次購物推薦,被標(biāo)記的每幅照片,或者要查詢的運動得分等等,都被添加到收集中。 當(dāng)然,十億個例子并不總是必要的:計算機可以學(xué)習(xí)做一些事情,就像人類以很少的數(shù)據(jù)就能夠工作一樣,而且對于今天的很多任務(wù)來說,幾個例子可能就已經(jīng)足夠了——特別是如果計算機能夠?qū)⑵錈o法處理的情況提交給人類監(jiān)督者的情形。 就在您身邊 無論如何,這是很多開發(fā)人工智能聊天機器人的企業(yè)所關(guān)注的。他們的數(shù)據(jù)點遠(yuǎn)遠(yuǎn)不到十億個,他們?nèi)匀幌M裎④決nA Maker這樣的服務(wù)能幫助他們以新方式為客戶服務(wù)。 一個例子是英國關(guān)節(jié)炎研究所,這是一個慈善組織,資助關(guān)節(jié)炎癥的醫(yī)學(xué)研究,并向患者提供咨詢。它正在使用IBM的Watson對話API來構(gòu)建虛擬助理,回答有關(guān)關(guān)節(jié)疼痛的問題,并提出一些適當(dāng)?shù)腻憻捊ㄗh來緩解癥狀。 該組織的目標(biāo)有兩方面:減輕現(xiàn)有電話支持人員的工作,創(chuàng)建一種新的對話渠道,通過它可以在將來提供其他服務(wù)。 助理已經(jīng)學(xué)到了關(guān)于50種肌骨骼病癥常見問題的1000個答案。 英國關(guān)節(jié)炎研究所媒體活動經(jīng)理Shree Rajani說:“我們將擴展其功能,以便在適當(dāng)時候包括關(guān)于醫(yī)療和外科治療以及飲食的信息?!?最初的開發(fā)歷時大約五個月,其中包括第一輪測試,約有三百名試用用戶參與其中,但助理還沒有準(zhǔn)備好迎接公眾。Rajani說,第二輪用戶接受測試正在進(jìn)行之中,應(yīng)該在今年下半年的時候出現(xiàn)在我們網(wǎng)站上。 沒有被接受的一個原因是名字:最初被稱為“Ask Arthy”,根據(jù)英國關(guān)節(jié)炎研究所的隱私政策,該服務(wù)現(xiàn)在被稱為“關(guān)節(jié)炎虛擬助理”。 該政策強調(diào)了歐洲企業(yè)的聊天機器人使用美國云服務(wù)時面臨的風(fēng)險:雖然這一助理還沒有正式啟用,但是在隱私政策的2890個字中,大約460個字是專門針對虛擬助理的,在網(wǎng)站條款和條件中另外還有490個字是關(guān)于它的警告的。這實際是提醒用戶,他們告訴助理的所有內(nèi)容將被傳送到美國的IBM服務(wù)器,因此他們不應(yīng)該在對話中自愿地提供任何個人信息——當(dāng)用戶被問及敏感的醫(yī)療問題時,這就需要微妙的平衡技巧。 另一急于采用機器學(xué)習(xí)來推動新一輪客戶服務(wù),但也非常擔(dān)心隱私問題的領(lǐng)域是銀行。 埃森哲最近進(jìn)行的一項調(diào)查發(fā)現(xiàn),在未來三年內(nèi),78%的美國銀行將依靠人工智能在處理自動化系統(tǒng)時獲得更接近人類的經(jīng)驗,其中76%的希望開展競爭,怎樣讓技術(shù)對客戶來說是不可見的。 不僅僅是美國比利時銀行BNP Paribas Fortis也正在采用聊天機器人來回答400個呼叫中心工作人員目前必須處理的一些問題。該銀行的零售部總監(jiān)Michael Anseeuw最近告訴比利時報紙,當(dāng)客戶更喜歡和人類交流時,聊天機器人甚至可以幫助員工更快的找到正確答案。 人類與機器之間緊密的工作關(guān)系使得機器更容易提高其性能。 數(shù)字推理公司創(chuàng)始人兼總裁Tim Estes說:“您希望以自動化的方式為人們提供支持,因為您所做的是建立基礎(chǔ)設(shè)施,從人類那里學(xué)到怎樣更好的進(jìn)行抽象決策?!?其Synthesys產(chǎn)品將機器學(xué)習(xí)技術(shù)應(yīng)用于業(yè)務(wù)信息分析,并且可用于識別潛在的欺詐性交易,以及出于合規(guī)目的,標(biāo)記有風(fēng)險的員工通信記錄。 Estes預(yù)計在不久的將來,如果在沒有計算機幫助的情況下進(jìn)行這種“分類篩選”決定,會變得非常不經(jīng)濟。 他說:“可以把人類的評估模式教給機器,并應(yīng)用它們,但您不一定會采用機器做出的決定——重要的是采用還是不采用,在沒有人類參與的情況下最終做出決策。” 在接下來的兩三年里,機器學(xué)習(xí)系統(tǒng)最有效的應(yīng)用是用來篩選人類做出的決定,確定哪些決定要優(yōu)先考慮。 他說:“我不認(rèn)為沒有機器輔助的分類決策會成為經(jīng)濟高效的商業(yè)模式?!?Peter Sayer——IDG新聞服務(wù)巴黎局局長,工作涉及IDG新聞服務(wù)的歐洲公共政策、人工智能、區(qū)塊鏈和其他技術(shù)突發(fā)新聞。endprint