塞爾達(dá)·耶各拉普 劉荻
IBM、谷歌、微軟和亞馬遜這四大云巨頭都將機(jī)器學(xué)習(xí)作為一項服務(wù)來提供,但是它們實際開展的方式就跟這些公司本身一樣大不相同。
任何一個云想要受到重視,就得滿足功能方面越來越高的標(biāo)準(zhǔn)。機(jī)器學(xué)習(xí)似乎也在這份功能名單上,因為各大云服務(wù)提供商現(xiàn)在都以此作為一項主打功能。
但是它們?nèi)绾胃氵@一塊又是另一碼事。除了“精選API vs開放式算法市場”這種模式外,還有“一應(yīng)俱全vs剛剛好”這種變種模式。IBM、谷歌、微軟和亞馬遜這四大云服務(wù)提供商在機(jī)器學(xué)習(xí)方面的玩法如何?
IBM:Watson掌舵,控制航向
IBM初次宣布要把Waston人工智能系統(tǒng)轉(zhuǎn)變成一項消費(fèi)服務(wù)時,問題接踵而至。它會是什么樣子?它將如何被消費(fèi)?但最重要的是,它會給予多大的支持,幫助IBM竭力將自己重望成云巨頭?
兩年后,IBM已經(jīng)在其Bluemix平臺即服務(wù)(PaaS)上推出了一系列基于機(jī)器學(xué)習(xí)的服務(wù)(比如天氣預(yù)報),或者用于分析語言、識別圖像、翻譯語言、分析情緒和語調(diào)等方面的系統(tǒng)。
在云端提供某種機(jī)器智能的所有公司當(dāng)中,IBM的目標(biāo)最野心勃勃。更重要的是,IBM還一直在竭力用更接地氣的工具補(bǔ)充高大上的工具,主要涉及分析和報告。(日益改進(jìn)的Waston似乎也是IBM在天氣和醫(yī)療保健等多個領(lǐng)域,宣布多次戰(zhàn)略性收購的動力)。
問題不是Waston服務(wù)會不會得到實際采用一一它們遲早會得到實際采用,問題是這些服務(wù)會不會以IBM覺得舒適的步伐得到采用,IBM對此可謂孤注一擲。這些服務(wù)大多數(shù)需要時間才能找到使用場合,而IBM早已被廣泛接受的Spark服務(wù)(或者其類似AWSLambda的新服務(wù):OpenWhisk)更容易立即賺錢。
一些企業(yè)組織已經(jīng)開始另辟蹊徑,將Watson的分析服務(wù)投入使用。但是,雖然IBM表示它認(rèn)為自己能夠把這一切發(fā)展成年收入達(dá)1 D0億美元的業(yè)務(wù),但是Waston到目前為止得到的采用根本不足以抵補(bǔ)IBM一路下滑的收入。
微軟:為客戶而建
IBM有Watson,微軟則有Project Oxford,這是一組經(jīng)過精選的高級API,涵蓋機(jī)器視覺、語音識別和語音分析。雖然API不如Watson的API來得廣泛(咱們還是面對現(xiàn)實吧,How-old.net不如參加智力競賽電視節(jié)目《危險邊緣》的Watson那么有趣),但是微軟的野心幾乎如出一轍:借助一套充分利用機(jī)器學(xué)習(xí)的經(jīng)過精選的專有API。
Azure Machine Learning Studio也許是微軟的機(jī)器學(xué)習(xí)野心中更重要的一部分。人們可以拿來自己的數(shù)據(jù),在上面訓(xùn)練機(jī)器學(xué)習(xí)模型,然后通過REST接口,將因而獲得的模型作為API重新共享。IBM在Bluemix上的Predictive Analytics服務(wù)也有類似功能,不過微軟的Studio問世時間更久,而且讓人覺得更加通用。
IBM和微軟都試圖創(chuàng)建兩種不同版本的機(jī)器學(xué)習(xí)服務(wù)。一種版本是關(guān)起門未構(gòu)建的(一向如此),提供一套精選的數(shù)據(jù)集和經(jīng)過改善的行為(Watson API和Project Oxford)。另一種版本是一個平臺,新型的機(jī)器學(xué)習(xí)服務(wù)可以在上面構(gòu)建、共享,甚至賺錢(Azure Machine Learning Studio和Predictlve Analytlcs)。
但是微軟和IBM最大的區(qū)別不在于服務(wù),而在于動機(jī)。微軟試圖轉(zhuǎn)向云計算,以便自己能夠適應(yīng)未來的形勢,這一戰(zhàn)略得到了其他成功的業(yè)務(wù)領(lǐng)域(比如游戲)的幫助,因而它并沒有感覺到像IBM那么大的生存壓力。但是這并不是說,微軟就不知道該走哪條路。
亞馬遜和谷歌:極簡主義者
如果說谷歌、尤其是亞馬遜有一個原則作為其云計算解決方案的指導(dǎo),那就是“少即是多”。也許更貼切的說法是“剛剛好嫌多”,這包括這兩家公司提供基于云的機(jī)器學(xué)習(xí)服務(wù)的方式。
以谷歌為例,谷歌云平臺(Google Cloud Platform)目前只提供兩種類似本文介紹的其他機(jī)器學(xué)習(xí)服務(wù)的服務(wù):Google Translate(這是支持谷歌現(xiàn)有的機(jī)器翻譯引擎的API)和Google Prediction API。前者是一種專有的API,由谷歌獨(dú)家維護(hù)。后者盡管名字不起眼,卻是一種包容性廣泛的服務(wù),允許用戶上傳數(shù)據(jù),并訓(xùn)練模型,其方式如同微軟Azure Machine Learning Studio。(數(shù)據(jù)可以從Google BigOuery之類的谷歌服務(wù)獲?。?。
Amazon Machine Learning類似Google Prediction API,原因在于模型可以用數(shù)據(jù)來訓(xùn)練,并用來進(jìn)行預(yù)測。這是一種有意簡化的服務(wù),為的是吸引只想解決某個特定狹窄問題的開發(fā)人員,或者是由于亞馬遜想先試水市場。
在亞馬遜和谷歌這兩種情況下,它們的目標(biāo)都是開發(fā)人員,這個群體有狹窄定義的要求,又有已經(jīng)在那些云上的數(shù)據(jù)一一這就是“剛剛好”模式。IBM和微軟將目光投向廣泛多得多的領(lǐng)域,雖然IBM努力想擁有最多的服務(wù),但是輸?shù)米顟K的可能也是它。