崔宏禹
隨著智能設(shè)備的發(fā)展,預(yù)計(jì)在2020年,全球的物聯(lián)網(wǎng)設(shè)備所產(chǎn)生的數(shù)據(jù)將達(dá)到20B。那么這些設(shè)備所產(chǎn)生的數(shù)據(jù)應(yīng)當(dāng)如何處理?這是一個(gè)非常棘手的問(wèn)題。
微軟的世界觀將我們的智能云平臺(tái)的某些能力,延伸到邊緣設(shè)備中,形成我們所倡導(dǎo)的智能云業(yè)務(wù)。因?yàn)槿绻麑⑺袛?shù)據(jù)處理都放到云端,那么云端的計(jì)算將無(wú)法承受。所以我們盡可能將云端的計(jì)算能力與人工智能遷移到邊緣。
我們將這一觀點(diǎn)分為三個(gè)層面:第一,AI開發(fā)者。針對(duì)AI開發(fā)者我們運(yùn)用的方法非常簡(jiǎn)單,只需要開發(fā)者運(yùn)用人工智能和數(shù)據(jù)背后的能力即可。第二,AI數(shù)據(jù)科學(xué)家。目前每個(gè)企業(yè)都存儲(chǔ)了大量數(shù)據(jù),而數(shù)據(jù)科學(xué)家掌握數(shù)據(jù)算法,所以我們將數(shù)據(jù)科學(xué)家所掌握的算法,運(yùn)用到我們的數(shù)據(jù)中。第三,AI公司。目前,運(yùn)用深度學(xué)習(xí)技術(shù)的成本較高,所以我們建立了基于數(shù)據(jù)的開源平臺(tái),來(lái)深入到某些特定的行業(yè)中,來(lái)解決成本問(wèn)題。
如何打造云計(jì)算的智能平臺(tái)?我們將其分為三個(gè)階段:第一,認(rèn)知;第二,開放的機(jī)器學(xué)習(xí)與深度學(xué)習(xí)平臺(tái);第三,邊緣計(jì)算。
在第一個(gè)部分,我們把與認(rèn)知相關(guān)的服務(wù)開放出來(lái),包括人臉識(shí)別、情緒識(shí)別、年齡識(shí)別等,我們?cè)谌昵熬鸵呀?jīng)將認(rèn)知服務(wù)開放出來(lái)并形成認(rèn)知圖譜,如今該圖譜已積累了100萬(wàn)個(gè)使用者。
如果有些服務(wù)無(wú)法滿足用戶需求,那么客戶可以自行制定機(jī)器所需要學(xué)習(xí)的場(chǎng)景,包括圖片、視頻、語(yǔ)音、CV等。此外,該圖譜的所有能力,都可以部署到公有云與私有云平臺(tái),以及移動(dòng)和物聯(lián)網(wǎng)設(shè)備中。
什么是對(duì)話式人工智能?當(dāng)語(yǔ)音數(shù)據(jù)產(chǎn)生時(shí),我們可能會(huì)利用知識(shí)圖譜或者人機(jī)對(duì)話以及工具等方式將其展現(xiàn)。
為什么我們會(huì)強(qiáng)調(diào)對(duì)話式人工智能服務(wù)?因?yàn)槲覀兿胭x予機(jī)器與人交流的能力。怎么樣構(gòu)建簡(jiǎn)單的對(duì)話式人工智能服務(wù)?我們?cè)趦赡昵伴_發(fā)了Bot Services,目前全球有30萬(wàn)開發(fā)者在使用該項(xiàng)技術(shù)。
Bot Services具備規(guī)劃、部署和體驗(yàn)以及端到端的能力。現(xiàn)今要打造機(jī)器人客服,可直接使用知識(shí)圖譜和人機(jī)交互技術(shù),便可以迅速構(gòu)建。
介紹一下我們的Azure平臺(tái),微軟如何構(gòu)建機(jī)器學(xué)習(xí)和深度學(xué)習(xí)?
第一,最佳數(shù)據(jù)資產(chǎn)。目前,微軟已經(jīng)將自己用來(lái)進(jìn)行機(jī)器訓(xùn)練的數(shù)據(jù),全部貢獻(xiàn)出來(lái)與大家共享,用戶可以直接將這些數(shù)據(jù)下載后加以利用。
第二,我們提供大量的工具鏈。人們?cè)谶\(yùn)用機(jī)器學(xué)習(xí)時(shí),需要分析數(shù)據(jù)背后的規(guī)律,而尋找數(shù)據(jù)規(guī)律最重要的環(huán)節(jié)就是算法,算法的編寫十分困難,而且開發(fā)該項(xiàng)技術(shù)的人工成本也相對(duì)較高,所以我們就要降低人工使用機(jī)器學(xué)習(xí)算法的難度。
我們的平臺(tái)是一個(gè)開放的平臺(tái),所以解決這一問(wèn)題我們運(yùn)用了托拉拽的方式來(lái)實(shí)現(xiàn)機(jī)器學(xué)習(xí),包括參數(shù)調(diào)整、算法選擇和訓(xùn)練集與教練集的分類等。
第三,最優(yōu)算法。什么是最優(yōu)算法?因?yàn)樵诖蠖鄶?shù)機(jī)器學(xué)習(xí)算法中,在開源的算法社區(qū)里,總會(huì)找到適合的場(chǎng)景算法。而在我們的平臺(tái)中,微軟的工程師已經(jīng)將業(yè)界最優(yōu)的算法放置在平臺(tái)中,用戶可以自行選擇是否使用該算法。通過(guò)拖拉拽的方式實(shí)現(xiàn)機(jī)器學(xué)習(xí)過(guò)程后,便可以實(shí)現(xiàn)分布式部署,最終形成規(guī)律和算法。
為什么我們要在開源中開放數(shù)據(jù)?微軟已經(jīng)將業(yè)界最新型的深度學(xué)習(xí)算法整合到我們的平臺(tái)中,并建立了開放的人工智能模型,可提高微軟云計(jì)算平臺(tái)的計(jì)算能力。
通過(guò)計(jì)算,用戶可以將算法部署到任何想部署的環(huán)節(jié)當(dāng)中。同時(shí)我們也提供高效的算力平臺(tái),該平臺(tái)可以解決GPU的硬件設(shè)備算法和GPU的調(diào)度問(wèn)題,并提供完整的端到端的解決方案。
我說(shuō)過(guò)不能將所有工作放到平臺(tái)的后端,因?yàn)榇罅繑?shù)據(jù)處理需要在后端完成,在數(shù)據(jù)處理后就需要將它們遷移到前移的邊緣設(shè)備中。微軟有一個(gè)IoT Hub平臺(tái),在這個(gè)系統(tǒng)中所有操作系統(tǒng)的傳感器全部是開源的。該系統(tǒng)可以通過(guò)我們最典型的安全協(xié)議,每秒可向云端上傳1000萬(wàn)的數(shù)據(jù)量。
目前有很多汽車企業(yè)與共享單車企業(yè),都在利用IoT Hub快速收集數(shù)據(jù)的能力。比如當(dāng)一輛共享單車要解鎖時(shí),如果沒(méi)有網(wǎng)絡(luò),用戶的解鎖請(qǐng)求就無(wú)法傳遞到后端。但當(dāng)我們把云端的處理能力遷移到設(shè)備端時(shí),共享單車就可以不需要網(wǎng)絡(luò)進(jìn)行解鎖。
IoT Hub也是一個(gè)開源的平臺(tái),用戶可以把程序運(yùn)行放入在設(shè)備端,并在后臺(tái)進(jìn)行訓(xùn)練。無(wú)論是人臉識(shí)別模型、聲音識(shí)別模型,還是設(shè)備開關(guān)的處理能力,都可以在這個(gè)平臺(tái)中進(jìn)行使用。
從最簡(jiǎn)單的AI能力,一直到機(jī)器學(xué)習(xí)和深度學(xué)習(xí)平臺(tái)以及邊緣設(shè)備上的智能能力,就形成了微軟的云平臺(tái),與此同時(shí),微軟也希望與更多的合作伙伴進(jìn)行合作,共同擴(kuò)展云與人工智能的能力。
(根據(jù)演講內(nèi)容整理,未經(jīng)本人審核)