張貝貝
雖然業(yè)界普遍對人工智能的應用前景看好,但AI系統(tǒng)的部署、建設并非一件容易事。這一點在企業(yè)真正的AI實踐中會表現得更為直觀。
近年來,人工智能技術在圖像(物體識別、人臉識別等)、自然語言(語音識別、翻譯、對話機器人)、智能醫(yī)療、智能推薦(廣告、新聞、視頻)等領域取得了飛速發(fā)展。不但眾多初創(chuàng)企業(yè)將人工智能研發(fā)作為揚帆起航的契機,許多傳統(tǒng)企業(yè)也將其作為自身轉型升級所必備的利器。
人工智能正在走出象牙塔,走近普通企業(yè)和大眾。與此同時,人工智能技術對計算資源的需求也快速增加,因而“云計算如何服務于人工智能產業(yè)的發(fā)展”已成為公有云服務的一個新方向。
近日,由國內云服務商UCloud發(fā)起的“中立可信賴,賦能夢想者2018 Think in Cloud”峰會于北京召開。本次峰會聚集了來自互聯(lián)網、企業(yè)服務、人工智能等領域的企業(yè)。在AI專場,來自UCloud的專家就如何利用公有云落地AI,UCloud如何通過AI平臺賦能企業(yè)部署AI等話題進行了深入的分析和解讀。
雖然業(yè)界普遍對人工智能的應用前景看好,但AI系統(tǒng)的部署、建設并非一件容易事。這一點在企業(yè)真正的AI實踐中會表現得更為直觀。
實際上,無論是初創(chuàng)企業(yè)想要踏上AI創(chuàng)新之旅,抓住人工智能發(fā)展的浪潮,還是傳統(tǒng)企業(yè)希望借助AI之力進行企業(yè)的轉型升級,AI系統(tǒng)的設計、部署和運維都需要提升更多的能力和多維度蓄力。
UCloud AI平臺技術專家宋翔認為,在AI落地過程中可能會遇到的一些技術挑戰(zhàn)非常多,總結下大致有三部分。
第一部分是技術環(huán)境。技術環(huán)境是一個非常大的挑戰(zhàn),整個技術環(huán)境涉及AI的框架,還有很多的算法庫,包括一些GPU的技術庫,還有各種各樣的設備,以及各種各樣的存儲,這些交叉起來會產生一個非常復雜的環(huán)境,如何把控這個環(huán)境,使得自己的研發(fā)人員在使用這些環(huán)境的時候更便捷,這是一個挑戰(zhàn)。
第二部分是當深入到AI系統(tǒng)的核心建設時,就要考慮算法兼容性、平臺可用性等問題,比如系統(tǒng)能不能去兼容不同的AI算法,在公司業(yè)務擴張的時候,能不能做到一個業(yè)務的橫向擴張或者快速地擴展,還有系統(tǒng)能不能是分布式的,能不能做到一些高可用或者容災的能力。當有新的硬件和新的技術發(fā)生的時候,系統(tǒng)能不能快速的跟上這些新的硬件和新的技術的發(fā)展。
第三部分是投入產出比的問題。所有投資AI的人都要考慮投入產出比,如何以較小的投入得到較高的回報,比如當開展AI應用的時候,如何控制研發(fā)成本,讓研發(fā)人員更關注于算法,而不是一些AI環(huán)境的部署或者資源管理。
在真正的部署實踐中,企業(yè)無一例外地發(fā)現,想要走上AI之路,并非坦途大道。那么,UCloud如何解決企業(yè)實際部署落地AI過程中的一些困難呢?
平臺化服務加速AI落地
據了解,早在2017年,UCloud提出了“CBA”戰(zhàn)略,其中“C”就是Cloud Computing(云計算),“B”是Big Data(大數據),“A”是AI(人工智能)。UAI-Inference就是UCloud布局AI的重要落地之舉。具體來看,可以理解為UCloud在AI領域是一個提供AI的PaaS平臺,降低AI應用的落地門檻,另一方面聯(lián)合AI公司基于該平臺打造行業(yè)解決方案。
UAI-Inference面向初創(chuàng)企業(yè)、傳統(tǒng)企業(yè)AI轉型而生,旨在提供易部署、易運維、更安全以及多AI框架支持的海量AI在線服務節(jié)點,自動實現負載均衡、擴容縮容。按實際使用量計費,普遍適用于常見的AI在線服務場景,如圖像識別、自然語言處理。
在本次大會的AI論壇中,UCloud實驗室負責人兼高級研發(fā)總監(jiān)葉理燈進行了“基于云計算構建機器學習系統(tǒng)的實踐”的演講,從技術、軟件架構的角度剖析了在云計算環(huán)境下面,如何基于云計算提供的服務,搭建一個高可用、低成本的機器學習系統(tǒng),以加快機器學習的落地,并降低應用門檻和成本。
他提出,這幾年云計算發(fā)展有兩個趨勢,托管的力度越來越小,從硬件到函數力度越來越小。另外對研發(fā)越來越友好。目前PaaS服務非常豐富,除了對象存儲、IWS3、內存存儲、快存儲等,還有很多DB類的數據庫服務、消息推送、用戶認證等。這些服務對于研發(fā)來說是非常有利的。“推動這些發(fā)展的背后的動力我覺得有兩大動力,第一是成本,第二是效率。因為不管用IaaS還是PaaS,開發(fā)者或者這個公司的負責人去維護虛擬機,還得對這個資源進行運維,不是完全的應用。所以后面這些豐富的功能的出現是為了解決資源維護,從而加速應用。”
在UCloud看來,其實最核心的方法就是要平臺化。宋翔總結道:“利用公有云來做AI落地,首先享受到的是一些IaaS的服務,比如說充足的網絡資源、存儲資源,其次你會有一些技術的環(huán)境,比如說我有一些技術的虛擬機鏡像的能力,或者容器鏡像的服務,這樣可以降低一定的開發(fā)應用的成本。PaaS服務就會提供更多的能力,比如說環(huán)境的分裝功能,我們提供了一些基礎的鏡像庫,也提供了一些算法的鏡像庫,同時PaaS服務會提供分布式系統(tǒng),比如說我們提供了一站式AI訓練或者AI在線服務的系統(tǒng),同時也支持分布式的訓練。”
對于AI機器學習系統(tǒng)的落地,葉理燈認為可以分為3個步驟:Build、Train、Inference。Build的意思是,根據面臨的技術性的問題選定合適的算法,設定相關的參數,比如訓練的深度和分類的個數。Train就是根據設定的那些參數拿出去做訓練,訓練之后的模型要變成在線服務,這就是Inference的過程。
大家可以看到,如果從數據流的角度來說,Inference是個很簡單的過程,那么怎么構建一個系統(tǒng)來滿足Inference特性的系統(tǒng)需求呢?葉理燈總結有幾點。第一,無狀態(tài)的需求。第二,AutoScaling(自動可擴容)。第三,高可用性。第四,高并發(fā)。第五,海量計算?;谶@樣的需求和背景,構建這個系統(tǒng)分3步來進行:第一步,建設一個底層的計算平臺。第二步,上層APP管理,方便用戶去管理模型。第三步,提供SDK。方便用戶在不同的框架上面來使用系統(tǒng)。
據介紹,為了幫助客戶解決AI模型訓練過程面臨關鍵的問題,UCloud AI Train平臺基于UCloud性能強大的GPU云主機集群構建,為AI訓練任務提供充足的計算能力。同時,提供一站式訓練任務托管服務,包括自動實現計算節(jié)點調度、訓練環(huán)境準備、數據上傳下載以及任務容災等功能,能夠幫助用戶從繁雜的GPU資源采購、管理、運維工作中解放出來。
另外,UAI Train平臺按照實際計算消耗付費,不但可以降低GPU的成本投入,還可以避免閑置資源浪費。
AI發(fā)揮價值離不開行業(yè)應用
去年,UCloud與英特爾達成戰(zhàn)略合作,雙方針對數據中心的存儲能力、計算能力以及網絡傳輸、軟件優(yōu)化等方面實現深層次合作,不僅如此,隨著云計算的普及,雙方的合作也希望能給人工智能領域的發(fā)展提供新的思路和方向。UCloud與英特爾的全面合作,基于英特爾至強可擴展處理器和英特爾Caffe框架優(yōu)化等相關技術和產品,幫助企業(yè)客戶快速便捷部署云計算和人工智能基礎設施,為UCloud最終客戶帶來更多價值。
人工智能一定要與行業(yè)結合,形成真正有效的行業(yè)智能,才能助力傳統(tǒng)行業(yè)轉型升級,推進人工智能與實體經濟快速融合。同時人工智能技術作為新一輪產業(yè)變革的核心驅動力,也必須與各行各業(yè)融合才能發(fā)揮作用。
葉理燈表示:“人工智能只是一門技術,它不是一個行業(yè),它一定要跟行業(yè)結合起來,滲透到行業(yè)里面去,這才是人工智能的價值所在。UCloud是一個中立平臺,我們的宗旨是上不碰應用,下不碰數據。人工智能價值的產生一定要解決行業(yè)問題?!?/p>
關于應用,宋翔舉例道,一家從事互聯(lián)網社交的公司希望通過他們自己的圖片識別的業(yè)務給自己的客戶打上更多的業(yè)務標簽,這樣可以提升自己的精準推送的能力,他們的需求其實非常簡單,他自己開發(fā)了一套圖片識別的服務,他需要把這個服務變成一個高可用的在線服務,他每天會有大量的用戶圖片信息發(fā)送到服務里面去,給這些圖片打標簽。
在使用AI平臺的時候,用戶就會發(fā)現有幾個非常大的好處,第一個就是用戶可以快速地部署AI識別服務,因為對于用戶來說,整個研發(fā)團隊不是很大,他在使用UCloudAI在線服務平臺的時候不需要投入人去研發(fā)在線的服務平臺,只需要直接用就行了。由于整個平臺有大量CPU的資源供他使用,所以對于它的業(yè)務高峰來說,他完全有充足的資源來保證整個業(yè)務的穩(wěn)定,最后因為UCloud整個平臺是按需收費的,其實對于他們來說,每個月在這個平臺上的月銷也是非常低的,這樣大量節(jié)約了他們使用的成本。
那么對于UColud來說,哪些是他們關注的第一梯隊需要利用AI賦能的用戶呢?
葉理燈認為,如果從AI的需求來看的話:第一類:純AI的算法公司。這類公司大多因為是創(chuàng)業(yè)公司,可能不能儲備太多資源。第二類:傳統(tǒng)企業(yè)。傳統(tǒng)企業(yè)都會想到用機器學習來解決效率問題,就是人工做的事情能不能用AI做。但是傳統(tǒng)企業(yè)的軟件架構能力和IT建設的能力又不足,其實這個比較適合用公有云來賦能。第三類是一些有能力的互聯(lián)網公司,但是只是在某一方面有特殊需求,這類只用Pass系統(tǒng)就可以了。
宋翔介紹:“我們提供的思路主要是圍繞客戶的需求。第一個思路:一定要方便、便捷。對于落地來說,無論是傳統(tǒng)企業(yè)還是互聯(lián)網企業(yè),我們希望他們在落地過程中,不會有太多的絆腳石,能快速地推進,因此我們提供了很多基礎服務,比如說通過提供鏡像、提供一些服務平臺的服務,去幫助用戶快速落地。第二個思路:解決痛點,成本的問題。無論部署什么系統(tǒng),使用什么平臺,最終都是要降低成本,提供效率,直達業(yè)務痛點的。”
本次UCloud Think in Cloud 2018于5月15日在北京富力萬麗酒店圓滿落幕。除了云領域的最新技術趨勢解讀和UCloud兩大產品重磅發(fā)布,大會特別策劃的AI和區(qū)塊鏈技術專場,分享和呈現了“互聯(lián)網+”時代下,云計算在大數據交換及應用、人工智能、區(qū)塊鏈、物聯(lián)網等諸多行業(yè)領域的應用與實踐,也向業(yè)界傳達了最前沿的技術熱點與行業(yè)洞察,為開發(fā)者提供了一些啟發(fā)和借鑒。