施然
芯片之外,AI底層框架的戰(zhàn)爭已經(jīng)打響。繼百度和華為之后,AI獨角獸曠視科技也宣布開源自研的底層框架平臺“天元”。
過去半年,曠視科技備受矚目,2019年8月25日,曠視提交港股招股書,被認為將成為“AI第一股”。據(jù)知情人士獲悉,曠視已通過聆訊且上市進程仍在正常推進中。
在中美貿(mào)易戰(zhàn)背景下,外界普遍認為,將核心技術(shù)掌握在自己手里很有必要,在AI領(lǐng)域,芯片和底層框架是基礎設施,分別提供算力和算法。但這是一件有門檻的事情。首先不是所有公司都有能力從0到1地做底層框架,其次也不是誰都有能力開源?!癇ATH有需求也有必要做,其他公司可以選擇在已有平臺上做修改,或是做一個可供自己使用的底層框架。”華創(chuàng)資本創(chuàng)始合伙人熊偉銘告訴筆者。
多位AI行業(yè)人士和關(guān)注AI領(lǐng)域的投資人告訴筆者,底層框架是大公司的游戲,因為投入巨大,且短期內(nèi)并不能直接帶來商業(yè)價值,所以真正的AI平臺級的技術(shù)和產(chǎn)品還未出現(xiàn)?!耙环矫?,想要做底層框架平臺是持久性研發(fā)投入,必須要有足夠的現(xiàn)金流支持。另一方面,底層技術(shù)和平臺產(chǎn)品的專業(yè)門檻決定了,不是有資金和資源的大公司都可以做這件事情?!币晃恢麢C構(gòu)投資人說道。
截至2019年6月30日,曠視的研發(fā)團隊共計1400多人,于2016年、2017年、2018年及截至2019年6月30日止六個月,曠視的研發(fā)投入分別為人民幣78.2百萬元、人民幣205.4百萬元、人民幣612.9百萬元及人民幣468.3百萬元。
曠視表示,底層的研發(fā)投入是在曠視創(chuàng)立之初便延續(xù)下來的戰(zhàn)略,布局AI底層框架和技術(shù)平臺是從2014年就開始一直在做的事情,而選擇在這個時間節(jié)點進行開源是戰(zhàn)略的延續(xù)動作而不是新項目。
“AI+”已經(jīng)成為新的趨勢,越來越多的傳統(tǒng)行業(yè)希望融入新興技術(shù),這也推動了AI產(chǎn)業(yè)的快速發(fā)展。第三方分析機構(gòu)CBInsights發(fā)布的《2019年AI趨勢報告》中指出,從行業(yè)采用度和市場優(yōu)勢兩個分析維度來看,開源底層的深度學習框架都是趨勢的核心,已具備極高的行業(yè)采用度,且市場會越來越大。
對于開發(fā)者來說,是否開源和什么時候開源不是最重要的,最重要的是開源系統(tǒng)所具備能力是否真的好用,是否能夠幫助他們解決問題,以及開源社區(qū)的活躍度,和能夠持續(xù)更新升級的能力。
對于另一些企業(yè)用戶來說,他們只需要能降本增效的產(chǎn)品和服務。這就好比消費者想要購買的是一臺好用的手機,而不一定對某個操作系統(tǒng)有明確要求。
曠視成立于2011年,成立之初就專注于計算機視覺技術(shù)。一開始技術(shù)人員們用Theano框架寫模型代碼,訓練神經(jīng)網(wǎng)絡,跑一次訓練要編譯好幾個小時。
AI能夠?qū)崿F(xiàn)從技術(shù)到應用,需要算法、算力和數(shù)據(jù)的支持,算力取決于芯片/顯卡的性能,算法則需要底層框架的驗證,也就是行業(yè)人士常說的“跑算法”。就像是道士“煉丹”的過程,要煉好一顆解決行業(yè)問題的“AI靈丹”,需要將各種“金木水火土”的海量數(shù)據(jù),灌入到底層框架的“煉丹爐”當中,等待結(jié)果,而煉丹爐的性能和效率就決定了這顆丹靈還是不靈。早期的框架是完全手工的,需要研究員一層層寫配置文件,很不靈活。
隨著網(wǎng)絡越來越復雜,曠視認為Theano已經(jīng)不能滿足需求,開始在這些初代框架上簡單包一層代碼,解決代碼冗長的問題。但訓練效率仍舊滿足不了快速變化的需求,一套“煉丹”程序可能需要3周-5周才能得到驗證。
2014年初,曠視研究院幾名實習生開始嘗試研發(fā)原創(chuàng)底層框架,不到半年的時間,曠視自研的初版深度學習框架MegEngine誕生。接下來,研究院與業(yè)務團隊深入溝通,了解一線需求,并復現(xiàn)業(yè)務所需神經(jīng)網(wǎng)絡,之后曠視研究院又用了半年時間,在2015年中完成了自研框架與內(nèi)部所有業(yè)務的接軌,業(yè)務線上的模型全部換成了自研框架訓練出來的版本,解決了算法訓練效率的問題。
與此同時,曠視也提出了一個新的設想:如果要長期發(fā)展,就要構(gòu)建一套能夠統(tǒng)籌數(shù)據(jù)、算法和算力的AI平臺級產(chǎn)品,也就是一套專門服務AI的“Visual Studio”。于是,曠視在2014年同步構(gòu)建了提供算力調(diào)度支持的深度學習云計算平臺MegCompute,以及數(shù)據(jù)管理平臺MegData。與MegEngine共同構(gòu)成了曠視自有的AI生產(chǎn)力平臺Brain++。
2015年11月9日,谷歌開源底層學習框架TensorFlow,曠視內(nèi)部隨即掀起一場激烈爭論。一些人認為,大廠已經(jīng)開源了,直接用大廠的就可以;另一些人認為,底層技術(shù)是需要與前端業(yè)務相匹配的,還是有繼續(xù)做的價值。
最重要的一次討論持續(xù)24小時,最后大家決定,做一次規(guī)?;菥?,深度對比Tensorflow和MegEngine的性能,結(jié)果是TensorFlow的響應速度竟然比MegEngine慢了10倍,這讓曠視內(nèi)部統(tǒng)一了思想,堅定了繼續(xù)自研底層框架的想法,持續(xù)對AI底層生產(chǎn)力平臺的投入也成為公司的長期戰(zhàn)略。
對于曠視來說,自研底層框架,一是可以更好地和業(yè)務相結(jié)合,讓割裂的算法生產(chǎn)與方案形成升級為一體式全棧解決方案;二是能減少人員成本。曠視發(fā)現(xiàn),在具體的技術(shù)落地過程中,很多公司都還要再組建一個AI研究團隊,培養(yǎng)AI人才的成本非常高,最后帶來的收益,還不夠養(yǎng)活這支團隊的費用。
曠視認為,新一代框架的出現(xiàn),可以讓AI去“成本中心化”,對于算法生產(chǎn)者來說,一站式開發(fā)工具的效率就像聯(lián)合收割機,原來需要十個人手工收割一塊地,有了這樣的框架后,一個人可以收割十塊地。
如果有更多可供選擇的開源平臺,或許可以幫助更多企業(yè),尤其是傳統(tǒng)企業(yè),解決AI應用的人力成本問題。帶著這樣的想法,曠視決定將自研的底層框架開源。
曠視研究院內(nèi)部有多年研發(fā)經(jīng)驗的開發(fā)者稱,相比市面主流深度學習框架,曠視天元(MegEngine)上手更快,學習成本和遷移成本都更低。
世界主流深度學習框架包括蒙特利爾理工學院2008年推出的Theano、加州大學伯克利2013年推出的Caffe、曠視2014年內(nèi)部開始研發(fā)的MegEngine、Amazon 2015年底開源的MXNet、Facebook 2017年開源的PyTorch,還有百度2016年開源的PaddlePaddle,華為也計劃在今年一季度開源AI計算框架MindSpore。值得注意的是,所有開源框架的企業(yè)中,曠視是唯一一家以AI解決方案為本業(yè)的新型公司。
目前中國AI領(lǐng)域分成三個梯隊,以BATH為代表的巨頭公司、以AI四小龍為代表的AI獨角獸,以及大量中小型創(chuàng)業(yè)公司。不同公司做底層框架開源的目的不同,一些向下,發(fā)展基建;一些向上,發(fā)展產(chǎn)業(yè)。比如谷歌開源其機器學習平臺,背后意圖可能是讓更多用戶使用TPU和谷歌云;曠視則稱,打造自研框架,本質(zhì)上是希望提供更低成本的AI解決方案,吸引更多用戶,而選擇對外開源是考慮只有激活更多的場景,才能把整個AI市場做大。
目前用戶量最大的開源平臺是谷歌推出的Tensorflow,一位Tensorflow的用戶告訴筆者,他并不想更換其他平臺,因為Tensorflow已經(jīng)能滿足他的工作需求。
中科院自動化所高級工程師吳軍寧告訴筆者,目前工業(yè)界和學術(shù)界使用最多的開源平臺是Tensorflow和PyTorch,“開源平臺最重要的指標就是活躍度,用的人越多,越能吸引新用戶”。
另一位AI行業(yè)人士告訴筆者,Tensorflow推出時,可供選擇的開源平臺并不多,到今天,不少AI應用都是在Tensorflow的基礎上長出來的,“已經(jīng)形成了緊密聯(lián)系”。
面對這些有先發(fā)優(yōu)勢的巨頭們,曠視的應對策略是避其鋒芒,選擇技術(shù)實力相對薄弱的傳統(tǒng)行業(yè)入手。曠視稱,互聯(lián)網(wǎng)公司大多已經(jīng)具備AI能力,但很多傳統(tǒng)行業(yè)公司,尤其是中小型公司,對AI技術(shù)可望而不可即?!耙鼈?,底層框架不重要,重要的是在這個底層框架上長出的應用可以實質(zhì)性地讓它們獲益?!睍缫暩笨偛弥x憶楠表示。
曠視認為,此前傳統(tǒng)行業(yè)在進行AI化改造時,都是技術(shù)提供方來定義,使用者參與,效能有限。應該反過來,讓使用者有能力定義生產(chǎn),即使提供者參與輔助,因此,傳統(tǒng)企業(yè)應該擁有一套可滿足定制化需求的算法生產(chǎn)力平臺。
但傳統(tǒng)企業(yè)是否真的需要這樣的平臺,還有待驗證。對于企業(yè)來說,做AI化改造的預算來自整體的IT預算。“如果我不能確定這個平臺能否帶來價值,暫時不會考慮,我們希望采購的是能夠解決具體問題的工具和軟件。但如果可以,當然OK?!币患噎h(huán)保公司總經(jīng)理告訴筆者。
對于大多數(shù)企業(yè)來說,AI開源平臺起到的是錦上添花的作用,而非雪中送炭,此外,他們考慮的并不是AI公司的技術(shù)有多先進。“更好的技術(shù)不意味著能產(chǎn)生更好的效果,解決不同問題的技術(shù)路徑是不一樣的?!币晃粎⑴c投資多家AI公司的投資人對筆者說道。
這位投資人還提到,很多AI公司喜歡和大廠做性能對比,“性能不代表商業(yè)價值,對于剛剛起步的公司來說,首先要做的是找到標桿客戶,形成標桿案例”。這也是曠視目前正在突破的著力點,并已經(jīng)有了一些進展。
2020年初,新冠肺炎疫情暴發(fā),更高效地進行體溫檢測成為剛需,基于曠視自研算法平臺,曠視在2天內(nèi)完成了算法模型的訓練和部署,并用了不到10天時間,完成了AI測溫系統(tǒng)的開發(fā)和上線,并在北京市海淀區(qū)多個場所展開試點應用。
曠視的另一個標桿案例來自一家從事工業(yè)電氣的典型客戶。傳統(tǒng)制造產(chǎn)線上,工廠在配電產(chǎn)品生產(chǎn)過程中經(jīng)常面臨配件顏色搭配錯誤、字符印刷殘缺等質(zhì)量問題,而靠人工目檢費時費力,傳統(tǒng)機器視覺的精度較差,也難以完成有效的質(zhì)量檢測。
針對這些問題,曠視基于自研的AI生產(chǎn)力平臺Brain++為客戶提供了智能制造解決方案,并針對不同產(chǎn)品線開發(fā)定制化算法,且能夠在本地實現(xiàn)數(shù)據(jù)采集和模型的再訓練。其中包括通過數(shù)據(jù)管理平臺MegData的數(shù)據(jù)增廣技術(shù)不斷擴充合成訓練數(shù)據(jù),降低工廠數(shù)據(jù)生產(chǎn)成本,同時用深度學習框架MegEngine的訓練、推理和部署一體化的能力,實現(xiàn)產(chǎn)線所需算法模型的快速選型、優(yōu)化和封裝。
這家電氣廠商通過Brain++實現(xiàn)的智能質(zhì)檢算法有效地降低了生產(chǎn)線中顏色錯誤、字符殘缺漏檢率和誤檢率,極大地提升了工廠的生產(chǎn)效率。
前述投資人表示,類似這樣的案例,AI平臺企業(yè)需要花很多時間和精力在前期不計成本地深入客戶的業(yè)務流程中,做定制化服務?!霸趺茨軌蚩焖購椭七@些案例,讓更多的企業(yè)和開發(fā)者能夠快速上手,是留給AI底層平臺建設企業(yè)的問題,所以真正AI級平臺產(chǎn)品的包容性和易用性、可視化和一站式尤為重要?!?/p>
AI底層框架的競爭才剛剛開始,很難預測未來的發(fā)展方向,是會在各個細分領(lǐng)域都有不同的底層框架,還是一家獨大,都未可知。也正是在市場格局還未完全確定時,為獨角獸提供了與巨頭抗衡的黃金窗口。