劉京運(yùn)
在圍棋中,天元代表著棋盤正中央的星位。如今,在人工智能領(lǐng)域,天元有了新的含義,它代表了曠視深度學(xué)習(xí)框架MegEngine。從命名可以看出,這一深度學(xué)習(xí)框架對(duì)于曠視而言尤為重要。然而,正是這樣一個(gè)歷經(jīng)6年不斷打磨完善的智慧結(jié)晶,在今年3月選擇了開(kāi)源。
3月25日,曠視以線上發(fā)布會(huì)的形式宣布開(kāi)源深度學(xué)習(xí)框架MegEngine,并正式將其中文名定為“天元”。曠視聯(lián)合創(chuàng)始人兼CTO唐文斌表示,此次開(kāi)源的代碼約有35萬(wàn)行,會(huì)在OpenI和GitHub中同步發(fā)布。
“在算法優(yōu)先、數(shù)據(jù)驅(qū)動(dòng)的人工智能時(shí)代,人們期待著有一個(gè)可以為社會(huì)大眾、不同行業(yè)開(kāi)發(fā)建立自己的人工智能系統(tǒng)的操作系統(tǒng)。也正是在這樣的一個(gè)時(shí)代,曠視向社會(huì)發(fā)布了天元深度學(xué)習(xí)框架開(kāi)源系統(tǒng),我向你們表示祝賀?!卑l(fā)布會(huì)上,中國(guó)科學(xué)技術(shù)協(xié)會(huì)黨組書(shū)記、中國(guó)科學(xué)院院士懷進(jìn)鵬通過(guò)視頻表達(dá)了對(duì)曠視開(kāi)源天元的關(guān)注和期待。不僅如此,姚期智、高文、沈向洋等人工智能領(lǐng)域的知名學(xué)者和專家也紛紛通過(guò)視頻表達(dá)了自己的良好祝愿。
天元究竟是什么?為何會(huì)受到行業(yè)大咖的關(guān)注?天元的研發(fā)始于2014年,誕生以來(lái)為曠視的算法突破提供了強(qiáng)有力的支撐。“曠視目前所有的算法都是基于天元MegEngine這個(gè)框架來(lái)訓(xùn)練和推理的,”唐文斌說(shuō)道。曠視首席科學(xué)家、曠視研究院院長(zhǎng)孫劍更是將天元比作曠視的孩子,“它今年6歲了,我們非常喜歡它”。然而,對(duì)于這樣一個(gè)耗時(shí)6年不斷打磨完善的核心技術(shù)產(chǎn)品,曠視為何會(huì)選擇開(kāi)源?
眾所周知,人工智能已在諸多場(chǎng)景中實(shí)現(xiàn)了落地應(yīng)用。曠視發(fā)現(xiàn),不同場(chǎng)景對(duì)于算法有著不同的需求,而場(chǎng)景具有無(wú)限性,這就導(dǎo)致對(duì)算法的需求量十分龐大,僅憑單一企業(yè)根本無(wú)法填補(bǔ)需求空缺,這時(shí)就需要借助AI基礎(chǔ)設(shè)施創(chuàng)造出更多的算法。
什么是AI基礎(chǔ)設(shè)施?唐文斌給出的答案是芯片平臺(tái)和AI生產(chǎn)力平臺(tái)。其中,芯片平臺(tái)能夠承載AI的計(jì)算,而AI生產(chǎn)力平臺(tái)可以釋放生產(chǎn)算法的效能。曠視將AI生產(chǎn)力平臺(tái)Brain++的深度學(xué)習(xí)框架天元全面開(kāi)源,可以讓Brain++的能力服務(wù)于更廣大的開(kāi)發(fā)者,從而降低算法的創(chuàng)造門檻,產(chǎn)生更大社會(huì)價(jià)值。
四大特性解決實(shí)際痛點(diǎn)
曠視研究院高級(jí)技術(shù)總監(jiān)田忠博介紹,天元的整體架構(gòu)可分為五個(gè)層次,自上而下依次是計(jì)算接口、圖表示、優(yōu)化與編譯、運(yùn)行時(shí)管理、計(jì)算內(nèi)核。結(jié)合這種架構(gòu)設(shè)計(jì),田忠博為天元總結(jié)了四大特性:訓(xùn)練推理一體、動(dòng)靜合一、兼容并包、靈活高效。憑借這些特性,天元可以在實(shí)際操作中幫助開(kāi)發(fā)者解決痛點(diǎn)問(wèn)題。
在傳統(tǒng)的深度學(xué)習(xí)研發(fā)流程中,訓(xùn)練框架和推理框架往往分別設(shè)計(jì)、分別實(shí)現(xiàn),其中涉及到模型轉(zhuǎn)換。在轉(zhuǎn)換過(guò)程中常常會(huì)遇到一些問(wèn)題,需要人工進(jìn)行優(yōu)化,有時(shí)會(huì)引入大量冗余算子,致使模型的性能和精度不盡如人意。天元訓(xùn)練推理一體的特性,可直接使用訓(xùn)練得到的模型進(jìn)行推理;能夠保障訓(xùn)練實(shí)現(xiàn)的速度和精度在推理時(shí)保持一致;訓(xùn)練結(jié)束后,模型在跨設(shè)備推理和使用時(shí),能夠保證精度對(duì)齊;內(nèi)置的自動(dòng)模型優(yōu)化模塊可以簡(jiǎn)化研發(fā)流程。
靜態(tài)圖好部署,動(dòng)態(tài)圖易調(diào)試,二者的優(yōu)點(diǎn)能否合為一體?曠視在設(shè)計(jì)天元時(shí)一直在思考這個(gè)問(wèn)題。借助動(dòng)靜合一的特性,天元可以幫助開(kāi)發(fā)者實(shí)現(xiàn)動(dòng)靜態(tài)切換,采用動(dòng)態(tài)圖開(kāi)展原型的研發(fā)和調(diào)試,借助靜態(tài)圖完成部署。
目前,深度學(xué)習(xí)框架眾多,不同框架的接口有所差異,開(kāi)發(fā)者在進(jìn)行學(xué)術(shù)交流時(shí)需要了解不同的框架知識(shí)。如果要在不同框架中復(fù)現(xiàn)模型,更是需要投入較大的學(xué)習(xí)成本。為了簡(jiǎn)化這一問(wèn)題,曠視在設(shè)計(jì)天元時(shí)就致力于將其打造成為一個(gè)兼容并包的體系。天元采用Pythonic風(fēng)格的API,可以讓Python的使用者自然地接受。此外,函數(shù)的命名風(fēng)格和參數(shù)設(shè)計(jì)細(xì)節(jié),也會(huì)尊重Python社區(qū)的原有傳統(tǒng)。曠視在計(jì)算機(jī)視覺(jué)領(lǐng)域擁有獨(dú)特的積累,因此天元還融入了曠視專為計(jì)算機(jī)視覺(jué)特別優(yōu)化的算子,可以為開(kāi)發(fā)者進(jìn)行計(jì)算機(jī)視覺(jué)相關(guān)研發(fā)提供更多便利。
對(duì)于人工智能公司而言,有些時(shí)候會(huì)面臨眾多計(jì)算設(shè)備和場(chǎng)景,如何才能在每種設(shè)備上打造極致性能,從而輸出優(yōu)質(zhì)的產(chǎn)品和服務(wù)?天元秉持靈活高效的原則,借助高性能算子庫(kù),充分釋放不同設(shè)備的算力。通過(guò)與參考框架的訓(xùn)練性能展開(kāi)橫向?qū)Ρ?,天元在主流模型上展示了出色的速度表現(xiàn)。同時(shí),在CPU的推理場(chǎng)景下,天元也表現(xiàn)出了良好的性能。曠視發(fā)現(xiàn),如果要將算法更好地部署在各種設(shè)備中,或者利用現(xiàn)有設(shè)備訓(xùn)練更大模型、支撐更多種類的算法,需要采取高效的內(nèi)存優(yōu)化策略。因此,天元內(nèi)置了高效的內(nèi)存優(yōu)化策略,可以降低訓(xùn)練時(shí)的顯存占用。此外,通過(guò)采用亞線性內(nèi)存優(yōu)化技術(shù),天元還可以在保證計(jì)算速度幾乎不變的前提下大幅提升訓(xùn)練能力?!拔覀?cè)趦?nèi)部的一些評(píng)測(cè)中,可以實(shí)現(xiàn)某些大模型20倍以上的內(nèi)存節(jié)省,速度幾乎不變?!碧镏也┱f(shuō)道。
訓(xùn)得好、訓(xùn)得快、訓(xùn)得動(dòng)
天元可以實(shí)現(xiàn)框架與算法的協(xié)同,做到訓(xùn)得好。孫劍表示,計(jì)算平臺(tái)之間存在很大的差異,基于這些差異,開(kāi)發(fā)者無(wú)法設(shè)計(jì)一種網(wǎng)絡(luò)滿足全部需求。天元可以根據(jù)不同設(shè)備的計(jì)算特性,協(xié)同設(shè)計(jì)網(wǎng)絡(luò)結(jié)構(gòu)、開(kāi)發(fā)新算子,ShuffleNet就是協(xié)同設(shè)計(jì)的成果。如今,ShuffleNet在智能手機(jī)人臉識(shí)別方面實(shí)現(xiàn)了出色的應(yīng)用。
天元是一個(gè)高效的訓(xùn)練系統(tǒng)。MS COCO挑戰(zhàn)賽中,曠視在2017年、2018年、2019年連續(xù)奪冠。孫劍指出,這其中非常關(guān)鍵的優(yōu)勢(shì)在于曠視擁有天元這樣訓(xùn)得快的系統(tǒng)。天元極大地減少了創(chuàng)新時(shí)間,可以在單位時(shí)間內(nèi)完成更多測(cè)試,快速推進(jìn)研發(fā)人員對(duì)困難問(wèn)題的認(rèn)知。
天元具備大規(guī)模能力。曠視與北京智源人工智能研究院發(fā)布了Objects365,目前已推出Objects365 V2版本。該數(shù)據(jù)集中有365種常見(jiàn)物體、超過(guò)200萬(wàn)張圖像、超過(guò)2800萬(wàn)個(gè)人工標(biāo)注框。面對(duì)大規(guī)模數(shù)據(jù)或大模型,天元可以實(shí)現(xiàn)訓(xùn)得動(dòng),能夠在較短時(shí)間內(nèi)完成訓(xùn)練。
曠視此次發(fā)布的是天元Alpha版本,預(yù)計(jì)6月會(huì)發(fā)布Beta版本,9月發(fā)布正式的1.0版本?!跋M嗳四軌?qū)ξ覀兊漠a(chǎn)品提出批評(píng)、給出建議,一起來(lái)貢獻(xiàn)Code,”唐文斌表示。
“如果把天元比作一個(gè)小孩,今天可能是他走出房間去迎接陽(yáng)光,想為這個(gè)社會(huì)去做更多事情的時(shí)候?!痹诎l(fā)布會(huì)的最后,唐文斌說(shuō)道,“同時(shí),也希望社會(huì)各界的朋友對(duì)他有更多的呵護(hù),對(duì)他有更多的幫助,我們一起來(lái)幫助他真正地成長(zhǎng)?!?/p>
圍棋中,天元代表棋盤正中央的星位,而曠視能否在人工智能這盤棋局中占據(jù)C位,我們拭目以待!