人類追求類腦智能已經(jīng)長(zhǎng)達(dá)一個(gè)世紀(jì),至今的AI應(yīng)用所擁有的智能離真正的目標(biāo)還很遙遠(yuǎn)。人類大腦低功耗的信息存儲(chǔ)、處理和傳輸功能燃起全球科學(xué)研究在開發(fā)類腦計(jì)算芯片上的巨大熱情。類腦計(jì)算是借鑒人腦科學(xué)的基本原理,面向通用人工智能,基于神經(jīng)形態(tài)工程的新型計(jì)算技術(shù)。目前,美國(guó)、歐盟、日本、中國(guó)等國(guó)家和地區(qū)都在開展類腦計(jì)算的研究,主要在推進(jìn)的類腦計(jì)算芯片有IBM的TrueNorth,Intel的Loihi、BrainScale、SpiNNaker、Neurogrde,清華大學(xué)的“天機(jī)芯”等。正如清華大學(xué)類腦計(jì)算研究中心主任施路平教授所言,現(xiàn)在全球類腦計(jì)算研究可謂處于“春秋戰(zhàn)國(guó)”時(shí)期,所選擇的技術(shù)路徑有較大不同。
2012年,清華大學(xué)就瞄準(zhǔn)未來人工智能發(fā)展的前沿,通過人才引進(jìn)布局類腦計(jì)算。2014 年,清華大學(xué)依托精密儀器系,聯(lián)合計(jì)算機(jī)、微電子、電子、自動(dòng)化、材料、生物醫(yī)學(xué)共計(jì)7個(gè)院系,成立了多學(xué)科深度交叉融合的類腦計(jì)算研究中心,由清華大學(xué)原光盤國(guó)家工程研究中心主任施路平,組建了由不同學(xué)科領(lǐng)域?qū)<医M成的研究團(tuán)隊(duì),從基礎(chǔ)理論、神經(jīng)形態(tài)器件、類腦芯片、類腦軟件、系統(tǒng)和應(yīng)用等方面對(duì)類腦計(jì)算進(jìn)行全面研究。
2015年,類腦計(jì)算研究中心研發(fā)團(tuán)隊(duì)研發(fā)出第一代類腦計(jì)算芯片,命名為“Tianjic”(天機(jī)芯),芯片的制程約為110納米,有6個(gè)功能核,1000多個(gè)神經(jīng)元,運(yùn)行頻率不是太高。主要是進(jìn)行原理和架構(gòu)的驗(yàn)證,算是一個(gè)DEMO(小樣)。
2017年,團(tuán)隊(duì)研發(fā)出第二代“天機(jī)芯”芯片。第二代“天機(jī)芯”芯片具有高速度、高性能、低能耗的特點(diǎn),制程縮小至28納米,由156個(gè)功能核FCore組成,包含約4萬個(gè)神經(jīng)元和1000萬個(gè)突觸,面積為3.8毫米×3.8毫米,采用了傳統(tǒng)的集成電路工藝。相比當(dāng)時(shí)世界先進(jìn)的IBM的TrueNorth芯片,其功能更全、靈活性和擴(kuò)展性更好,密度提升20%,速度提高至少10倍,帶寬提高至少100倍。2019年8月,第二代“天機(jī)芯”芯片在世界頂級(jí)學(xué)術(shù)雜志《自然》封面亮相,標(biāo)題為《雙重控制》(Dual Control),被作為人工通用智能領(lǐng)域的一個(gè)重磅應(yīng)用案例進(jìn)行展示。
2021年5月底,第三代“天機(jī)芯”芯片問世,制程進(jìn)一步縮小至14納米,包含百萬個(gè)神經(jīng)元。與第二代芯片相比,其性能有了大幅度提升,可以更好地應(yīng)用在自動(dòng)駕駛和智能機(jī)器人等領(lǐng)域。這表明清華大學(xué)類腦計(jì)算研究走在了世界發(fā)展的前列。
據(jù)清華大學(xué)“天機(jī)芯”芯片研發(fā)團(tuán)隊(duì)馬騁副教授介紹,“天機(jī)芯”芯片為異構(gòu)融合類腦架構(gòu),主要目標(biāo)是人工通用智能,同時(shí)支持機(jī)器學(xué)習(xí)算法和類腦電路,并可支持神經(jīng)科學(xué)發(fā)現(xiàn)的眾多神經(jīng)回路網(wǎng)絡(luò)和異構(gòu)網(wǎng)絡(luò)的混合建模。而實(shí)現(xiàn)上述兩類模型深度高效融合是天機(jī)芯片設(shè)計(jì)中最大的挑戰(zhàn),因?yàn)閮深惸P退褂玫恼Z(yǔ)言、計(jì)算原理、編碼方式和應(yīng)用場(chǎng)景都不相同。
天機(jī)芯芯片可以分別運(yùn)行兩類比較常見的模型,一類是人工神經(jīng)網(wǎng)絡(luò)(ANN),一類是脈沖神經(jīng)網(wǎng)絡(luò)(SNN),來進(jìn)行建模。這兩類模型的算法技術(shù)路線相似,都是由軸突、突觸、樹突、包體等基本模塊組成的。區(qū)別主要在脈沖或者是結(jié)果發(fā)放上,脈沖神經(jīng)網(wǎng)絡(luò)是以脈沖發(fā)放進(jìn)行運(yùn)算,神經(jīng)網(wǎng)絡(luò)是基于黏性進(jìn)行運(yùn)算。研發(fā)團(tuán)隊(duì)考慮把兩者有可能共用的模塊作為共享的單元,實(shí)際上就是通過一個(gè)融合的方式,在一個(gè)結(jié)構(gòu)上實(shí)現(xiàn)兩類算法的計(jì)算。
天機(jī)芯芯片的基本運(yùn)算單位是功能核。功能核的第一部分是軸突,用來實(shí)現(xiàn)輸入信息的緩存,同時(shí)對(duì)延遲的時(shí)間進(jìn)行調(diào)整。第二部分是樹突,是功能模塊的核心運(yùn)算單元,可以進(jìn)行所有的基本運(yùn)算,其組成是層加器的增列。加上該部分還要進(jìn)行大量緩存,因此,樹突部分占用芯片30%的資源,功耗也是最大的。第三部分是包體,主要是實(shí)現(xiàn)神經(jīng)元輸送的信息的相應(yīng)功能,如ANN的激活函數(shù)、SNN產(chǎn)生的脈沖信息;還有一些與輸出相關(guān)的功能,如磁化、片子和泄露等。不同功能核可以實(shí)現(xiàn)特定的運(yùn)算功能,多個(gè)功能核集成則可進(jìn)行大規(guī)模的運(yùn)算。不同功能核由路由部分進(jìn)行連接,可以實(shí)現(xiàn)點(diǎn)對(duì)點(diǎn)的數(shù)據(jù)傳輸,實(shí)現(xiàn)循環(huán)反饋,還可以實(shí)現(xiàn)臨近域的突破。由于芯片是異構(gòu)融合的,因此可以實(shí)現(xiàn)ANN和SNN的混合應(yīng)用。整體構(gòu)成一個(gè)片狀網(wǎng)絡(luò),形成一個(gè)完整的芯片。像第二代“天機(jī)芯”芯片就由156個(gè)功能核組成,構(gòu)成一個(gè)12×13的布局。一個(gè)天機(jī)芯芯片加一個(gè)控制器構(gòu)成一個(gè)單芯片類腦計(jì)算系統(tǒng)。單芯片資源比較少,正常應(yīng)用會(huì)由單芯片組成陣列,構(gòu)成一個(gè)類腦計(jì)算單元。
具體的天機(jī)系統(tǒng)也是一個(gè)異構(gòu)的系統(tǒng),是由類腦處理器和傳統(tǒng)的馮·伊曼架構(gòu)共同構(gòu)成的。所以,其既可以處理傳統(tǒng)的計(jì)算機(jī)領(lǐng)域的問題,也可以處理傳統(tǒng)計(jì)算機(jī)處理不了的一些更為復(fù)雜的問題??梢哉f,其應(yīng)用前景非常廣闊。