中昊芯英以中國首枚高性能TPU架構(gòu)AI芯片“剎那?”為基石,打造了1024塊芯片片間高效互聯(lián)、可支撐超千億參數(shù)大模型的大規(guī)模AI計算集群“泰則?”,不僅填補了國內(nèi)TPU架構(gòu)AI芯片的空白,更為我國高性能AI芯片領(lǐng)域的“卡脖子”難題提供了國產(chǎn)自主可控的軟硬件解決方案
人工智能時代,大模型規(guī)??焖俚?,算力需求迎來爆發(fā)式增長。AI芯片作為核心算力硬件,市場前景廣闊,更是科技競爭力的關(guān)鍵。正所謂,誰掌握了人工智能芯片,誰就掌握了算力供給的來源,誰就在人工智能時代掌握制高點。然而,隨著大模型計算需求和復雜度的指數(shù)級增長,傳統(tǒng)GPU在用于大模型訓練時,成本高、算力利用率低、能耗大的問題日益凸顯。目前,全球科技巨頭如蘋果、微軟、亞馬遜、特斯拉、OpenAI等,以及新興的明星初創(chuàng)企業(yè)如Groq和Etched,都在探索研發(fā)AI專用芯片以替代英偉達GPU,AI芯片格局正朝著TPU等AI專用芯片的方向演進。在全球科技產(chǎn)業(yè)將目光緊緊鎖定人工智能領(lǐng)域之際,TPU憑借其更顯著的功耗和成本優(yōu)勢、更優(yōu)異的片間互聯(lián)優(yōu)勢、更成熟的技術(shù)生態(tài)優(yōu)勢等,正在成長為AI時代的“弄潮兒”。
面對全球芯片之爭愈演愈烈,中昊芯英(杭州)科技有限公司(下稱“中昊芯英”)作為國內(nèi)唯一掌握TPU架構(gòu)AI芯片核心技術(shù)并實現(xiàn)芯片量產(chǎn)的公司,打造了中國首枚高性能TPU架構(gòu)AI芯片“剎那?”,并基于此構(gòu)建支持1024塊芯片高速片間互聯(lián)、可支撐超千億參數(shù)大模型運算需求的大規(guī)模AI計算集群“泰則?”,不僅填補了國內(nèi)TPU架構(gòu)AI芯片的空白,更為我國高性能AI芯片領(lǐng)域的“卡脖子”難題提供了國產(chǎn)自主可控的軟硬件解決方案。
三位一體化方案加速AI產(chǎn)業(yè)化
通過“自研AI芯片+超算集群+AIGC預(yù)訓練大模型”的三位一體化方案,中昊芯英為全球客戶提供具備生產(chǎn)變革能力的AI創(chuàng)新技術(shù)方案,加速AI工程落地與產(chǎn)業(yè)化進程。
中昊芯英以“剎那?”和“泰則?”為核心,旨在為AIGC時代的超大規(guī)模AI大模型計算提供高性能AI芯片與計算集群?!皠x那?”是中昊芯英歷時近5年打造的、性能達國際一流水平的全自研TPU架構(gòu)高性能AI芯片,擁有完全自主可控的IP核、全自研指令集與計算平臺。在處理大規(guī)模AI模型計算任務(wù)時,相較于國外知名GPU產(chǎn)品,“剎那?”的計算性能超越其近1.5倍,在完成相同AI大模型計算任務(wù)量時的能耗降低30%,單位算力成本僅為其50%?!皠x那?”采用專為AI訓練而生的TPU架構(gòu),其系統(tǒng)性能超越GPU架構(gòu)數(shù)倍,是比GPU更適合于數(shù)據(jù)中心進行大量部署的深度學習計算單元。
“泰則?”大規(guī)模AI計算集群系統(tǒng)是基于中昊芯英自研的高性能TPU芯片“剎那?”構(gòu)建的AI計算集群系統(tǒng),實現(xiàn)了1024片芯片的高效片間互聯(lián),可支撐超千億參數(shù)大模型的計算與推理。其強悍的系統(tǒng)性能和卓越的擴展性專為處理如AlphaZero、AlphaGo、GPT等前沿人工智能模型的大規(guī)模計算任務(wù)量身打造?!疤﹦t?”大規(guī)模AI計算集群系統(tǒng)能夠強有力地支撐包括AIGC大模型計算、高級無人駕駛模型訓練、蛋白質(zhì)結(jié)構(gòu)精密預(yù)測在內(nèi)的各類高強度AI運算場景。
“泰則?”不僅具備雄厚的底層算力儲備,而且通過精細化的算力調(diào)度機制,能夠?qū)崟r響應(yīng)多用戶需求,動態(tài)調(diào)整分配的工作負載算力和存儲資源,確保各種復雜應(yīng)用場景下的高效協(xié)同與靈活部署。在系統(tǒng)層級,管理、計算與存儲網(wǎng)絡(luò)三者實現(xiàn)了有機結(jié)合:管理網(wǎng)絡(luò)與初始化數(shù)據(jù)共享同一網(wǎng)絡(luò)環(huán)境,軟件層面則精細劃分管理權(quán)限,使得服務(wù)器節(jié)點間能夠無縫協(xié)同,高效完成計算任務(wù)以及相關(guān)數(shù)據(jù)的交換,實現(xiàn)了對整個算力系統(tǒng)的智能化管理和高效利用。
值得一提的是,2024年11月,中昊芯英基于國產(chǎn)TPU算力服務(wù)器“泰則?”在高校中的應(yīng)用,助力太極股份成功入選中國互聯(lián)網(wǎng)協(xié)會評選的2024年度互聯(lián)網(wǎng)助力經(jīng)濟社會數(shù)字化轉(zhuǎn)型特色案例名單。該案例通過部署基于全國產(chǎn)自研AI芯片打造的TPU算力服務(wù)器,成功打破了高校對進口高端算力設(shè)備的依賴,實現(xiàn)了算力資源的自主可控。同時,該案例的成功模式還具有較高的可復制性與可推廣性。
近年來,中昊芯英已與浙江大學計算機創(chuàng)新技術(shù)研究院、上海交通大學、杭州電子科技大學、上海人工智能研究院等國內(nèi)知名高校、科研機構(gòu)展開深度合作,共同推動AI芯片技術(shù)的突破與應(yīng)用。這些應(yīng)用的成功落地,不僅顯著提升了高校的科研效率與教學質(zhì)量,更為國產(chǎn)芯片技術(shù)在高校科研與教育領(lǐng)域的推廣與應(yīng)用奠定了堅實基礎(chǔ)。
此外,中昊芯英基于“剎那?”構(gòu)建的“泰則?”大規(guī)模AI計算集群系統(tǒng)解決方案,以創(chuàng)新的TPU架構(gòu)支撐超千億參數(shù)大模型的計算需求,入選由新華網(wǎng)聯(lián)合中國電子信息產(chǎn)業(yè)發(fā)展研究院編制的相關(guān)報告,成為2024年度“數(shù)字樣板工程”實踐案例之一。
拓展應(yīng)用場景,加速賦能千行百業(yè)
目前,中昊芯英產(chǎn)品主要應(yīng)用于云廠商、運營商以及行業(yè)垂類模型應(yīng)用商、高校、科研機構(gòu)等終端算力用戶,輻射金融、制造業(yè)、醫(yī)療、教育等行業(yè)。
在賦能領(lǐng)域大模型構(gòu)建方面,中昊芯英與國泰君安開展合作,為金融大模型垂直場景落地提供算力及算法底座,助力國泰君安“國芯證道”方案成功實現(xiàn)了基于國產(chǎn)芯片的金融大模型工程的完整啟動。“國芯證道”方案創(chuàng)新性地提出了Early Exit、Token Skipping、權(quán)重共享、低秩分解、注意力優(yōu)化等多項技術(shù),現(xiàn)已在NL2SQL、資訊分析等金融領(lǐng)域應(yīng)用驗證。
在賦能智算中心建設(shè)方面,中昊芯英已與深圳聯(lián)通、星羅智算等各地政府、運營商、企業(yè)共同打造智算中心。其中,公司與深圳聯(lián)通合作打造了廣東地區(qū)首個全采用國產(chǎn)TPU芯片的高性能AI智算中心,形成訓推一體化樞紐,成為中國聯(lián)通在深圳的核心智算高地的重要組成部分。
下一步,中昊芯英將攜手高校、科研機構(gòu)及產(chǎn)業(yè)鏈上下游企業(yè)共同優(yōu)化技術(shù)方案、不斷提升產(chǎn)品效能,推動國產(chǎn)AI芯片技術(shù)及TPU算力服務(wù)器在更廣泛的領(lǐng)域內(nèi)得到應(yīng)用與落地,拓展人工智能技術(shù)場景化落地,加速賦能千行百業(yè)。
未來,中昊芯英將繼續(xù)深耕AI芯片領(lǐng)域,不斷在算力上實現(xiàn)對現(xiàn)有技術(shù)的超越,為AI領(lǐng)域的深度學習和復雜模型計算提供強大的算力硬件支持,并以更加高效智能的人工智能軟硬件一體化解決方案推動AI產(chǎn)業(yè)升級,為我國新質(zhì)生產(chǎn)力的發(fā)展注入更多動力。
[本文由中昊芯英(杭州)科技有限公司供稿]