文 | 本刊記者 孫杰賢
以“智算力就是創(chuàng)新力”為主題的2023人工智能計算大會(AICC 2023)日前在北京召開,大會重點圍繞智算基礎設施、大模型創(chuàng)新、AI Infra 技術創(chuàng)新、自動駕駛創(chuàng)新與應用、AI for Science、智算開放標準等熱點話題開設一場主題論壇,六場專題分論壇,近百位政產(chǎn)學研專家現(xiàn)場分享智算產(chǎn)業(yè)前沿趨勢和創(chuàng)新成果。
浪潮信息高級副總裁劉軍在演講時表示,面向生成式人工智能(AIGC)帶來的機遇與挑戰(zhàn),通過智算力系統(tǒng)來更好地支撐AI創(chuàng)新與應用,已經(jīng)成為智算產(chǎn)業(yè)的關鍵,應該從算力系統(tǒng)、AI Infra(AI軟件基礎設施)、算法模型和產(chǎn)業(yè)生態(tài)4個方面來進行綜合考量,從而加速智能產(chǎn)業(yè)的落地。他特別指出,AIGC大模型開發(fā)是一項極其復雜的系統(tǒng)工程,即便解決了底層算力供給的問題,仍面臨建不了和用不好的問題?!敖ú缓谩笔侵笜嫿ㄋ懔ζ脚_不僅需要服務器、存儲、網(wǎng)絡等硬件集成,還需要考慮不同硬件和軟件之間的兼容性和版本選擇,確保驅動和工具的適配性和穩(wěn)定性;“用不好”則體現(xiàn)在算力平臺效率低、穩(wěn)定性不足、模型開發(fā)環(huán)節(jié)冗長等現(xiàn)實困擾。因此,在算力系統(tǒng)外,AI Infra也亟需創(chuàng)新。
據(jù)悉,針對AI Infra層面的優(yōu)化,浪潮信息開發(fā)了大模型智算軟件棧OGAI。在算力集群部署方面,開源了業(yè)界首個AI算力集群系統(tǒng)環(huán)境部署方案PODsys;在大規(guī)模訓練的長時保障方面,從算力調度平臺層實現(xiàn)了自動化斷點續(xù)訓;在多元算力接入方面以標準化、模塊化接入方式穩(wěn)定接入超過40+芯片;在數(shù)據(jù)治理方面構建了流程化、可自定義的數(shù)據(jù)清洗流水線,有效縮短數(shù)據(jù)清洗時間、提升文本審核過濾準確率;在計算效率優(yōu)化方面,通過對分布式并行算法的極致優(yōu)化,將千億參數(shù)模型訓練的計算效率提升到54%;在多模型管理方面已經(jīng)支持了超過10個業(yè)界主流的開源大模型和元腦生態(tài)大模型,用實踐證明AI Infra全?;A軟件和工作流的創(chuàng)新是多元算力高效釋放、提升大模型算力效率的關鍵。
除了劉軍,在上午的主題論壇上,還有眾多重量級嘉賓就AIGC、大模型以及智算基礎設施等相關話題從技術、理念、產(chǎn)業(yè)、生態(tài)等方面展開了深入、全面、客觀地交流與分享。
中國工程院院士王恩東——大模型帶動AIGC產(chǎn)業(yè)迅速發(fā)展,在科學探索、技術研發(fā)、藝術創(chuàng)作、企業(yè)經(jīng)營等諸多領域都帶來了巨大的創(chuàng)新機會,提升大模型智能水平需要提升模型訓練的參數(shù)量和數(shù)據(jù)量,這必須要通過更大更好的智算力才能夠支撐,從這個意義上可以說智算力就是創(chuàng)新力,當前人工智能產(chǎn)業(yè)發(fā)展的基礎是智算能力。
北京智源人工智能研究院副院長兼總工程師林詠華——大模型時代,面對異構算力不能合池訓練、生態(tài)割裂和芯片各異評測難的三大算力束縛,我們需要攻關兼容異構芯片的混合訓練技術,提升訓練效率,并推動面向異構芯片的開源算子軟件棧,以及建立評測體系。
騰訊云產(chǎn)業(yè)智能首席專家王巍——大模型深刻觸動了產(chǎn)業(yè)變化和底層邏輯,引發(fā)動力變革、交互變革和效率變革。企業(yè)大模型落地需要從底座、功能和應用等方面來進行能力加持,在跨模態(tài)大模型落地過程中克服數(shù)據(jù)、連接、安全、統(tǒng)一等四個方面的挑戰(zhàn)。
此外,大會還發(fā)布了兩份重要的研究成果——《北京市人工智能行業(yè)大模型創(chuàng)新應用白皮書(2023年)》(以下簡稱《白皮書》)和《2023-2024年中國人工智能計算力發(fā)展評估報告》(以下簡稱《評估報告》)。
《白皮書》從大模型全球發(fā)展態(tài)勢、國內外行業(yè)應用概述、北京應用情況和發(fā)展建議等方面進行了系統(tǒng)分析和闡述,旨在展示北京市大模型應用成果,促進大模型價值傳播和供需對接?!栋灼分赋?,目前北京是當前國內人工智能領域創(chuàng)新基礎最好、人才資源最集中、研發(fā)創(chuàng)新能力最強、產(chǎn)品迭代最活躍的地區(qū),現(xiàn)已擁有大模型創(chuàng)新團隊122家,數(shù)量居全國首位,約占全國的一半。在大模型技術落地方面,北京市場空間廣闊,已率先開展了多樣化的應用實踐,從模型演進看,呈現(xiàn)出從技術到產(chǎn)品、再到商業(yè)化的發(fā)展路線;從應用領域看,呈現(xiàn)出百花齊放發(fā)展格局,其中傳統(tǒng)產(chǎn)業(yè)賦能和金融領域發(fā)展較快;從應用類型看,多類應用全面開花,其中內容生成和智能問答最為成熟;從商業(yè)模式看,大模型已形成“基礎+行業(yè)+應用”的三層架構。
而《評估報告》則從算力規(guī)模、區(qū)域分布和行業(yè)滲透度等多維度,對我國人工智能計算力發(fā)展進行綜合評估,給出大模型和AIGC的發(fā)展將引發(fā)AI算力產(chǎn)業(yè)之變的核心洞察,并提出針對性的行動建議?!对u估報告》指出,當前在AIGC的帶動下,人工智能計算力技術及應用趨勢發(fā)生了較大的變化。
一是計算范式之變。大模型和AIGC的發(fā)展加速了更高計算性能、更快互聯(lián)性能的算力基礎設施建設,推進人工智能在云-邊-端的覆蓋。此外,伴隨應用場景多樣性,底層基礎設施呈現(xiàn)多元化發(fā)展。
二是產(chǎn)業(yè)動量之變。AIGC可重構現(xiàn)有的工作方式,在內容創(chuàng)作、自動駕駛、零售、醫(yī)療等諸多領域改變著人們的生活和生產(chǎn)方式,同時也帶來更大的市場機會。算力、算法、應用、服務等諸多產(chǎn)業(yè)變量將成為創(chuàng)新的加速器,在算力生態(tài)鏈上的各個環(huán)節(jié)催生出新的玩家。
三是算力服務格局之變。由于基礎大模型的本地訓練成本不菲,企業(yè)將更多地使用已有的人工智能數(shù)據(jù)中心設施和AIGC服務器集群,這將為算力服務市場帶來新機會。算力服務供應商要能夠提供定制化的基礎設施服務能力,滿足單個用戶對訓練和推理資源的獨占式、大規(guī)模、長時間使用的訴求,同時幫助用戶實現(xiàn)成本控制。
《評估報告》認為,中國市場有其獨特性和一些新的變化。面對單芯片性能受限等局面,中國市場對于算力供給能力的評估指標將從硬件性能向應用效果轉變,企業(yè)在獲得算力服務的過程中,會更加以應用為導向進行綜合考量,增加對于諸如單位時間可處理Token數(shù)量、可靠性、時延、訓練時間和資金成本、數(shù)據(jù)集質量等指標的關注。
針對這一轉變,《評估報告》指出,算力供應商需要“以應用為導向、系統(tǒng)為核心”,構建算力基礎設施平臺,提高算力利用率,提升諸如卡間互聯(lián)、多節(jié)點間互聯(lián)等水平,支持靈活穩(wěn)定擴展和彈性容錯,積極打造通用的人工智能軟件和硬件平臺,以先進的系統(tǒng)性能力滿足市場的應用需求。