中信改革發(fā)展研究基金會“安全可信多邊數(shù)據(jù)治理機制”課題組
全球數(shù)字化的角逐已然是一場殊死革命
數(shù)字驅動已成為科技創(chuàng)新的范式,而國家超大綜合算力則是現(xiàn)代綜合國力的重要組成部分和實現(xiàn)人工智能發(fā)展的重要基石。當前,以ChatGPT為代表的美國人工智能技術(涉及通用人工智能和AI大模型)取得了突破性進展,通過數(shù)據(jù)、算力和AI模型,改變認知、探索前沿已呈現(xiàn)出重大的示范意義和啟示作用。這種“預訓練,能夠自監(jiān)督學習,具有強生成能力,并且可以自我進化”的能力,標志著數(shù)字平臺時代進入數(shù)字智能時代,表現(xiàn)出對社會經濟發(fā)展各領域具有超越認知的滲透性、擴散性和顛覆性,展示出驅動歷史發(fā)展的內生動力十分強勁。美國在這一領域處于領先地位,它通過封鎖技術和嚴格輸出相關產品,不斷擠壓我發(fā)展空間,遲滯我國發(fā)展,并對我國安全與發(fā)展形勢構成了全方位、多維度的壓力、挑戰(zhàn)與威脅。對此,中國必須做出反應和付諸行動,這關乎10年、20年甚至未來較長時期我國在全球創(chuàng)新、社會發(fā)展、國家博弈和企業(yè)競爭中的地位與作用。在全球新一輪數(shù)字技術競爭的賽道上,不能一抬頭,世界已經走遠,中國必須制定國家戰(zhàn)略,咬住強者,應對挑戰(zhàn),選擇“以網(wǎng)強算、算網(wǎng)融合”的發(fā)展路徑,破解發(fā)展難題,重塑發(fā)展格局。
以全球的視角看待與迎接數(shù)字革命的挑戰(zhàn)
在獲取、表達、存儲、傳輸、處理、交付信息中,中國新一輪人工智能技術的發(fā)展障礙在算力。歷史形成的算力分散現(xiàn)狀與算力分治的體制相關,造成可用性算力能力和AI大模型所需算力能力不強,這是制約我國的真正瓶頸。僅以ChatGPT-3為例,其早期版本算力消耗約為3640PF天(即假如每秒計算一千萬億次(PF),需要計算 3640天),以國內一個投資超30億元、算力500P的數(shù)據(jù)中心為例,支撐ChatGPT-3正常運行的算力消耗超出了單個數(shù)據(jù)中心8倍的計算能力。
我國算力總量僅次于美國,居全球第二,但差距卻反映在美國擁有全球最領先的芯片能力、硬件水平和金融資本偏好上;反映在少數(shù)科技頭部企業(yè)打造出的是全球集中度最高的算力總量。我們的問題是囿于算力資產確權在各個機構手中,運行體制和運行方式呈現(xiàn)分治與分散的狀況,使算力能力很難集合成滿足人工智能大模型需要的算力。
算力的提升離不開高性能芯片和相關先進服務器技術。美國對我國嚴格禁售計算芯片、網(wǎng)絡芯片,嚴格限制服務器等相關技術輸出,這種供應鏈、科技鏈斷鏈的狀況短期內不會得到緩解和改善。因此,我國靠自己在短期內解決芯片代際差距,集中投資高密度算力設施都是不現(xiàn)實的,更不可能將我國數(shù)據(jù)與信息全面暴露和置于美國領先的人工智能系統(tǒng)控制之下,選擇直接連接美國的算力系統(tǒng)去訓練它的模型,這都將構成對我們發(fā)展的進一步制約和國家安全的嚴重威脅。
不致在全球競爭中掉隊,算力能力已經不是單純的技術問題,而是國家競爭戰(zhàn)略和行動重要的組成部分。我們必須以自己的方式和選擇的路徑,破解新一代人工智能產業(yè)發(fā)展的瓶頸問題。
“以網(wǎng)強算、算網(wǎng)融合”的中國方案
我國不能按照美國的方式和路徑構建集中度很高的算力能力,只能尋找適合我國發(fā)展階段實現(xiàn)工程化的“以網(wǎng)強算、算網(wǎng)融合”中國解決方案。在總算力規(guī)模和全球領先的通信網(wǎng)絡基礎上,利用自主可控的創(chuàng)新技術和技術實施條件,建設超大規(guī)模高速廣域計算集群(“大集群”),提升國家綜合算力能力(“大算力”)是現(xiàn)實選擇的中國落地方案。
構成一張統(tǒng)一可靈活調用算力的集群算力網(wǎng)絡,有效支撐通用人工智能和AI大模型對算力的需求,我國在技術層面具備三個有利條件:第一,已建成全球規(guī)模最大、技術領先的網(wǎng)絡基礎設施,具備全球優(yōu)勢,總算力規(guī)模也具有良好基礎,且發(fā)展勢頭強勁;第二,在分散的計算中心間,利用經過國家實驗室實測驗證的自主可控的超遠距離、高通量、高速度、低時延技術和產品,實現(xiàn)計算中心的網(wǎng)絡聯(lián)結,就是拓寬了的數(shù)據(jù)傳輸網(wǎng)絡的“高速公路”;第三,分布式訓練是國際常用并規(guī)模部署的大規(guī)模人工智能訓練技術,我國在該領域既有多方安全計算的國際原創(chuàng),也有多方聯(lián)合訓練的前沿研究,并取得了優(yōu)異的成果。
建設“大集群”,實現(xiàn)“大算力”的工程怎么干
“大算力”是由國家主導、國家與社會共建、市場化運營的國家大科學工程基礎設施。為此設計一整套體制機制方案和分步實施方案,實現(xiàn)資源上優(yōu)化配置、技術上聯(lián)合攻關,標準上互認互信,機制上協(xié)同協(xié)作,利益上公平體現(xiàn)。按照這個定位和思路,利用新型創(chuàng)新體制優(yōu)勢,解決四個問題:
一是將“以網(wǎng)強算、算網(wǎng)融合”上升到國家大科學工程基礎設施的國家戰(zhàn)略層面進行規(guī)劃與建設,制定目標、統(tǒng)籌規(guī)劃,編制實現(xiàn)工程化落地運行的時間表和路線圖。
二是在強對抗的競爭態(tài)勢下,要實現(xiàn)大算力零到一的突破。與美國“技術+金融資本”模式不同,我國算力集中度不高,零到一的階段缺乏資本投入,因此,我國應當選擇國家主導先期投入,國家與社會共建模式,如同開發(fā)出“操作系統(tǒng)”,從而帶動社會資本進入生成式人工智能時代的應用領域,為企業(yè)提供創(chuàng)新的大機遇和實施條件。同時思考,突破了零到一,在一到十階段,不致出現(xiàn)資本蜂擁而至,避免形成算力新的過剩,造成大面積內卷和極大浪費的預案。
三是創(chuàng)新體制是實現(xiàn)數(shù)字中國偉大構想的關鍵。數(shù)字化生態(tài)進化的方式離不開場景的開發(fā)和應用,離不開創(chuàng)新型企業(yè)群體的興起。積極營造創(chuàng)建創(chuàng)新型國家的生態(tài)環(huán)境是艱巨的任務,國家層面要抓好三件大事。首先,營造好“善治”與“宜商”的市場環(huán)境,在政策環(huán)境、法治環(huán)境和輿論環(huán)境上保持邏輯的一致性、穩(wěn)定性和可預期性。落實實現(xiàn)市場主體地位平等,使用資源條件平等和公開、公正、公平競爭的條件;第二,整合數(shù)字化能力;第三,抓好技術開源的國家引領。唯此才能占領未來產業(yè)競爭的制高點,推動產業(yè)創(chuàng)新經濟體的興起。隨著創(chuàng)新型企業(yè)群體的興起,國家數(shù)字化產業(yè)和產業(yè)數(shù)字化發(fā)展的局面將大為改觀,創(chuàng)造出更多的財富回饋國家和社會,實現(xiàn)社會、經濟、科技發(fā)展的良性循環(huán)。
四是讓市場運行機理、機制、標準和規(guī)則在調動算力、使用算力資源中起決定作用,使其能夠更廣泛地匯聚算力資源,可持續(xù)健康發(fā)展。
形成統(tǒng)一的算力網(wǎng),須同步推進四方面工作:
一是大規(guī)模算力的底座是數(shù)字中國的公用基礎設施,策略上要為我們爭取發(fā)展時間,減緩各界焦慮,對沖美國強化技術封鎖的進攻態(tài)勢,收窄中美技術發(fā)展差距創(chuàng)造條件。在2023年年底以前,選擇有意愿、有條件的10多個數(shù)據(jù)中心鏈接起來,工程化地建立大約6EF算力的集群(對標微軟的Azure集群算力,基本支撐一個ChatGPT-3的算力需求)。然后,明年年底形成大約200多個數(shù)據(jù)中心大集群。在時延10毫秒(覆蓋范圍約2000公里)內的計算能力達到100EF(大約支撐20個ChatGPT-3)的算力集群網(wǎng)絡。經過兩年的努力,基本形成對我國AI大模型提供優(yōu)質快速、便捷綠色的高質量算力支撐,為推動各類AI計算模型的廣泛發(fā)展提供實施條件。
二是在示范算力集群網(wǎng)絡的基礎上,進一步在算力集群網(wǎng)絡架構、調度、測量、交易、安全等關鍵技術路徑上,聯(lián)合攻關,研究設立國家標準(廣域RDMA通信、分布式異構計算、算力鏈接標準),增強互認互信,強化協(xié)同共建,建立算力運營、調度、計量、交易等管理機制,逐步優(yōu)化形成算力集群網(wǎng)絡建設部署、運維管理、效能提升、長遠發(fā)展等多層面、多維度、更加科學的頂層規(guī)劃。
三是把握數(shù)字化永遠是平臺驅動的特性,構建三個功能性平臺。
1.在技術上破除算力分治的體制性障礙,通過統(tǒng)一標準打通各計算中心的廣泛鏈接,形成大容量、長距離、高速度、高容損一體化的算力集群網(wǎng)絡,實現(xiàn)可計量、可調度、可使用的算力。以算力集群網(wǎng)絡發(fā)展技術方向,帶動芯片、通信領域技術發(fā)展,持續(xù)建設更快更強的中國版算力強網(wǎng)。
2.建立調度、分配、動用算力的生產系統(tǒng)和監(jiān)管機制,在可實施和可實現(xiàn)的基礎上健康發(fā)展。
3.以市場化的方式運行,有償使用算力。將算力作為重要的生產力要素,為分散在各個計算中心的算力提供交易平臺和配套的制度安排,建立一套與算力使用相關的市場運作機制與規(guī)范。
四是GPT開啟了定義性時代,沒有強大的算力支持不了大模型,但算力也并非越大越好,應立足滿足當下需求。當下,通過通用人工智能的支持,解決垂直領域應用的需求極為迫切,例如:解決工業(yè)數(shù)據(jù)的關聯(lián)與融合,工業(yè)軟件的開發(fā)與工程化的模擬驗證實驗,為首臺套、首批次、首版次的應用提供可靠依據(jù),縮短成果轉化周期,從而提升科研成果的轉移轉化率和產業(yè)化率,促進更多的中小企業(yè)轉型升級為隱形冠軍;將線下線上融合的數(shù)字化新型社會信用體系建設提上議程,強力推進社會有序、公民有信的數(shù)字化新型社會信用體系建設,將會大大減少社會治理成本的支出。國家事權機構對應身份證信息,給每一個公民頒發(fā)一個唯一數(shù)字身份標識,將需要信用評價的行為確權后在技術上實現(xiàn)歸集,并將伴隨一生的信用記錄納入信用評價體系進行管理;其他如態(tài)勢感知決策支持系統(tǒng);智慧城市的智能建造與運營管理;現(xiàn)代金融體系的構建、運行,金融資源的合理配置、與實體經濟往來中的風險識別與管控;智慧醫(yī)療與全民全生命周期的大健康管理,疑難病癥的診斷與新藥開發(fā),促進醫(yī)學進步;靈活就業(yè)人口社會保障賬戶的設立與管理,奠定為未來社會穩(wěn)定的條件基礎、網(wǎng)絡安全與防御、國防與安全等領域應用,都離不開通用人工智能技術的支持。
(編輯 季節(jié))