萬宏蕾
上海超級計(jì)算中心
UCloud(優(yōu)刻得科技股份有限公司)是中國知名的中立云計(jì)算服務(wù)商,其兩大云基地分別位于“東數(shù)西算”工程規(guī)劃的國家算力樞紐節(jié)點(diǎn),內(nèi)蒙古(烏蘭察布)和長三角(上海青浦)。
“其實(shí)我們布局烏蘭察布數(shù)據(jù)中心時(shí),‘東數(shù)西算8個(gè)樞紐節(jié)點(diǎn)還未發(fā)布。當(dāng)時(shí)考慮烏蘭察布離北京近,海拔更高,有電價(jià)低廉、自然低溫等優(yōu)勢,能耗控制較好;上海數(shù)據(jù)中心則位于長三角一體化等多個(gè)國家戰(zhàn)略交匯點(diǎn),適合布局核心計(jì)算業(yè)務(wù)、高時(shí)效業(yè)務(wù)?!盪Cloud副總裁劉杰告訴《瞭望東方周刊》。
“兩個(gè)基地各有優(yōu)勢。比如,人工智能企業(yè)可以構(gòu)建混合云,將模型訓(xùn)練等非實(shí)時(shí)計(jì)算部署在烏蘭察布,將需要實(shí)時(shí)計(jì)算的推理工作部署在上海,降低成本的同時(shí)提高創(chuàng)新效率?!眲⒔苷f。
“縱觀當(dāng)下中國整體算力分布,東部算力規(guī)模仍遠(yuǎn)高于中西部地區(qū),但依然無法滿足日益增長的算力需求?!鄙虾I缈圃盒畔⒀芯克彼L丁波濤告訴《瞭望東方周刊》,“東部地區(qū)不僅有科學(xué)計(jì)算和大數(shù)據(jù)處理的需求,還有增長更快的人工智能訓(xùn)練和推理計(jì)算等需求,這些都需要體量更大的多種類型智能計(jì)算。隨著‘東數(shù)西算工程推進(jìn),未來我國將逐步形成東、中、西部更加均衡分布的算力體系。”
濟(jì)南超算中心的山河超算平臺
在過去一年里,各地紛紛通過出臺政策、活動招商、建設(shè)重點(diǎn)項(xiàng)目等,響應(yīng)國家“東數(shù)西算”戰(zhàn)略,加快推進(jìn)算力基礎(chǔ)設(shè)施建設(shè)和升級。
作為全國信息化發(fā)展的“排頭兵”,上海具有領(lǐng)先的產(chǎn)業(yè)發(fā)展優(yōu)勢和積極的地方政策。2022年6月,上海市通信管理局印發(fā)的《新型數(shù)據(jù)中心“算力浦江”行動計(jì)劃(2022-2024年)》明確,力爭到2024年初步建成全國一體化算力網(wǎng)絡(luò)上海樞紐節(jié)點(diǎn),形成與本市數(shù)字經(jīng)濟(jì)發(fā)展方式相適應(yīng),長三角地區(qū)協(xié)同發(fā)展的算力服務(wù)發(fā)展格局,建成具有亞太乃至全球影響力的高能級算力樞紐中心。
2022年1月,江蘇省工業(yè)和信息化廳印發(fā)《江蘇省新型數(shù)據(jù)中心統(tǒng)籌發(fā)展實(shí)施意見》,提出到2023年底,江蘇省數(shù)據(jù)中心機(jī)架規(guī)模年均增速保持在20%左右,平均利用率提升到65%,全省新型數(shù)據(jù)中心比例不低于30%,高性能算力占比達(dá)10%,新建大型及以上數(shù)據(jù)中心電能利用效率(PUE)降低到1.3以下;到2025年底,江蘇省數(shù)據(jù)中心機(jī)架規(guī)模達(dá)70萬標(biāo)準(zhǔn)機(jī)架,新型數(shù)據(jù)中心占比進(jìn)一步提升,算力算效水平顯著提高。
數(shù)字經(jīng)濟(jì)大省浙江也于2021年發(fā)布《浙江省推動數(shù)據(jù)中心能效提升行動方案(2021-2025年)》,提出到“十四五”期末,浙江省數(shù)據(jù)中心平均PUE下降至1.5以下,其中大型以上數(shù)據(jù)中心 PUE 降至1.3以下,長三角樞紐區(qū)集群內(nèi)數(shù)據(jù)中心PUE達(dá)到1.25以下,全省數(shù)據(jù)中心可再生能源使用率達(dá)到30%以上。
在算力基礎(chǔ)設(shè)施方面,據(jù)浙江省經(jīng)濟(jì)和信息化廳統(tǒng)計(jì)數(shù)據(jù),截至2023年2月底,全省已建成數(shù)據(jù)中心150多個(gè),主要布局在杭州、嘉興、湖州、金華、溫州等地。算力規(guī)模達(dá)8.86EFlops,已用算力規(guī)模5.07EFlops,另有在建算力規(guī)模7.48EFlops。
圍繞濟(jì)南超算中心,濟(jì)南市歷城區(qū)規(guī)劃打造了14.2 平方公里的超算數(shù)字經(jīng)濟(jì)生態(tài)創(chuàng)新圈。
2022年7月,首屆中國算力大會在山東濟(jì)南舉辦。在這場我國算力領(lǐng)域首個(gè)全國性會議上,現(xiàn)場簽約啟動項(xiàng)目總投資額約461億元,涉及中國移動、中國聯(lián)通、中國電信、中國鐵塔、中國廣電、華為、阿里、浪潮等算力龍頭企業(yè)。業(yè)內(nèi)人士梳理這些項(xiàng)目發(fā)現(xiàn),“東數(shù)西算”已成為這些項(xiàng)目決策和落地的重要依據(jù)。一年多時(shí)間來,多家行業(yè)龍頭在8大樞紐和10大集群積極布局,申請土地空間和能耗指標(biāo),推動自身算力基礎(chǔ)設(shè)施建設(shè)。
自2022年2月之后一年間,全國新開工建設(shè)的數(shù)據(jù)中心項(xiàng)目中,以長三角樞紐及其內(nèi)長三角生態(tài)綠色一體化發(fā)展示范區(qū)集群、蕪湖集群承建項(xiàng)目數(shù)量最多,西部樞紐中則以成渝樞紐及其內(nèi)的天府集群、重慶集群為首。
“當(dāng)前,大部分算力需求集中在數(shù)字經(jīng)濟(jì)發(fā)展較發(fā)達(dá)的東部沿海地區(qū)。”丁波濤分析,即使在“東數(shù)西算”政策引導(dǎo)之下,許多企業(yè)簽約落地項(xiàng)目的地區(qū)仍首選東部地區(qū),算力業(yè)務(wù)向西遷移的增量還是集中在成渝等準(zhǔn)一線城市,部分互聯(lián)網(wǎng)巨頭和三大運(yùn)營商已經(jīng)在貴州、寧夏等西部地區(qū)率先有了進(jìn)一步的探索。
“目前,西部地區(qū)項(xiàng)目主要承載的是對網(wǎng)絡(luò)依賴不強(qiáng)的冷數(shù)據(jù)處理需求和備份需求等業(yè)務(wù),真正意義的‘西算市場還需要加大培育力度?!敝袊茖W(xué)院計(jì)算技術(shù)研究所研究員、中國計(jì)算機(jī)學(xué)會高性能計(jì)算專委會秘書長張?jiān)迫嬖V《瞭望東方周刊》。
2022年底,美國OpenAI推出的ChatGPT引爆了國內(nèi)市場對于大模型的熱情,大模型本身對GPU算力有極強(qiáng)的需求。“目前,國內(nèi)能提供對應(yīng)算力支持的超算中心還不多,國家超級計(jì)算濟(jì)南中心(以下簡稱“濟(jì)南超算中心”)的神器——山河超算平臺部署的智能計(jì)算集群能夠提供人工智能計(jì)算能力。”張?jiān)迫榻B。
“在大模型熱潮襲來后,不少國內(nèi)企業(yè)找過來,希望能夠使用山河的人工智能算力訓(xùn)練大模型。”國家超級計(jì)算濟(jì)南中心研究員郭猛告訴《瞭望東方周刊》,“目前不少科研機(jī)構(gòu)、高校、互聯(lián)網(wǎng)公司排隊(duì)已經(jīng)很長時(shí)間,簡直‘一卡難求。”
“這個(gè)‘卡主要是說目前人工智能大模型訓(xùn)練最常用的專業(yè)級顯卡。”郭猛說。
濟(jì)南超算中心是我國完全采用自主處理器研制的千萬億次超級計(jì)算機(jī)神威·藍(lán)光的誕生地,也是我國超算領(lǐng)域的“領(lǐng)頭羊”之一。
2019年,借助新建全球首個(gè)以“超算”為主題的科技園——國家超級計(jì)算濟(jì)南中心科技園的契機(jī),濟(jì)南超算中心謀定建設(shè)山河超算平臺。這個(gè)平臺不僅可以提供傳統(tǒng)高性能計(jì)算算力,還能提供云計(jì)算和智能計(jì)算服務(wù),后兩者將滿足更多民生、產(chǎn)業(yè)領(lǐng)域的算力需求。
“全球的超算都在沖速度,尤其是高性能計(jì)算在不斷追求更快、更強(qiáng),如何讓超算的算力得到更好的利用?讓超算機(jī)構(gòu)更好地運(yùn)轉(zhuǎn)?”濟(jì)南超算中心副主任郭瑩說,“超算研制瞄準(zhǔn)的是解決大問題,比如‘超算諾貝爾獎(jiǎng)戈登貝爾獎(jiǎng)獲獎(jiǎng)的那些案例,但這些大問題可能占比不到20%,真正消耗大量算力的還是大批量的中小規(guī)模應(yīng)用,所以我們的超算要同時(shí)滿足這兩類需求?!?/p>
在服務(wù)更多產(chǎn)業(yè)和企業(yè)的背景下,山河超算平臺應(yīng)運(yùn)而生。2021年建成的山河平臺高性能計(jì)算能力達(dá)80PFlops (每秒千萬億次計(jì)算),人工智能計(jì)算能力達(dá)到1000PFlops,整體性能居世界先進(jìn)水平,在德國漢堡舉行的ISC2022高性能計(jì)算大會上,一舉登頂世界最新IO500榜單,且大幅刷新了該榜單歷史最好成績。
“山河平臺建成后,我們服務(wù)的用戶面越來越廣,對接的需求也越來越多元,圍繞山河平臺正在形成一個(gè)越來越豐富的超算應(yīng)用生態(tài)?!惫驼f。
“由于選對了技術(shù)路線,濟(jì)南超算中心發(fā)展勢頭迅猛。”張?jiān)迫u價(jià)。
為了進(jìn)一步挖掘算力底座的潛力。圍繞濟(jì)南超算中心,濟(jì)南市歷城區(qū)規(guī)劃打造了14.2平方公里的超算數(shù)字經(jīng)濟(jì)生態(tài)創(chuàng)新圈。2022年底,濟(jì)南超算中心和濟(jì)南超算數(shù)字經(jīng)濟(jì)創(chuàng)新圈服務(wù)中心等機(jī)構(gòu)以聯(lián)合招商小組的名義向全球發(fā)布招商。
“這不是一次單純的招商,更重要的是我們想讓大家都知道濟(jì)南有一個(gè)超算中心,我們的算力能賦能你的產(chǎn)業(yè)。”濟(jì)南超算中心副主任、濟(jì)南超算技術(shù)研究院院長潘景山說。
“算力對企業(yè)的重要性和吸引力不斷增長,越來越多的企業(yè)來科技園考察,越來越多的企業(yè)家在琢磨怎么能用上這種算力?!迸司吧秸f,“一些企業(yè)因?yàn)槌阒行亩x擇落地濟(jì)南超算數(shù)字經(jīng)濟(jì)生態(tài)創(chuàng)新圈?!卑凑找?guī)劃,到2025年,這一創(chuàng)新圈將集聚50家龍頭企業(yè),引進(jìn)和培育企業(yè)500家,新增就業(yè)崗位5000個(gè),形成千億級數(shù)字經(jīng)濟(jì)集群。
2022年6月23日,之江實(shí)驗(yàn)室計(jì)算與數(shù)據(jù)中心,工程師們通過“之江云”系統(tǒng)監(jiān)測服務(wù)器集群的運(yùn)行狀態(tài)(黃宗治/ 攝)
新藥研發(fā)中的分子篩選、智能網(wǎng)聯(lián)汽車的車路協(xié)同、無人值守的“黑燈工廠”……這些對算力有大量剛需的產(chǎn)業(yè)場景,過去不得不面對排隊(duì)申請算力的無奈。
2023年2月20日,依托上海超算中心建設(shè)及運(yùn)用的上海市人工智能公共算力服務(wù)平臺正式揭牌啟用。以該平臺為核心,上?!?+N”算網(wǎng)體系初步形成。
“上海超算中心屬于政府公共算力服務(wù)平臺,通過對公共算力和各種商業(yè)算力的集聚調(diào)度,努力實(shí)現(xiàn)算力如水電等基礎(chǔ)設(shè)施一樣便利使用,為科研機(jī)構(gòu)和廣大中小企業(yè)提供具有公信力的普惠算力,幫助企業(yè)降低使用算力的成本,實(shí)現(xiàn)異構(gòu)異地資源共享。”上海超算中心綜合管理部部長林薇告訴《瞭望東方周刊》。
據(jù)介紹,新建平臺是采用國產(chǎn)自研達(dá)芬奇架構(gòu)的人工智能算力平臺,計(jì)算峰值能力(FP16)達(dá)到100PFlops。主要器件CPU和AI處理器采用冷板式液冷,輔助設(shè)備通過風(fēng)液換熱器進(jìn)行間接冷卻,能耗PUE低于1.3。目前,三大運(yùn)營商以及商湯、華為、騰訊等智算中心的算力都在踴躍加盟這一算力調(diào)度平臺。
“當(dāng)然,要實(shí)現(xiàn)算力抱團(tuán)也面臨不小的挑戰(zhàn)?,F(xiàn)在各種算力的技術(shù)標(biāo)準(zhǔn)、接入方式等都不盡相同,如何通過平臺將這些算力資源匯聚起來,進(jìn)行統(tǒng)一調(diào)度,需要研究相應(yīng)的策略和方法?!绷洲闭f。
根據(jù)中國信通院發(fā)布的《中國綜合算力指數(shù)(2022年)》,截至2021年底,上海市算力指數(shù)排名位列全國第一,綜合算力指數(shù)排名位列全國第二。報(bào)告顯示,上海市算力、存力、運(yùn)力發(fā)展水平均處于全國前列。從算力規(guī)模來看,截至2021年底,上海市在用算力規(guī)模超過13EFlops,在建算力規(guī)模超過7EFlops。
在上海,集成電路、生物醫(yī)藥、人工智能三大先導(dǎo)產(chǎn)業(yè),數(shù)字經(jīng)濟(jì)、綠色低碳、元宇宙、智能終端四大新賽道,以及前瞻布局的未來健康、未來智能、未來能源、未來空間、未來材料等五大未來產(chǎn)業(yè),無不是算力需求大戶。
“比如,一名神經(jīng)系統(tǒng)疾病患者的檢查和治療數(shù)據(jù)高達(dá)500G,急重癥患者每天產(chǎn)生的用藥、化驗(yàn)數(shù)據(jù)等,都迫切需要充沛算力輔助?!比A山醫(yī)院神經(jīng)外科副主任醫(yī)師、教授孫一睿說,“現(xiàn)在,由上海超算中心提供公共服務(wù)算力支撐,華為提供自主可控的昇騰芯片及MindSpore昇思人工智能技術(shù)框架,上海聯(lián)通提供算網(wǎng)一體技術(shù)、聯(lián)通云和算力集成運(yùn)營服務(wù),多方共同打造上海公共服務(wù)算力孵化人工智能輔助醫(yī)學(xué)的創(chuàng)新應(yīng)用,有力推動醫(yī)療系統(tǒng)數(shù)智化升級?!?/p>
“不過,即便上海有這樣的算力基礎(chǔ),由于全社會對于數(shù)字資源的存儲、計(jì)算和應(yīng)用需求與日俱增,導(dǎo)致算力仍供不應(yīng)求?!倍〔f。
在國內(nèi)多地出臺清退落后產(chǎn)能的相關(guān)政策文件中,一些東部地區(qū)的數(shù)據(jù)中心也赫然在列。
隨著“雙碳”目標(biāo)提出和全社會數(shù)字化轉(zhuǎn)型的加速,數(shù)據(jù)中心作為海量數(shù)據(jù)的主要存儲與運(yùn)算處理實(shí)體,其規(guī)模不斷擴(kuò)大,由此帶來的能源消耗問題受到廣泛關(guān)注。
據(jù)中國信通院云計(jì)算與大數(shù)據(jù)研究所測算,到2030年,我國數(shù)據(jù)中心耗電量將超過3800億千瓦時(shí),如果不采用可再生能源,碳排放量將超過2億噸,算力基礎(chǔ)設(shè)施的綠色低碳亟待實(shí)現(xiàn)。
為此,國家及各地政府相繼出臺多項(xiàng)政策性文件,對電能利用效率(PUE值)指標(biāo)控制呈現(xiàn)嚴(yán)格趨勢,在數(shù)據(jù)中心建設(shè)項(xiàng)目審批、運(yùn)營管理、差別電價(jià)等方面不斷將PUE值作為剛性指標(biāo)。
根據(jù)工信部《新型數(shù)據(jù)中心發(fā)展三年行動計(jì)劃(2021-2023年)》發(fā)布的數(shù)據(jù),到2023年底,全國數(shù)據(jù)中心機(jī)架規(guī)模年均增速保持在20%左右,平均利用率力爭提升到60%以上。
同時(shí),在國內(nèi)多地出臺清退落后產(chǎn)能的相關(guān)政策文件中,一些東部地區(qū)的數(shù)據(jù)中心也赫然在列。廣東省提出,珠三角地區(qū)60%中高時(shí)延數(shù)據(jù)業(yè)務(wù)遷至粵東粵西粵北地區(qū);浙江省提出,對于省內(nèi)數(shù)據(jù)中心整體上架率(建成投用1年以上)低于50%的運(yùn)營單位,不支持新建大型和超大型數(shù)據(jù)中心項(xiàng)目,對已建數(shù)據(jù)中心“整合一批、改造一批、淘汰一批”;北京市出臺《低效數(shù)據(jù)中心綜合治理工作方案》,對低效數(shù)據(jù)中心,分批開展整治工作,有序遷移關(guān)閉。
“淘汰一部分東部數(shù)據(jù)中心、把一部分算力轉(zhuǎn)移到西部,本質(zhì)上都是基于實(shí)現(xiàn)‘雙碳目標(biāo)的考慮,‘東數(shù)西算不僅能夠節(jié)約‘西電東送的成本,還能提高對西部光伏、風(fēng)電等綠色能源的使用?!倍〔f。
“UCloud幫助客戶將原本部署在東部的服務(wù)器中對時(shí)延敏感性低的業(yè)務(wù)西遷至烏蘭察布數(shù)據(jù)中心,遷移后可以幫助客戶將IT運(yùn)營成本降低50%?!?劉杰說。
“我們公司的主營業(yè)務(wù)是云計(jì)算。云計(jì)算本身就是一種綠色的計(jì)算資源,通過集群化管理、高效運(yùn)營,相對于傳統(tǒng)架構(gòu),降低能源消耗和資源消耗;烏蘭察布數(shù)據(jù)中心選址可以助力新能源消納,同時(shí)降低數(shù)據(jù)中心的PUE和耗電量;上海青浦云計(jì)算中心建設(shè)光伏發(fā)電,抵消自身碳排放?!?UCloud基礎(chǔ)設(shè)施工程管理經(jīng)理?xiàng)钍鐚毟嬖V《瞭望東方周刊》。
“同時(shí),我們的數(shù)據(jù)中心還利用很多創(chuàng)新性技術(shù)手段,諸如自然冷卻、間接蒸發(fā)、熱回收、高壓直流、智能化運(yùn)營等,降低數(shù)據(jù)中心PUE,降低能耗和碳排放。比如在上海數(shù)據(jù)中心采用的白露間接蒸發(fā)冷卻技術(shù),通過重構(gòu)間接蒸發(fā)冷卻流程,極大地提高了制冷效率?!睏钍鐚氀a(bǔ)充道,這項(xiàng)技術(shù)獲得了2022年“云計(jì)算中心科技獎(jiǎng)卓越獎(jiǎng)”。
“‘東數(shù)西算工程剛啟動一年多,相關(guān)規(guī)劃和基礎(chǔ)設(shè)施目前還在推進(jìn)過程中。對于企業(yè)來說,‘東數(shù)要不要‘西算,目前看來是可選項(xiàng),未來可能是必選項(xiàng)。”丁波濤說。
國家超級計(jì)算深圳中心(深圳云計(jì)算中心)
注釋:EFlops 即每秒100 億億(=1018) 次浮點(diǎn)運(yùn)算。