韓菲子 尚洪坤
當前,人工智能日益融入經(jīng)濟發(fā)展各個領域,成為推動科技跨越發(fā)展、產(chǎn)業(yè)優(yōu)化升級、生產(chǎn)力整體躍升的重要驅動力量。大模型技術的發(fā)展則推動了人工智能由量變引發(fā)質變。近一年來,大模型熱潮席卷全球并持續(xù)升溫。全球越來越多的科技巨頭、知名高校、科研院所和創(chuàng)新型企業(yè)加大研究力度,大模型技術不斷迭代升級,模型能力不斷加強,逐漸形成從底層算力、模型開發(fā)到行業(yè)應用的全新智能化產(chǎn)業(yè)。北京正在建設國際科技創(chuàng)新中心,在推動大模型產(chǎn)業(yè)加速發(fā)展方面優(yōu)勢明顯,但同時面臨著一些挑戰(zhàn),大模型產(chǎn)業(yè)發(fā)展仍需綜合施策。
國內加力推動大模型技術研發(fā)與應用
大模型,是指依托海量、優(yōu)質數(shù)據(jù),通過強大算力進行訓練后,完成大量不同任務的模型。大模型具有超強計算能力,能夠處理海量數(shù)據(jù),完成各種云端的復雜任務。近年來,大模型技術迅速迭代,打破了原有人工智能技術發(fā)展的上限,認知和應用能力顛覆式提升。
大模型的崛起是算法、算力、數(shù)據(jù)三要素全面支撐的結果。首先是算力,算力是人工智能(AI)訓練的基礎設施,強大的計算能力對于訓練大型人工智能模型至關重要,包括高性能處理器、大量存儲空間和高速網(wǎng)絡連接、軟硬件適配完備的GPU算力生態(tài)體系;其次是算法,先進算法是大模型訓練的關鍵,包括深度學習、遷移學習等,這些算法有助于模型在大量數(shù)據(jù)中找到有效的特征和規(guī)律;再者是數(shù)據(jù),數(shù)據(jù)是大模型的“食物”,大型且優(yōu)質的數(shù)據(jù)集可以源源不斷為大模型提供豐富的訓練數(shù)據(jù),涵蓋文本、圖像、音頻和視頻等多種類型的信息。
中國大模型研發(fā)和應用快速發(fā)展。目前,美國和中國發(fā)布的通用大模型總數(shù)占全球發(fā)布量的80%,成為大模型技術領域的引領者。谷歌、微軟、Meta、亞馬遜等全球科技巨頭將大模型視為重要發(fā)展機遇,積極投入并且大動作頻發(fā)。我國眾多企業(yè)也投身大模型領域,不斷打通大模型研發(fā)與產(chǎn)業(yè)應用場景的壁壘,推動人工智能在傳統(tǒng)行業(yè)落地。工信部賽迪研究院數(shù)據(jù)顯示,2023年,我國生成式人工智能企業(yè)采用率已達15%,市場規(guī)模約為14.4萬億元。我國大模型企業(yè)主要包括:百度、阿里、騰訊等互聯(lián)網(wǎng)大廠,科大訊飛、商湯科技、曠視科技等垂直于AI領域的廠商,以及智譜華章、百川智能、MiniMax等大模型初創(chuàng)企業(yè)。
一線城市競相布局大模型。從全國范圍看,北京、上海、廣州、深圳等城市陸續(xù)出臺大模型產(chǎn)業(yè)發(fā)展措施,加速大模型應用落地。根據(jù)2023年中國科學技術信息研究所發(fā)布的《中國人工智能大模型地圖研究報告》統(tǒng)計表明,人工智能和大模型學者指數(shù)排名國內前四的分別是:北京、江蘇、廣東、上海。學校和機構作為開源主力,清華大學的ChatGLM-6B、復旦大學的MOSS、百度的文心系列大模型在開源影響力上位居三甲。北京不論在人工智能學者數(shù)量方面還是大模型學者數(shù)量方面都遙遙領先于其他地區(qū),體現(xiàn)出明顯的人才儲備優(yōu)勢。
北京布局大模型優(yōu)勢和挑戰(zhàn)并存
北京對人工智能、大模型布局較早,人工智能一直是北京的“強項”:北京已摘得人工智能核心企業(yè)數(shù)量、產(chǎn)業(yè)集聚能力、專利授權量、工信部“揭榜掛帥”優(yōu)勝項目數(shù)量、國家級重點實驗室數(shù)量、投融資活躍程度等多項“冠軍”。
北京正在不斷推進國際科技創(chuàng)新中心建設,加快建設全球數(shù)字經(jīng)濟標桿城市,人工智能產(chǎn)業(yè)作為建設工作的重要抓手,持續(xù)受到高度關注與重點支持。2023年,北京人工智能相關產(chǎn)值規(guī)模初步統(tǒng)計突破2500億元,核心企業(yè)數(shù)量超過1800家,形成基本完整的產(chǎn)業(yè)鏈,涵蓋基礎層、技術層和應用層等環(huán)節(jié)。
截至2023年10月,我國10億參數(shù)規(guī)模以上的大模型廠商及高校院所共計254家,分布于20余省市或地區(qū),其中北京有122家,數(shù)量居全國首位,約占全國的一半。按模型類型分析,北京擁有通用大模型廠商及高校院所37家,占比30%,以百度、智譜華章、百川智能等為代表;行業(yè)大模型85家,以第四范式、云知聲、銜遠科技等為代表。北京大模型廠商及高校院所主要集聚在海淀區(qū),其次為朝陽區(qū)。海淀區(qū)共87家(通用大模型33家,行業(yè)大型54家),占北京全市的71%。
2023年5月,北京市人民政府發(fā)布《北京市加快建設具有全球影響力的人工智能創(chuàng)新策源地實施方案(2023—2025年)》《北京市促進通用人工智能創(chuàng)新發(fā)展的若干措施》,強調開展大模型創(chuàng)新算法及關鍵技術研究,加強大模型訓練數(shù)據(jù)采集及治理工具研發(fā),推動大模型在政務、醫(yī)療、科學、金融等領域的示范應用。同時,北京市經(jīng)濟和信息化局聯(lián)合市科委、中關村管委會、市發(fā)展改革委共同啟動“北京市通用人工智能產(chǎn)業(yè)創(chuàng)新伙伴計劃”,推進人工智能大模型研發(fā)和應用,賦能千行百業(yè)數(shù)智化轉型,加速大模型的行業(yè)應用落地。
2023年10月,北京市經(jīng)濟和信息化局印發(fā)《人工智能算力券實施方案(2023—2025年)》支持在京注冊的軟件信息服務業(yè)企業(yè)和制造業(yè)企業(yè),租用非關聯(lián)方的智能算力資源,在工業(yè)、政務、醫(yī)療、金融、教育、法務、交通、文旅、科學研究、城市管理、便民服務等領域進行行業(yè)人工智能大模型訓練和應用。企業(yè)申領算力券,可享受智能算力合同額一定比例的算力券補貼。
然而,北京發(fā)展人工智能大模型產(chǎn)業(yè)依舊面臨一些挑戰(zhàn):算力資源供不應求,已成為大模型企業(yè)創(chuàng)新研發(fā)的重大挑戰(zhàn)。大模型熱潮興起之后,市場上算力需求劇增,英偉達芯片供不應求,加之美國對中國實施芯片制裁,國內云廠商提供的商業(yè)化算力供應緊張,價格不斷上漲。據(jù)統(tǒng)計,北京很多人工智能企業(yè)近兩年內有租用英偉達A100/A800/H800算力需求,預計算力缺口約5000P。目前僅少部分龍頭企業(yè)和頭部初創(chuàng)企業(yè)能夠租到算力資源,但成本過高,大量中小型企業(yè)僅持有少量英偉達高性能算力,仍需要外部算力支撐。
大量高質量數(shù)據(jù)缺乏。大模型的養(yǎng)成需要不斷“投喂”大量、高質量的數(shù)據(jù)。目前市面上缺乏高質量公開的數(shù)據(jù)集,大模型廠商和擁有數(shù)據(jù)集的用戶不互通,即大模型廠商無法迭代準確面向行業(yè)落地場景訓練大模型;而多數(shù)行業(yè)數(shù)據(jù)豐富的企業(yè)用戶又缺乏自研大模型的能力,嚴重掣肘行業(yè)模型研發(fā)和應用落地。例如,政務、醫(yī)療、智慧城市等領域數(shù)據(jù)獲取難度大,隱私性要求高,阻礙了大模型應用落地的進程。
大模型應用落地性有待提升?,F(xiàn)階段大模型應用存在一定同質化情況,多集中在面向內部員工的知識檢索、文字生成等方面,其落地效果及實際業(yè)務收益有待進一步提升。大模型廠商需與企業(yè)用戶深度對接需求,找到高價值、差異化的大模型應用剛需。
北京大模型產(chǎn)業(yè)發(fā)展須打“組合拳”
當前,結合產(chǎn)業(yè)發(fā)展階段和企業(yè)需求,北京可以圍繞人才、基金、產(chǎn)業(yè)生態(tài)等方面保障,加快建設智能算力基礎設施、提升高質量數(shù)據(jù)供給能力、創(chuàng)新大模型應用落地機制等舉措,培育大模型產(chǎn)業(yè)生態(tài)。
全力夯實人工智能底層基礎。開發(fā)自主品牌的國產(chǎn)人工智能芯片,積極引導大模型研發(fā)企業(yè)應用國產(chǎn)人工智能芯片,加快提升人工智能算力供給的國產(chǎn)化率。提升算力資源統(tǒng)籌供給能力,落實算力伙伴計劃,建立算力資源調度平臺,通過算力券、資金補貼等方式,支撐自主可控的大模型技術體系建設。
加強行業(yè)數(shù)據(jù)流通交易。鼓勵各類企業(yè)建設高水平行業(yè)數(shù)據(jù)集,加強行業(yè)數(shù)據(jù)流通交易,增加高質量行業(yè)數(shù)據(jù)供給,繁榮行業(yè)大模型商業(yè)生態(tài)。鼓勵大模型團隊與行業(yè)用戶多互通,交流大模型開發(fā)需求,共享數(shù)據(jù),并建立共贏機制。
加快創(chuàng)新應用場景建設。依托北京創(chuàng)新潛能和資源優(yōu)勢,打造標桿型示范場景,牽引大模型創(chuàng)新成果落地應用。在政務、金融、醫(yī)療、文化旅游等領域,引導行業(yè)用戶向大模型廠商開放有價值的核心業(yè)務場景,探索大模型商業(yè)化模式和產(chǎn)業(yè)化發(fā)展路徑。
鼓勵大模型企業(yè)在多層次資本市場開展股權融資。引導和撬動社會資本重點投向大模型產(chǎn)業(yè)。發(fā)揮人工智能產(chǎn)業(yè)基金支持作用,引導和撬動社會資本重點投向大模型產(chǎn)業(yè)。通過北京市人工智能產(chǎn)業(yè)投資基金參與投資,重點投向人工智能芯片、訓練數(shù)據(jù)及相關軟件等底層技術領域,大模型算法創(chuàng)新、可信AI等關鍵領域,以及大模型等人工智能技術產(chǎn)品開發(fā)和垂直行業(yè)創(chuàng)新應用等相關領域。
做好大模型應用監(jiān)管。推動產(chǎn)業(yè)健康安全發(fā)展,堅持“包容審慎”的總基調,依法依理堅守安全底線,構建高標準評測及治理體系,持續(xù)推動模型備案上線。加快建立技術新標準,構建圍繞大模型底層設施、關鍵技術、上層應用的標準體系。督促大模型企業(yè)使用安全可控的技術手段開展自評估,為重點企業(yè)提供服務和指導,爭取更多優(yōu)質的大模型產(chǎn)品更快更好地上線服務。
(作者單位:中咨海外咨詢有限公司)