段永朝
大模型的高質量發(fā)展,有賴于業(yè)務領域、應用場景、技術研發(fā)的協(xié)同創(chuàng)新,更有賴于牢固樹立公共服務、公共治理、公共安全的核心理念——追求公共利益,而不是企業(yè)的局部利益;追求互聯(lián)互通,而不是產(chǎn)生新的數(shù)字孤島;追求協(xié)同式開發(fā),而不是單打獨斗的閉門造車。
過去一年里,ChatGPT引爆的大模型技術,已成為人工智能全新的應用領域。2023年7月,在北京舉辦的世界人工智能大會上,披露了近百種大模型產(chǎn)品,一時間,“百模大戰(zhàn)”成為這一領域獨特的風景。
大模型究竟是什么?能解決什么實際問題?對未來數(shù)字經(jīng)濟的發(fā)展將發(fā)揮何種重要的作用?這些問題隨著大模型領域的深入討論,日漸呈現(xiàn)出面向產(chǎn)業(yè)、面向應用、面向深度創(chuàng)新的態(tài)勢。
簡單說,大模型指的是擁有數(shù)十億至數(shù)百億個參數(shù)的神經(jīng)網(wǎng)絡模型。從應用角度說,大模型可以完成圖像分類、機器翻譯、內容生成等任務。特別突出的是其“多模態(tài)”內容生成能力(如百度的文心大模型)。一時間,基于大模型的應用大量涌現(xiàn),比如眾所周知的GPT4、PaLM2、Claude、Llama、文心一言、訊飛星火等。
人工智能從“分析式”向“生成式”轉變,可以視為人工智能這一領域創(chuàng)立66年來的第四次浪潮(前三次分別為符號演算、專家系統(tǒng)和深度學習)。這次浪潮有三個主要的特點:其一是模型參數(shù)量巨大,模型預訓練所需算力巨大;其二是采用預訓練和微調方法;其三是復雜的關系表達能力和優(yōu)異的泛化能力。
與國外側重通用人工智能(AGI)不同,國內大模型側重垂直類大模型,在交通、能源、智能制造、金融、數(shù)字政務、在線辦公、生物計算等領域均有不同類型的垂直大模型出現(xiàn),其中百度的文心大模型表現(xiàn)尤為出色。
然而,在百模大戰(zhàn)的背后,需要深入思考的一個問題是:依托大模型的未來數(shù)字基礎設施將會發(fā)生何種變化?由此對企業(yè)的組織形態(tài)、生產(chǎn)方式將會引發(fā)何種變化?進而人與智能技術的分工形式是怎樣的?下面從超級平臺、聯(lián)邦學習和智能代理,以及公共屬性——構建超級平臺的基本原則、開發(fā)大模型的協(xié)作環(huán)境等五個方面簡要分析。
超級平臺
企業(yè)智能平臺內嵌大模型,將大大提升企業(yè)基于內容的知識生產(chǎn)能力,比如平面設計、文案設計、智能客服、情報分析、場景模擬、生產(chǎn)過程仿真、產(chǎn)品設計、輔助決策、辦公事務處理等。垂直類大模型的興起,意味著企業(yè)對大模型的需求,大大溢出企業(yè)的運營邊界、數(shù)據(jù)邊界、管理邊界,期待在更大的數(shù)據(jù)視野下,獲得產(chǎn)業(yè)的環(huán)境數(shù)據(jù)、生態(tài)的全景地圖、客戶的360度畫像。
但是,在百模大戰(zhàn)塵埃落定的時刻,是否會孕育出“超級平臺”這樣全新的“物種”?這是一個關鍵的問題。
所謂超級平臺,是指具備行業(yè)特征、覆蓋某一特定領域,具備全時、全域、全聯(lián)通、全交互的公共服務平臺。與傳統(tǒng)聚焦交易服務的平臺企業(yè)不同的是:超級平臺屬于“第四方平臺”,具備行業(yè)視角,提供整合數(shù)據(jù)分析、交換、共享和價值傳遞,突出公共服務職能。
超級平臺的主要作用包括:
數(shù)據(jù)整合和分析能力:跨平臺、跨機構、跨系統(tǒng)整合多個數(shù)據(jù)來源,提供更全面的數(shù)據(jù)視角,并通過垂直大模型提供對該領域數(shù)字世界的實時洞察。
合作和共享:支持不同實體之間的雙向數(shù)據(jù)交換,促進更深層次的合作關系。
高級分析和洞察:基于領域、垂直大模型的典型場景和用例,提供多剖面分析功能,如預測分析、機器學習和人工智能等,以從數(shù)據(jù)中發(fā)現(xiàn)更深入的信息和洞察。
定制化服務:根據(jù)用戶需求提供更具定制化的服務,以滿足不同領域的特定需求。
數(shù)據(jù)安全和隱私保護:更關注數(shù)據(jù)的安全性和隱私保護,以確保數(shù)據(jù)在共享和分析過程中得到適當?shù)谋Wo。
在超級平臺的視野下,百模大戰(zhàn)塵埃落定之時,行業(yè)領域將會沉淀形成少數(shù)幾個優(yōu)質的公共服務平臺。這將意味著絕大多數(shù)企業(yè)自行打造的封閉的、私有的大模型將難以有更大的生存和發(fā)展空間,轉而與超級平臺進行有效的對接。
聯(lián)邦學習
2017年,Google研究員H. Brendan McMahan等在論文“Communication-efficient learning of deep networks from decentralized data”(《一種面向分布式數(shù)據(jù)的深度網(wǎng)絡有效通信的學習方法》)中首次介紹了聯(lián)邦學習的概念和原理。這篇論文在機器學習領域引起了廣泛的關注,成為聯(lián)邦學習研究領域的重要里程碑之一。
聯(lián)邦學習是一種分布式機器學習方法,它的基本原理是將大模型的訓練過程,拆分為多個設備上的本地訓練和中央服務器上的參數(shù)聚合。與傳統(tǒng)的集中式機器學習不同,每個設備使用本地局域數(shù)據(jù)訓練模型,然后將局部模型的更新(通常是梯度)發(fā)送到超級平臺的中央服務器。中央服務器收集來自各個設備的更新,并根據(jù)一定的聚合算法(如平均)來更新全局模型。這樣,全局模型在不暴露原始數(shù)據(jù)的情況下進行了改進。
聯(lián)邦學習的方法,運用“數(shù)據(jù)可用不可見”的原則,有效地回避了數(shù)據(jù)跨區(qū)域流動的法律風險,保護了數(shù)據(jù)持有者的數(shù)據(jù)隱私,同時又促進了全局視角的數(shù)據(jù)可用,對于面向隱私的數(shù)據(jù)和設備間合作,奠定了有效的基礎,特別適用于移動設備、物聯(lián)網(wǎng)設備和分布式系統(tǒng)。
聯(lián)邦學習可以根據(jù)不同的分類方式進行劃分,其中一種常見的分類是基于數(shù)據(jù)擁有者的區(qū)分:
垂直聯(lián)邦學習(Vertical Federated Learning):不同設備上的數(shù)據(jù)在特征維度上存在差異,但相同樣本的不同特征在不同設備上。這種情況下,垂直聯(lián)邦學習允許在保護數(shù)據(jù)隱私的前提下,進行數(shù)據(jù)合作和模型訓練。
水平聯(lián)邦學習(Horizontal Federated Learning):不同設備上的數(shù)據(jù)在樣本維度上存在差異,但相同特征的不同樣本在不同設備上。這種情況下,水平聯(lián)邦學習可以實現(xiàn)不同設備間的數(shù)據(jù)合作和模型訓練。
聯(lián)邦學習在多個領域都有重要應用,包括但不限于以下方面:移動設備上的個性化模型訓練,例如移動端鍵盤的個性化建議。醫(yī)療領域中,不同醫(yī)療機構間的合作分析,而不必共享患者敏感數(shù)據(jù)。物聯(lián)網(wǎng)設備之間的合作分析,例如傳感器數(shù)據(jù)分析。隱私保護的機器學習任務,如用戶行為分析,而不泄露個人信息。
現(xiàn)階段,聯(lián)邦學習還面臨一些挑戰(zhàn),主要有:較高的通信和計算成本,大量異質性數(shù)據(jù)如何有效參與訓練,如何通過局部模型聚合出全局模型,惡意參與者和隱私泄漏等安全問題,聯(lián)邦學習聚合模型的性能和收斂性,跨區(qū)域聚合模型面臨的法律合規(guī)和風控問題等。
智能代理
智能代理是一種智能計算機系統(tǒng),具有某種程度的自主性和能動性,能夠在特定環(huán)境中感知和處理信息,以達到預定的目標。在大模型時代,智能代理將成為取代App的重要用戶終端(或者稱超級App),并成為用戶與超級平臺之間雙向、多向交互的重要工具。
智能代理的概念最早可以追溯到20世紀80年代。1986年,計算機科學家Michael George Dyer在一篇名為“Agent Z and intelligent agents”(《代理Z和智能代理》)的論文中,首次提出了智能代理的概念,描述了能夠自主感知、決策和行動的計算機程序。
智能代理的主要特點包括:
自主性:能夠獨立感知環(huán)境、做出決策和執(zhí)行行動。
學習能力:能夠從經(jīng)驗中學習,并根據(jù)環(huán)境變化調整行為。
目標導向:能夠根據(jù)預定目標或任務執(zhí)行行動。
適應性:能夠適應不同環(huán)境和情境。
通信能力:能夠與其他代理或系統(tǒng)進行通信和協(xié)作。
智能代理在現(xiàn)實應用中可以用于解決許多問題,包括:
自動化任務:智能代理可以在無人值守的環(huán)境中執(zhí)行任務,如自動駕駛汽車、工業(yè)生產(chǎn)線上的機器人等。
信息檢索和過濾:智能代理可以根據(jù)用戶的偏好和需求,自動檢索和過濾信息,以提供個性化的內容。
智能助理:智能代理可以成為虛擬助理,協(xié)助用戶完成日常任務,如語音助手、聊天機器人、智能客服等。
在超級平臺、聯(lián)邦學習的環(huán)境下,智能代理可以基于大模型來實現(xiàn)更復雜的決策和任務處理,并利用大模型的學習能力來提高智能代理的表現(xiàn)。此外,智能代理也可以在聯(lián)邦學習中充當前端設備或系統(tǒng),通過協(xié)作來訓練和改進共享的模型,實現(xiàn)更廣泛的學習。
超級平臺、聯(lián)邦學習和智能代理之間的緊密配合,將為涌現(xiàn)超級平臺提供重要的支撐,構建更具智能性和協(xié)作性的人-機-環(huán)境的融合系統(tǒng)。
公共屬性:構建超級平臺的基本原則
大模型、超級平臺、超級App等概念,除了讓人血脈僨張、腦洞大開之外,可能存在兩方面的誤區(qū):一個是傳統(tǒng)的互聯(lián)網(wǎng)思維的慣性,另一個是零和博弈的發(fā)展策略。
過去20年里,互聯(lián)網(wǎng)思維對發(fā)展互聯(lián)網(wǎng)經(jīng)濟起到了重要的推動作用,包括社群思維、零邊際成本效應、長尾模式等。但互聯(lián)網(wǎng)思維中也存在若干“毒性”很強的觀念,如“速度為王、唯快不敗”“贏者通吃”“流量經(jīng)營”等。一時間,互聯(lián)網(wǎng)疆域淪為“碾壓式創(chuàng)新”“掠奪式收割”的角斗場,平臺肆意追求狹隘的規(guī)模增長,運用平臺壟斷地位制定不平等的運營規(guī)則,價格歧視、惡性競爭、數(shù)據(jù)隱私泄漏、過度營銷、平臺孤島等亂象頻出。
大模型、超級平臺、智能代理和超級App,因其跨平臺、跨主體的數(shù)據(jù)聚合能力,使得數(shù)字時代涌現(xiàn)的新物種,必須在互聯(lián)互通、協(xié)作共生、監(jiān)管合規(guī)、安全有效的原則下開展運營,必須以公共利益、公共治理、公共服務和公共安全中共有的“公共屬性”為重要的基本原則。
構建大模型應用涉及許多重要的原則,包括公共利益、公共治理、公共服務和公共安全。這些原則有助于確保大模型應用的合理性、可持續(xù)性和社會影響的積極性。
公共利益(Public Interest):公共利益是指在社會范圍內符合廣大人民群眾的利益,涉及社會的整體福祉和公共目標。在構建大模型應用時,必須確保應用的設計、功能和影響是有益于社會和公眾的。大模型應用應該服務于廣大人民的需求,提供有意義、實用和有效的解決方案,以促進社會共同進步和可持續(xù)發(fā)展。
公共治理(Public Governance):公共治理是指社會各方面的參與和合作,通過政府和非政府機構來管理和解決問題。在大模型應用中,公共治理要求建立透明、開放、合作的決策過程和管理機制。各方利益相關者應該參與到應用的規(guī)劃、設計和監(jiān)管中,以確保決策的公平性、合法性和民主性。
公共服務(Public Service):公共服務是政府、組織或機構向社會提供的服務,旨在滿足人們的基本需求和社會發(fā)展的需要。大模型應用應該被視為一種公共服務,為社會提供有益的功能和服務。這包括通過大模型來改善教育、醫(yī)療、交通、環(huán)境等方面的問題,以提高公眾生活質量,促進高質量發(fā)展。
公共安全(Public Safety):公共安全是指維護社會秩序、保護人民生命財產(chǎn)安全的任務和責任。在大模型應用中,保護用戶數(shù)據(jù)隱私和信息安全是至關重要的。應該采取有效的隱私保護措施,防止數(shù)據(jù)泄露、濫用和侵犯,以確保用戶的信息得到適當?shù)谋Wo。
開發(fā)大模型的協(xié)作環(huán)境
2023年2月27日,中共中央、國務院發(fā)布《數(shù)字中國建設整體布局規(guī)劃》,這是未來15年中國數(shù)字經(jīng)濟、數(shù)字社會、數(shù)字政務、數(shù)字文化和數(shù)字生態(tài)文明建設的綱領性文件。這個文件高度概括并提出了建設“數(shù)字基礎設施大動脈”“數(shù)字資源流通大循環(huán)”的兩大基礎,提升創(chuàng)新能力、安全能力兩大能力,拓展數(shù)字治理環(huán)境、國際交流協(xié)作環(huán)境兩個環(huán)境建設的重要框架。文件中明確指出“橫向打通、縱向貫通、協(xié)調有力”的指導思想,明確“互聯(lián)互通”是數(shù)字中國建設的首要支撐。
在這個總體思路下,未來無論通用大模型、行業(yè)與領域的垂直大模型,在度過“百模大戰(zhàn)、百模爭先”的階段之后,勢必會逐漸形成不同細分領域、不同區(qū)域的專屬大模型。這個大模型以及所支撐的超級平臺,將大大削弱傳統(tǒng)平臺單一的經(jīng)濟屬性,強調其管理、運營、安全和服務的公共屬性。在這個歷史發(fā)展過程中,企業(yè)發(fā)展大模型的基本思路,就有別于以往“競爭性技術應用”的思路,而是“開放協(xié)作式技術應用”的思路。
具體而言,就是企業(yè)將依托頭部企業(yè)所提供的智能技術開發(fā)環(huán)境、開發(fā)技術,依托開發(fā)者社群和開發(fā)資源,共建本行業(yè)的超級平臺,為訓練大模型增添本地的局域資源,最終享有行業(yè)的整合資源優(yōu)勢,把企業(yè)的優(yōu)勢資源聚焦到生產(chǎn)過程和產(chǎn)品創(chuàng)新中來。
以百度為例。百度與大模型相關的智能科技布局,是國內唯一涵蓋高端芯片(昆侖)、大規(guī)模深度學習與開發(fā)者社區(qū)(飛槳)、文心大模型、原生插件和大量行業(yè)應用場景的高科技企業(yè)。目前飛槳平臺已經(jīng)凝聚800萬名開發(fā)者,服務22萬家企事業(yè)單位;飛槳星河大模型社區(qū),依托600萬+開發(fā)項目,形成了超過300個大模型創(chuàng)意應用;基于飛槳系統(tǒng),已經(jīng)創(chuàng)建了80萬個模型。
千帆大模型,是百度智能云推出的全球首個一站式企業(yè)級大模型平臺,以文心大模型為核心,同時全面接入Llama2全系列、ChatGLM2-6B、RWKV-4-World、MPT-7B-Instruct、Falcon-7B等33個大模型,成為國內擁有大模型最多的平臺。
借助百度千帆大模型,已經(jīng)在智慧能源、智能制造、智慧金融、數(shù)字政務、智慧交通等領域獲得豐富的應用場景。
大模型的高質量發(fā)展,有賴于業(yè)務領域、應用場景、技術研發(fā)的協(xié)同創(chuàng)新,更有賴于牢固樹立公共服務、公共治理、公共安全的核心理念——追求公共利益,而不是企業(yè)的局部利益;追求互聯(lián)互通,而不是產(chǎn)生新的數(shù)字孤島;追求協(xié)同式開發(fā),而不是單打獨斗的閉門造車。只有更新理念、更新思路、更新方法,建設數(shù)字中國的過程中,才有可能更加順暢地面對新挑戰(zhàn)、創(chuàng)造新生態(tài)、擁抱新變化。
(作者為杭州師范大學阿里巴巴商學院特聘教授,葦草智酷創(chuàng)始合伙人,信息社會50人論壇執(zhí)行主席)
責任編輯:馬莉莎