張?zhí)靷?/p>
面對大模型這樣一個被馬化騰視為幾百年不遇、類似發(fā)明電的工業(yè)革命一樣的機遇,騰訊終于公布了其在這一領(lǐng)域的全面布局。
一方面,騰訊通過混元大模型、騰訊云MaaS,將大模型能力應(yīng)用于內(nèi)部產(chǎn)品及To B業(yè)務(wù)之中。另一方面,騰訊在企業(yè)服務(wù)、人工智能領(lǐng)域的投資已累計超過280起,其中包括估值達到12.5億美元的大模型初創(chuàng)企業(yè)MiniMax。
種種跡象表明,騰訊的大模型故事將著重從B端市場展開。
從6月18日在國內(nèi)率先推出行業(yè)大模型解決方案騰訊云MaaS(Modelas-a-Service,模型即服務(wù)),到9月7日將混元大模型放到其在產(chǎn)業(yè)互聯(lián)網(wǎng)領(lǐng)域最具影響力的“全球數(shù)字生態(tài)大會”上發(fā)布,騰訊對產(chǎn)業(yè)互聯(lián)網(wǎng)的重視,可見一斑。某種意義上說,已在C端擁有數(shù)個覆蓋10億級用戶的騰訊,未來能否再造一個騰訊,系于B端。
事實上,在人們的新鮮勁過后,年初爆火的ChatGPT自今年6月起便陷入了流量瓶頸。根據(jù)SimilarWeb的監(jiān)測數(shù)據(jù),其用戶數(shù)量從5月最高的19億人下滑至7月的15億人。這也讓大模型在C端直接以產(chǎn)品形式落地的商業(yè)前景蒙上陰影。
相比較下,數(shù)字化轉(zhuǎn)型需求更為明確的產(chǎn)業(yè)客戶,對大模型出色的語言理解、內(nèi)容生成等能力,有著更強的付費意愿。因此,在To C或To B的路線選擇上,騰訊從商業(yè)模式的角度出發(fā),選擇率先從后者發(fā)力。
在騰訊云副總裁吳運聲眼中,產(chǎn)業(yè)場景是大模型的最佳練兵場,而大模型也可以為騰訊To B業(yè)務(wù)的商業(yè)模式拓展提供新的思考?!爱?dāng)前,企業(yè)客戶在應(yīng)用大模型時,會面臨計算資源少、數(shù)據(jù)質(zhì)量差、投入成本高、專業(yè)經(jīng)驗少等現(xiàn)實問題的挑戰(zhàn)。拆解客戶所遇到的問題,也會為我們帶來很多業(yè)務(wù)契機?!?/p>
同時,借力大模型,打破騰訊云長期面臨的“增收不增利”的局面,或也是另一種期待。
數(shù)據(jù)來源:Wind,新財富整理
自2018年進軍產(chǎn)業(yè)互聯(lián)網(wǎng)以來,騰訊面向B端客戶的金融科技與企業(yè)服務(wù)業(yè)務(wù)收入在不斷增長,2019-2022 年從1013.55 億元增至1770.64億元,占營收的比例從26.9%提升至31.9%(圖1),但一份券商研究報告顯示,2020至2022年,騰訊云的毛利率均為負值。
以至于在主打“ 降本增效”的2022 年,騰訊云與智慧產(chǎn)業(yè)事業(yè)群(CSIG)明確各業(yè)務(wù)要全面提升利潤率更高的自研產(chǎn)品比例,并將業(yè)績考核重點轉(zhuǎn)為業(yè)務(wù)的利潤水平。
“我們始終認為,大模型需要基于產(chǎn)業(yè)場景,與企業(yè)數(shù)據(jù)融合,才能釋放出最大的價值?!彬v訊集團高級執(zhí)行副總裁、CSIG負責(zé)人湯道生稱。
那么,當(dāng)混元大模型正式亮相,騰訊云MaaS能力完成升級迭代,騰訊To B業(yè)務(wù)的發(fā)展又將產(chǎn)生什么樣的變化?
“騰訊會議基于混元大模型打造的AI小助手,已經(jīng)能夠通過簡單的自然語言指令,完成會議信息提取、內(nèi)容分析等復(fù)雜任務(wù),會后還能生成智能總結(jié)紀(jì)要?!痹?023騰訊全球數(shù)字生態(tài)大會上,騰訊集團副總裁蔣杰分享的案例顯示,擁有超3億用戶數(shù)的騰訊會議,已開始應(yīng)用大模型的能力。
大模型本身并非一個新的事物。在吳運聲看來,大模型的本質(zhì)是深度學(xué)習(xí),而騰訊早在十幾年前便已開始對深度學(xué)習(xí)進行布局。只是當(dāng)2017年谷歌提出神經(jīng)網(wǎng)絡(luò)模型Transformer,驅(qū)動深度學(xué)習(xí)模型參數(shù)從過去的以千為單位,發(fā)展至如今超過千億級別的大模型,并在2022年底爆發(fā)時,才闖入了人們的視野。
拆解騰訊在大模型領(lǐng)域的布局,可分為三大模塊。第一塊是騰訊云過去研發(fā)、積累的算力、算法、數(shù)據(jù)等基礎(chǔ)設(shè)施及AI工具,這是大模型訓(xùn)練的前提條件。
“ 在ChatGPT爆火后,CSIG內(nèi)部甚至沒有專門針對行業(yè)大模型的立項。各個團隊最大的變化是在日常溝通時增加了很多與大模型相關(guān)的深入探討,包括與現(xiàn)有產(chǎn)品的結(jié)合,以及未來商業(yè)路徑的選擇?!眳沁\聲稱。
第二塊,基于各類基礎(chǔ)設(shè)施及工具,騰訊全鏈路自研出了基礎(chǔ)大模型“混元”。所謂基礎(chǔ)模型,是在大量無標(biāo)簽數(shù)據(jù)集上訓(xùn)練的AI神經(jīng)網(wǎng)絡(luò),可處理從翻譯文本到分析醫(yī)學(xué)影像等各種工作。
第三塊,是以混元大模型為基礎(chǔ)模型所衍生的各類應(yīng)用及服務(wù)。典型如面向企業(yè)客戶的“騰訊云MaaS服務(wù)”,即是將混元大模型與騰訊云過去積累的行業(yè)解決方案、企業(yè)級應(yīng)用結(jié)合后的一類業(yè)務(wù)模式。而騰訊會議上的“AI小助手”則是混元大模型與騰訊企業(yè)級應(yīng)用的融合案例。
騰訊圍繞大模型所構(gòu)建的新的商業(yè)模式,也大抵延著以上三大模塊而展開。例如,騰訊在利用HCC高性能計算集群、星脈高性能計算網(wǎng)絡(luò)、向量數(shù)據(jù)庫等基礎(chǔ)設(shè)施訓(xùn)練混元大模型時,也同樣可將這些基礎(chǔ)設(shè)施提供給在軟、硬件設(shè)施上有短板,但同樣有大模型訓(xùn)練需求的客戶。
據(jù)騰訊集團副總裁、政企業(yè)務(wù)總裁李強透露,近期MiniMax、百川智能旗下的大模型都使用了騰訊的算力。MiniMax是由前商湯科技副總裁、通用智能技術(shù)負責(zé)人閆俊杰成立的大模型初創(chuàng)公司。
而在算力層面,騰訊云先是2023年4 月發(fā)布的新一代HCC高性能計算集群,即是專為大模型訓(xùn)練所設(shè)計,能夠提供高性能、高帶寬、低延遲的智算能力支撐。而后是在7 月,基于每日處理千億次檢索的向量引擎(OLAMA),推出向量數(shù)據(jù)庫(Tencent Cloud VectorDB),使數(shù)據(jù)接入AI的效率較傳統(tǒng)方案提升10倍?!爱?dāng)你想在大模型中找到一張帶‘貓的圖片,騰訊云向量數(shù)據(jù)庫能在100毫秒內(nèi),從10億張向量化的圖片中,返回查詢結(jié)果?!睖郎硎尽?/p>
此外,在工具層面,騰訊混元大模型在訓(xùn)練數(shù)據(jù)時采用的,同樣是自研的訓(xùn)練框架AngelPTM。這一框架使騰訊混元大模型的訓(xùn)練速度相比業(yè)界主流框架提升1倍,推理速度比業(yè)界主流框架提升1.3倍。
騰訊在大模型領(lǐng)域的布局,包括騰訊云積累的基礎(chǔ)設(shè)施、AI工具,以及基礎(chǔ)大模型“混元”和其衍生的應(yīng)用及服務(wù)。
一方面,AngelPTM源源不斷提供引擎動力;另一方面,騰訊云TI平臺的工具鏈也包括TI-ONE訓(xùn)練平臺、TI-Matrix應(yīng)用平臺等,可為客戶提供大模型訓(xùn)練、精調(diào)工具鏈,以快速生成更有針對性的專屬大模型,滿足企業(yè)個性化需求。
據(jù)湯道生介紹,作為基礎(chǔ)大模型的“混元”,如今擁有超千億參數(shù)規(guī)模,預(yù)訓(xùn)練語料超2萬億tokens(可被認為是詞語的片段),具有強大的中文理解與創(chuàng)作能力、邏輯推理能力,以及可靠的任務(wù)執(zhí)行能力。
而基于混元大模型所構(gòu)建的行業(yè)大模型精選商店“騰訊云MaaS服務(wù)”,即是將騰訊云在基礎(chǔ)設(shè)施、行業(yè)解決方案、企業(yè)級應(yīng)用等領(lǐng)域的積累升級打包所形成的一站式服務(wù)。
“在騰訊云行業(yè)大模型精選商店中,我們不僅提供混元大模型,還上架了20多種行業(yè)最新、最流行的開源通用大模型,以及覆蓋金融、文旅、零售、政務(wù)、醫(yī)療、教育等20多個領(lǐng)域的行業(yè)大模型。企業(yè)可以根據(jù)需要,選擇合適的模型,然后借助騰訊云智能的TI平臺,導(dǎo)入企業(yè)專有數(shù)據(jù),做進一步的訓(xùn)練與精調(diào),快速生成更有針對性的專屬大模型,滿足企業(yè)個性化需求。同時,我們也將大模型與騰訊的行業(yè)解決方案、企業(yè)級應(yīng)用結(jié)合,在生產(chǎn)、營銷、售后服務(wù)、辦公等多個環(huán)節(jié),實現(xiàn)能力提升,達至降本增效。”湯道生稱。
可以看到,基于混元大模型,以及騰訊過去在人工智能領(lǐng)域的積累,已經(jīng)針對B端客戶對大模型的各類需求設(shè)計出了一條極長的商業(yè)鏈路。
在拆解騰訊大模型商業(yè)路徑的同時,吳運聲反復(fù)強調(diào),推出“騰訊云MaaS服務(wù)”的初衷,是從多個角度解決B端客戶需求。除降本增效外,其需求還包括賦能傳統(tǒng)產(chǎn)業(yè)跨界融合、實現(xiàn)創(chuàng)新升級等。
吳運聲在騰訊集團內(nèi)部身兼多職,除了擔(dān)任騰訊云副總裁外,他還是騰訊云智能負責(zé)人以及優(yōu)圖實驗室負責(zé)人,其工作重心之一便是強化AI技術(shù)與騰訊云的底層融合。
例如由其負責(zé)的優(yōu)圖實驗室成立于2012年,如今已通過計算機視覺算法的迭代,實現(xiàn)對人臉識別、圖像識別、視頻特效等功能的持續(xù)優(yōu)化,其應(yīng)用落地場景從最初的QQ空間的“面孔墻”、微眾銀行的“人臉遠程開戶”,到如今,已深入教育、金融、工業(yè)等領(lǐng)域,構(gòu)建了超過50個行業(yè)應(yīng)用。而在2021年成立的騰訊云智能品牌,則將騰訊分散于優(yōu)圖等實驗室的AI能力進一步深度融合,目的是形成一條完整的AI產(chǎn)業(yè)落地鏈條。
據(jù)吳運聲透露,如今騰訊云團隊從對接企業(yè)大模型需求,至行業(yè)大模型方案的最終落地,通??煞譃樗膫€步驟。
第一步是了解客戶需求。例如,有客戶想做基于語音識別的大模型,那么,騰訊云便需要了解客戶擁有的語音文件的數(shù)量、規(guī)模,以及語音中的專業(yè)化術(shù)語等,這一環(huán)節(jié)考驗的是團隊對行業(yè)及企業(yè)的理解。
第二步是結(jié)合客戶需求、預(yù)算,以及所掌握的訓(xùn)練數(shù)據(jù)量等,推薦基底模型。“通常,我們會推薦3-5 個基底模型做實驗,最終選擇一個最為合適的。”吳運聲稱。
第三步是基于基底模型進行數(shù)據(jù)訓(xùn)練,其中涉及TI機器學(xué)習(xí)平臺、HCC高性能計算集群等基礎(chǔ)設(shè)施的應(yīng)用。
第四步,當(dāng)模型正式上線,騰訊云還會負責(zé)數(shù)據(jù)存儲、算力資源部署等運維工作,以及后期大模型的優(yōu)化及迭代。
如今,CSIG內(nèi)部涉及人工智能研究的產(chǎn)品團隊,幾乎將一半的重心放在了大模型方向。湯道生稱,目前CSIG已和1.1 萬家生態(tài)伙伴展開合作,推出覆蓋100多個產(chǎn)業(yè)場景的行業(yè)解決方案,服務(wù)了60多萬家制造企業(yè)。未來,在大模型加持下,騰訊云所創(chuàng)造的商業(yè)價值能否成為騰訊繼移動社交、網(wǎng)絡(luò)游戲之外的第三大增長極,值得關(guān)注。
盡管不少人期待騰訊能基于大模型,推出一款如微信般的重量級產(chǎn)品,但目前,騰訊卻是將大模型能力更多地應(yīng)用于騰訊云、騰訊廣告、騰訊游戲、騰訊金融科技、騰訊會議、騰訊文檔、微信搜一搜、QQ瀏覽器等多個騰訊內(nèi)部產(chǎn)品及To B業(yè)務(wù)之中。有騰訊內(nèi)部員工對新財富表示,未來大模型的能力將會無處不在,但人們?nèi)舴鞘钟眯模踔量赡芏几惺懿坏健?/p>
除騰訊會議外,大模型“潤物細無聲”的特性還出現(xiàn)在諸多騰訊內(nèi)部的產(chǎn)品之中。典型如已接入包括廣汽在內(nèi)的15家車企、超300萬臺汽車的騰訊云車載助手,過去曾存在上下文理解準(zhǔn)確率低、復(fù)雜場景下語義理解問題不理想等問題,如今,行業(yè)大模型的應(yīng)用,正提升其理解車主復(fù)雜意圖的能力及應(yīng)答能力,最終用戶感受到的,是更自然的人機對話、更合理的行程規(guī)劃,甚至是通用知識問答能力。
與此同時,行業(yè)大模型對于企業(yè)“降本增效”的作用也在逐步顯現(xiàn)。騰訊云分享了一個服務(wù)稅務(wù)部門的案例?過去,當(dāng)傳統(tǒng)智能客服遇到不在知識庫的問題時,常常無法答復(fù)或答非所問,最終依舊需要稅務(wù)部門鋪設(shè)人力去完成服務(wù)。此外,政策法規(guī)、辦事指南持續(xù)迭代,需不斷投入人力梳理。問題攔截率、覆蓋率低,急需擴展客服的問答邊界等問題,導(dǎo)致智能客服讓人感覺不智能。
而2023 年后,基于MaaS能力,騰訊云打造的專屬政務(wù)大模型,從知識采集到知識運營均實現(xiàn)了智能化升級,業(yè)務(wù)咨詢的解答率大幅提升。盡管這極大提升了稅務(wù)部門的服務(wù)效率,節(jié)約了人力成本,但不常跑稅務(wù)部門的人,并不容易察覺這一變化。
據(jù)透露,騰訊云MaaS能力已在騰訊企點客服、騰訊企點分析、數(shù)智人、車載助手、AI繪畫、文案創(chuàng)作等超50個產(chǎn)品中進行了模型可用性、易用性等方面驗證。
除了服務(wù)企業(yè),混元大模型亦落地于面向C端群體的騰訊廣告系統(tǒng)升級,提升了系統(tǒng)在廣告內(nèi)容理解、行業(yè)特征挖掘、文案創(chuàng)意生成等方面的能力,在為騰訊廣告帶來大幅GMV提升的同時,也初步驗證了大模型在C端場景的商業(yè)化潛力。2023 年上半年,騰訊的網(wǎng)絡(luò)廣告業(yè)務(wù)同比增長25.5%,較2022年同期增收93億元。
數(shù)據(jù)來源:執(zhí)中數(shù)據(jù),新財富整理
對于大模型這樣一個被馬化騰視為幾百年不遇的、類似發(fā)明電的工業(yè)革命一樣的機遇,騰訊在投資層面也在加緊布局。
執(zhí)中數(shù)據(jù)顯示,2023年以來,騰訊分別在4月、6月投資了深言科技、MiniMax兩家大模型創(chuàng)業(yè)企業(yè)。
深言科技創(chuàng)始人兼CEO豈凡超,是清華大學(xué)計算機科學(xué)與技術(shù)系2017級博士畢業(yè)生,主要研究方向為自然語言處理(NLP),曾在EMNLP等頂會發(fā)表論文30 多篇。據(jù)公開資料,深言科技團隊孵化自清華大學(xué)自然語言處理實驗室和北京智源人工智能研究院,由歐洲科學(xué)院院士、清華大學(xué)計算機系教授孫茂松領(lǐng)銜,并出任首席科學(xué)家。
在2023 年舉行的第三屆“清華大學(xué)國強研究院杯”雙創(chuàng)大賽的路演環(huán)節(jié)中,豈凡超稱,深言科技的大規(guī)模預(yù)訓(xùn)練模型在續(xù)寫、改寫、擴寫、摘要4類文本生成任務(wù)和6個數(shù)據(jù)集上,均超過現(xiàn)有其他中文模型,達到了當(dāng)前最好的中文文本生成效果。這次大賽,深言科技的“基于超大模型的新一代語言理解與生成平臺”項目斬獲技術(shù)創(chuàng)新賽初創(chuàng)組一等獎。
在獲得騰訊投資后,深言科技估值為1億美元。據(jù)執(zhí)中數(shù)據(jù),與騰訊共同投資的機構(gòu)還包括紅杉中國、好未來、英諾天使基金等,其他輪次的知名投資方包括水木清華校友基金、奇績創(chuàng)壇等。
相較深言科技,MiniMax的來頭更大。在騰訊投資之前,MiniMax已完成兩輪融資,投資方包括米哈游、IDG資本、高瓴創(chuàng)投、云啟資本、明勢資本等。而在騰訊投資之后,MiniMax的估值已高達12億美元。
根據(jù)公開資料,MiniMax直接從底層的基礎(chǔ)模型做起,自研了三個基礎(chǔ)模型,其法定代表人、技術(shù)合伙人楊斌曾在今年初表示,MiniMax可能是國內(nèi)第一家同時擁有三個模態(tài)大模型能力的創(chuàng)業(yè)公司。值得一提的是,在大模型對戰(zhàn)平臺SuperCLUE發(fā)布的中文大語言模型排行榜上,MiniMax的模型在國內(nèi)企業(yè)中排在第7名。
除投資大模型初創(chuàng)企業(yè)之外,近年間騰訊對B端生態(tài)的加速布局,或為其在大模型領(lǐng)域的突破積累了更多的籌碼。根據(jù)執(zhí)中數(shù)據(jù),自2018年騰訊入局產(chǎn)業(yè)互聯(lián)網(wǎng)以來,其在企業(yè)服務(wù)領(lǐng)域的投資事件已達到178起,僅次于文化娛樂領(lǐng)域的221起,且對人工智能的投資也達到38起(圖2)。
可以想見,在騰訊云MaaS服務(wù)的加持下,騰訊的To B戰(zhàn)事才剛剛開始。