克林
百舸爭(zhēng)流,奮楫者先
截至2023年5月底,國(guó)內(nèi)10億級(jí)參數(shù)規(guī)模以上基礎(chǔ)大模型至少已經(jīng)公布了79個(gè),此時(shí)距離ChatGPT在國(guó)內(nèi)“破圈”尚不足3個(gè)月。
時(shí)間來(lái)到8月,這股勢(shì)頭依然不減。15日,科大訊飛發(fā)布星火認(rèn)知大模型V2.0版本,在代碼及多模態(tài)能力方面進(jìn)行了重大升級(jí);在14日的年度演講上,小米董事長(zhǎng)雷軍宣布小愛(ài)同學(xué)已升級(jí)大模型,并開始邀請(qǐng)測(cè)試;3日,“神秘”的騰訊混元大模型也浮出水面,目前已進(jìn)入公司內(nèi)應(yīng)用測(cè)試階段……
“百模大戰(zhàn)”一觸即發(fā),國(guó)內(nèi)通用類、垂直類大模型呈現(xiàn)井噴之勢(shì)發(fā)展。IDC預(yù)測(cè),2026年中國(guó)AI大模型市場(chǎng)規(guī)模將達(dá)到211億美元,人工智能將進(jìn)入大規(guī)模落地應(yīng)用關(guān)鍵期。
放眼全球,據(jù)統(tǒng)計(jì)今年上半年全球新發(fā)布的大模型已超過(guò)400個(gè)。麥肯錫的報(bào)告《生成式人工智能的經(jīng)濟(jì)潛力》中提到,在其研究的63種應(yīng)用中使用生成式AI,將為全球經(jīng)濟(jì)帶來(lái)每年2.6萬(wàn)億~4.4萬(wàn)億美元的增長(zhǎng)。
同時(shí),由于通用大模型成本與技術(shù)門檻相對(duì)較高,國(guó)內(nèi)較多大模型選擇圍繞垂直行業(yè)進(jìn)行開發(fā),模型參數(shù)量雖然不大,但是因?yàn)橛幸恍┬袠I(yè)的核心數(shù)據(jù)和業(yè)務(wù)系統(tǒng)的生產(chǎn)數(shù)據(jù)參與,所以在相應(yīng)行業(yè)解決問(wèn)題更為高效、直接,特別是在金融、教育、醫(yī)療等領(lǐng)域,已經(jīng)有不少公司發(fā)布了相應(yīng)產(chǎn)品。整體生態(tài)呈現(xiàn)出“通用+垂直”模型互相融通的態(tài)勢(shì)。
千帆競(jìng)發(fā),勇進(jìn)者勝
今年6月,ChatGPT訪問(wèn)量環(huán)比下滑9.7%,為其推出以來(lái)首次下滑。從全球范圍看,盡管不斷有企業(yè)或機(jī)構(gòu)發(fā)布或更新大模型,但媒體和公眾似乎不再像幾個(gè)月前那般“上頭”。
當(dāng)大模型回歸理性,市場(chǎng)必然要經(jīng)歷一場(chǎng)大浪淘沙。關(guān)乎技術(shù),更關(guān)乎商業(yè)模式。
目前幾乎所有的大模型預(yù)訓(xùn)練都基于Transformer架構(gòu),雖是“百模大戰(zhàn)”,但各家大模型之間同質(zhì)化嚴(yán)重,實(shí)質(zhì)性的創(chuàng)新相對(duì)較少。同時(shí),訓(xùn)練大模型所耗費(fèi)的計(jì)算資源非常龐大,需要超級(jí)算力的支撐,很多公司沒(méi)有過(guò)往的研究履歷,發(fā)布的產(chǎn)品多是“套殼”或者接入其他研發(fā)機(jī)構(gòu)的模型,投機(jī)現(xiàn)象泛濫。
當(dāng)下的大模型競(jìng)爭(zhēng)早已超過(guò)了技術(shù)的范疇,更多是一種生態(tài)層面的比拼,具體表現(xiàn)在有多少應(yīng)用、有多少插件、有多少開發(fā)者以及用戶等。如果沒(méi)有良好的可循環(huán)生態(tài),那么無(wú)論在模型的持續(xù)迭代,抑或是變現(xiàn)攤薄巨額研發(fā)成本方面,可以預(yù)見(jiàn)都會(huì)面臨重大困境,對(duì)于創(chuàng)業(yè)型公司來(lái)說(shuō)更是如此。
考驗(yàn)的核心就在于大模型的落地能力。
今年獲得世界人工智能大會(huì)最高獎(jiǎng)項(xiàng)SAIL獎(jiǎng)(卓越人工智能引領(lǐng)者獎(jiǎng))的論文《機(jī)器學(xué)習(xí)結(jié)合阻抗譜技術(shù)預(yù)測(cè)鋰電池老化》,該文作者、中山大學(xué)物理學(xué)院副教授張?jiān)莆嫡f(shuō),她只采集了2萬(wàn)個(gè)電化學(xué)阻抗譜,就實(shí)現(xiàn)了AI精準(zhǔn)建模。比起海量數(shù)據(jù),更重要的是思路。就是這樣一個(gè)小模型,將過(guò)去需要花費(fèi)幾天才能實(shí)現(xiàn)的電池壽命預(yù)測(cè)縮短到了15分鐘,且檢測(cè)精度是原來(lái)的10倍。
越是面對(duì)如大模型落地這種復(fù)雜的問(wèn)題,就越是要回歸更本質(zhì)的層面去思考,考驗(yàn)的不僅是技術(shù)力,更重要的還是要落實(shí)在“服務(wù)”二字上,更高效、更便捷、更人性化將會(huì)是未來(lái)可持續(xù)探索的重要方向。
結(jié)語(yǔ)
1.受關(guān)注度或注意力這一綜合性指所反映的也是最綜合性的或整體性的。
2.真正的答案往往要向內(nèi)去尋找,這是更為根本的解決之道。
3.發(fā)展迅猛,未來(lái)的中國(guó)大模型100強(qiáng)即將出現(xiàn),敬請(qǐng)期待。