羅茂林
2023年以來,人工智能無疑是貫穿資本市場的一條主線,從“百模大戰(zhàn)”千帆競逐,到上游算力芯片“一日一價”。大模型正在催生一場巨大的變革,其影響最終將波及千行百業(yè)。
站在2024年的起點上,人工智能大模型又將有哪些新的趨勢?近日,星環(huán)科技創(chuàng)始人、董事長孫元浩在接受上海證券報記者專訪時表示,第一輪熱潮過后,商業(yè)化正在加速落地,許多垂直細分賽道或在2024年為大眾帶來眼前一亮的變革。
熱浪之下的變革與挑戰(zhàn)
“大模型時代的來臨,將在多方面帶來巨大變革。”孫元浩開門見山地告訴記者,這將是一場知識獲取方式的變革。
他以學(xué)習(xí)為例說道:“人們對于知識獲取從閱讀書籍論文,到依靠搜索引擎,現(xiàn)在已經(jīng)發(fā)展為大模型,隨著通用大模型和領(lǐng)域大模型的增加,除了把公有知識壓縮導(dǎo)入大模型之外,還可以導(dǎo)入更多的行業(yè)知識庫?!?/p>
具體到星環(huán)科技的產(chǎn)品,孫元浩介紹稱,向量數(shù)據(jù)庫Hippo可以幫助企業(yè)建設(shè)自己的內(nèi)部知識庫,企業(yè)將自身的各種形式數(shù)據(jù)向量化存儲到向量數(shù)據(jù)庫Hippo中,可以提高大模型提問的精準度,建設(shè)企業(yè)自己的大模型助手。
除此之外,孫元浩認為,大模型的誕生在數(shù)據(jù)分析、交互方式、智力勞動等方面已經(jīng)產(chǎn)生深遠影響?!耙越换碚f,越來越多的場景可以建設(shè)數(shù)字人以及AI Agent(人工智能體),直接通過自然語言調(diào)用后臺服務(wù)或者操作機器人,現(xiàn)有的應(yīng)用都可以通過新的交互方式做改造。”
孫元浩預(yù)計,在第一輪大模型的熱潮之后,今年商業(yè)化的落地會開始細分加速?!邦I(lǐng)域知識庫、企業(yè)專屬的大模型將成為相對商業(yè)化步伐最快的?!睂O元浩說。
伴隨變革的步伐,從產(chǎn)業(yè)鏈傳導(dǎo)來看,一系列新的挑戰(zhàn)將擺在行業(yè)面前。從產(chǎn)業(yè)鏈而言,AI大模型包括底層的算力提供、大數(shù)據(jù)分析工具(包括向量數(shù)據(jù)庫)、基礎(chǔ)大模型、由大語言模型驅(qū)動的應(yīng)用開發(fā)工具、垂類模型和應(yīng)用/效率工具等環(huán)節(jié)。
“對于國產(chǎn)GPU公司或者擁有儲備充沛算力的公司來說,涉足算力提供及基礎(chǔ)大模型的訓(xùn)練和研發(fā)將具備較明顯的優(yōu)勢。”孫元浩表示,星環(huán)科技作為國內(nèi)領(lǐng)先的企業(yè)級大數(shù)據(jù)基礎(chǔ)軟件開發(fā)商,站在工具鏈的角度提供大模型時代的軟件開發(fā)工具鏈,公司提供包括大數(shù)據(jù)分析工具和大模型應(yīng)用開發(fā)工具,旨在讓每家企業(yè)都能打造自己的專屬大模型。
在孫元浩看來,數(shù)據(jù)是模型生產(chǎn)過程中最大的桎梏之一。據(jù)了解,圍繞大數(shù)據(jù)基礎(chǔ)建設(shè),星環(huán)科技已經(jīng)完成多項重要工程。比如,公司在2023年推出了大模型統(tǒng)一運營管理平臺Sophon LLMOps,旨在為用戶打通從數(shù)據(jù)接入、生成、開發(fā)和清洗、提示工程、大模型訓(xùn)練、大模型上架部署到大模型應(yīng)用編排和業(yè)務(wù)效果對齊的全鏈路流程。
卡位工具鏈供應(yīng)商
隨著大模型行業(yè)的迅猛發(fā)展,一條完整的產(chǎn)業(yè)鏈正在逐步形成,從專精底層模型架構(gòu)到終端鏈接千行百業(yè),各個廠商都在努力尋找自己在供應(yīng)鏈上的位置。
“星環(huán)科技的大數(shù)據(jù)基礎(chǔ)平臺TDH支持11種模型的統(tǒng)一存儲管理,能夠為大模型落地的訓(xùn)練開發(fā)、應(yīng)用推廣、運營提升等多個環(huán)節(jié)的不同多模態(tài)存、算、檢索、生成需求,提供統(tǒng)一的數(shù)據(jù)接口?!睂O元浩告訴記者,與此同時,星環(huán)科技自身也推出了兩款深耕細分領(lǐng)域的垂類模型,分別為金融大模型“無涯”及大數(shù)據(jù)分析大模型“求索”。
談及未來規(guī)劃,孫元浩表示,星環(huán)科技將進一步提升在大數(shù)據(jù)和人工智能領(lǐng)域內(nèi)的技術(shù)實力,鞏固公司的技術(shù)壁壘。“目前我們已經(jīng)有三個計劃中的項目,分別是數(shù)據(jù)分析大模型建設(shè)項目、智能量化投研一體化平臺建設(shè)項目和AI知識助理建設(shè)項目?!睂O元浩說。
在采訪中,孫元浩多次提及“生態(tài)建設(shè)”。他表示,星環(huán)科技日前已經(jīng)加入中國大模型語料數(shù)據(jù)聯(lián)盟,聯(lián)盟主要為了應(yīng)對大模型發(fā)展對高質(zhì)量、大規(guī)模、安全可信語料數(shù)據(jù)資源的需求,旨在通過鏈接模型訓(xùn)練、數(shù)據(jù)供給、學(xué)術(shù)研究、第三方服務(wù)等多方面機構(gòu),聯(lián)合打造多知識、多模態(tài)、標準化的高質(zhì)量語料數(shù)據(jù),探索形成基于貢獻、可持續(xù)運行的激勵機制,打造國際化、開放型的大模型語料數(shù)據(jù)生態(tài)圈。
“生態(tài)對于整個大模型產(chǎn)業(yè)發(fā)展有著重要的意義。”孫元浩以公司金融大模型“星環(huán)無涯Infinity”為例介紹稱,該模型基于公開研報、公告、政策、新聞、監(jiān)管法規(guī)、公開司法判例等數(shù)據(jù),融合了輿情、工商、產(chǎn)業(yè)鏈、熱門主題、衛(wèi)星等多模態(tài)信息,將之轉(zhuǎn)化為高質(zhì)量金融語料,輸出對于事件或標的的總結(jié)分析及演繹推理,“這個產(chǎn)品匯集的各類信息和語料,就是基于生態(tài)伙伴們的共建?!保▉碓矗荷虾WC券報)