亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        DeepSeek對(duì)生成式人工智能應(yīng)用的影響與啟示

        2025-03-24 00:00:00丁煒
        銀行家 2025年3期
        關(guān)鍵詞:算力開(kāi)源人工智能

        2 0 2 5年1月2 0日,深度求索(以下簡(jiǎn)稱(chēng)“DeepSeek”)正式發(fā)布了DeepSeek-R1模型,同步發(fā)布R1模型研究論文并開(kāi)源模型權(quán)重。在生成式人工智能市場(chǎng)沉寂近半年后,DeepSeek-R1再次引發(fā)了新一輪人工智能熱潮。全球互聯(lián)網(wǎng)DeepSeek應(yīng)用搜索下載量暴增。在資本市場(chǎng)上,美股科技股快速下行,全球市值最大上市公司、人工智能明星企業(yè)英偉達(dá)股價(jià)一日暴跌近17%,市值蒸發(fā)近6000億美元。

        DeepSeek本身也是大語(yǔ)言模型(LLM)的一種,分析其對(duì)金融行業(yè)的影響實(shí)際上與GPT等先前模型別無(wú)二致。然而DeepSeek“低成本高效率”以及在一眾能力相等模型中率先開(kāi)源的特質(zhì),對(duì)人工智能的資本支出以及在其他行業(yè)的更廣泛應(yīng)用都產(chǎn)生了深遠(yuǎn)影響,從這個(gè)維度單獨(dú)研究DeepSeek的啟示與影響是十分必要的。

        DeepSeek模型引發(fā)全球新一輪人工智能熱潮

        Deepseek在發(fā)布R1模型前的一個(gè)月,即2024年12月26日,開(kāi)源了新一代預(yù)訓(xùn)練混合專(zhuān)家(MoE)大模型DeepSeek-V3,彼時(shí)引起的討論主要集中在人工智能領(lǐng)域和開(kāi)源社區(qū)。引入鏈?zhǔn)酵评恚–hainof-Thought,CoT),著重于強(qiáng)化推理與邏輯能力的DeepSeek-R1展現(xiàn)了對(duì)問(wèn)題的精準(zhǔn)理解與強(qiáng)大的思考能力,熱度迅速在全球C端市場(chǎng)引爆。2025年1月27日,面向C端的DeepSeek移動(dòng)應(yīng)用在IOS美區(qū)下載榜上超越ChatGPT,登頂中國(guó)和美國(guó)的App Store免費(fèi)應(yīng)用榜。SimilarWeb的數(shù)據(jù)顯示,1月DeepSeek網(wǎng)站訪(fǎng)問(wèn)量環(huán)比增長(zhǎng)22倍,月訪(fǎng)問(wèn)量達(dá)2.78億次。DeepSeek在Google上的搜索量現(xiàn)已達(dá)到ChatGPT在美國(guó)搜索量的39%,以及ChatGPT全球相對(duì)搜索量的21%。根據(jù)QusetMobile發(fā)布的最新數(shù)據(jù),在DeepSeek-R1發(fā)布的一周后,其活躍用戶(hù)數(shù)據(jù)首次超越中國(guó)活躍用戶(hù)最多的大模型——豆包。2月1日,DeepSeek中國(guó)活躍用戶(hù)突破3000萬(wàn)。

        DeepSeek-R1大火的一個(gè)重要原因就是增強(qiáng)推理能力后的能力躍遷,“思考過(guò)程比答案還要精準(zhǔn)”“水平可以與專(zhuān)業(yè)人士媲美”是用戶(hù)對(duì)DeepSeek的普遍看法。在DeepSeek官方發(fā)布的技術(shù)報(bào)告中,DeepSeek-R1對(duì)標(biāo)的是OpenAI在2024年12月17日發(fā)布的最新推理模型o1,其在多個(gè)測(cè)試集上的數(shù)據(jù)達(dá)到甚至超越了o1模型。比起測(cè)試集數(shù)據(jù),由用戶(hù)進(jìn)行對(duì)比測(cè)試形成的機(jī)器人競(jìng)技場(chǎng)排行榜(Chatbot Arena LLM Leaderboard)更客觀(guān)公正,DeepSeek的得分也超過(guò)了o1。在2月9日最新的機(jī)器人競(jìng)技場(chǎng)排名中,DeepSeek-R1得分位于全球大模型第二名,超過(guò)o1,低于谷歌發(fā)布的Gemini(見(jiàn)表1)。值得一提的是,DeepSeek-R1是榜單前十中唯一的開(kāi)源模型,同時(shí)DeepSeek-R1面向所有C端用戶(hù)免費(fèi)提供,相比之下,如果想使用o1模型,需要開(kāi)通ChatGPT Plus會(huì)員使用,價(jià)格為20美元/月。

        與一年前“百模大戰(zhàn)”中,各家模型廠(chǎng)商均標(biāo)榜其模型的能力達(dá)到甚至超越ChatGPT不同,DeepSeek-R1經(jīng)受住了C端和B端以及專(zhuān)業(yè)用戶(hù)的多重考驗(yàn)。R1發(fā)布當(dāng)天,多家全球科技公司均開(kāi)展了模型測(cè)試和復(fù)現(xiàn)工作。據(jù)外媒報(bào)道,Meta內(nèi)部組織了多個(gè)團(tuán)隊(duì)復(fù)現(xiàn)R1,并對(duì)其開(kāi)發(fā)的LLaMA模型進(jìn)行升級(jí)。Meta CEO扎克伯格在電話(huà)會(huì)上表示,DeepSeek做了一些“新奇的事情”,公司“仍在消化DeepSeek的一些成果”,團(tuán)隊(duì)希望能夠?qū)⑵渲幸恍┻M(jìn)步應(yīng)用到自己的AI項(xiàng)目中。

        全球人工智能科技公司也在第一時(shí)間上線(xiàn)部署了DeepSeek-V3、R1模型。全球最大的AI搜索引擎Perplexity第一時(shí)間上線(xiàn)了R1模型,采用本地化部署的方案。其創(chuàng)始人在接受媒體采訪(fǎng)時(shí)表示R1模型可以讓Perplexity以同樣的成本完成更多工作。云服務(wù)方面,令人意外的是,國(guó)際市場(chǎng)的反應(yīng)更快,微軟云在1月29日宣布將DeepSeek-R1上線(xiàn)Azure模型庫(kù),并準(zhǔn)備將DeepSeek-R1引入Windows系統(tǒng)的Copilot。亞馬遜、谷歌云服務(wù)在兩天后也上線(xiàn)了DeepSeek-R1模型。2月,阿里云、騰訊云以及三大運(yùn)營(yíng)商陸續(xù)接入DeepSeek系列模型。作為最直接的競(jìng)爭(zhēng)對(duì)手,OpenAI選擇提前放出了在2024年12月發(fā)布會(huì)中預(yù)發(fā)布的o3系列模型,包含快速進(jìn)行進(jìn)階推理的o3-mini和更加擅長(zhǎng)編程的o3-mini-high,大幅提前于此前公布的路線(xiàn)圖,同時(shí)o3系列兩款模型還同時(shí)向付費(fèi)用戶(hù)開(kāi)放網(wǎng)頁(yè)版使用權(quán)限。

        資本市場(chǎng)的反應(yīng)更加激烈。當(dāng)?shù)貢r(shí)間2025年1月27日,美股科技股開(kāi)盤(pán)后出現(xiàn)大幅下跌,被稱(chēng)為AI時(shí)代的“基礎(chǔ)設(shè)施”的GPU制造商英偉達(dá)(NVIDIA)當(dāng)日股價(jià)暴跌約17%,創(chuàng)下美股單日市值蒸發(fā)記錄。博通公司股價(jià)下跌17%,超威半導(dǎo)體公司(AMD)股價(jià)下跌6%,微軟股價(jià)下跌2%。GPU產(chǎn)業(yè)鏈上,臺(tái)積電下跌11.7%、ASML下跌5.7%。DeepSeek使用更少的成本、更短的時(shí)間達(dá)到了花費(fèi)是其十倍的大模型的輸出效果,引爆了資本市場(chǎng)一直以來(lái)對(duì)人工智能相關(guān)資本開(kāi)支以及資本回報(bào)率的質(zhì)疑。

        DeepSeek系列模型創(chuàng)新實(shí)現(xiàn)“降本增效”

        在大語(yǔ)言模型領(lǐng)域,“規(guī)?;▌t(Scaling Law)”是金科玉律般的存在?!耙?guī)模化法則”是指隨著模型參數(shù)數(shù)量的增加,語(yǔ)言模型的性能通常會(huì)以?xún)缏煞绞礁纳?。如果將模型?guī)模擴(kuò)大若干倍,其性能提升雖然呈現(xiàn)遞減邊際效應(yīng),但依然可以預(yù)測(cè)性地獲得更低的困惑度和更好的生成質(zhì)量。在GPT-4以前歷代的GPT更新中,參數(shù)數(shù)量的不斷擴(kuò)展也被認(rèn)為是模型性能提升的重要手段,GPT-3擁有1750億參數(shù),據(jù)傳GPT-4的參數(shù)量達(dá)到了1.8萬(wàn)億。

        巨大的參數(shù)對(duì)算力提出了更高需求,大型科技公司紛紛投入數(shù)十億美元的資本支出用以支持模型訓(xùn)練和推理,支持大語(yǔ)言模型訓(xùn)練的GPU也因此成為全球最緊缺的“戰(zhàn)略資源”。大型科技公司將自身?yè)碛械腉PU數(shù)量作為人工智能競(jìng)爭(zhēng)的重要指標(biāo),馬斯克成立的x.AI還在美國(guó)構(gòu)建了全球最大的由10萬(wàn)個(gè)NVIDIA Hopper GPU組成的Colossus超級(jí)計(jì)算機(jī)集群。根據(jù)斯坦福大學(xué)李飛飛團(tuán)隊(duì)發(fā)布的《2024年人工智能指數(shù)報(bào)告》,GPT-4的訓(xùn)練成本超過(guò)7800萬(wàn)美元。而DeepSeek官方公布的數(shù)據(jù)中,DeepSeek-V3的訓(xùn)練成本僅為557萬(wàn)美元,是GPT-4的7.1%。

        在DeepSeek-V3的技術(shù)文檔中,DeepSeek這樣描述計(jì)算成本:“最后,我們?cè)俅螐?qiáng)調(diào) DeepSeek-V3的訓(xùn)練成本。通過(guò)對(duì)算法、架構(gòu)和硬件的優(yōu)化協(xié)同設(shè)計(jì)實(shí)現(xiàn)了更加經(jīng)濟(jì)的效果。在預(yù)訓(xùn)練階段,訓(xùn)練DeepSeek-V3每萬(wàn)億token只需要18萬(wàn)個(gè)H800 GPU小時(shí),即在我們2048個(gè)H800 GPU集群上訓(xùn)練3.7天。因此,我們的預(yù)訓(xùn)練階段在不到兩個(gè)月的時(shí)間里就完成了,花費(fèi)了266萬(wàn)個(gè)GPU小時(shí)。此外還有11萬(wàn)GPU小時(shí)用于上下文長(zhǎng)度擴(kuò)展和5千GPU小時(shí)用于后訓(xùn)練,DeepSeek-V3的完整訓(xùn)練成本僅為278萬(wàn)GPU小時(shí)。假設(shè)H800 GPU的租賃價(jià)格為2美元每GPU小時(shí),我們?nèi)康挠?xùn)練成本為557萬(wàn)美元(不包含先前對(duì)算法、架構(gòu)、數(shù)據(jù)進(jìn)行實(shí)驗(yàn)的費(fèi)用)?!?/p>

        DeepSeek是如何做到的呢?一是對(duì)數(shù)據(jù)處理方式的改進(jìn)。DeepSeek-V3集成了多頭潛在注意力(Multi-Head Latent Attention,MLA),在推理過(guò)程中能夠高效處理海量數(shù)據(jù),并使用的顯存約為同類(lèi)技術(shù)的一半。MLA降低了每次查詢(xún)所需的KV緩存量,從而減少了所需硬件資源及相應(yīng)成本。二是DeepSeek-V3 采用了混合專(zhuān)家(Mixture-ofExperts,MoE)模型架構(gòu)。MoE架構(gòu)首次在OpenAI發(fā)布的GPT-4中應(yīng)用,此后成為下一代LLM訓(xùn)練的主要架構(gòu)。在MoE模型中,系統(tǒng)被劃分為多個(gè)稱(chēng)為“專(zhuān)家”的模塊,在推理過(guò)程中,一個(gè)路由模型會(huì)選擇部分專(zhuān)家來(lái)預(yù)測(cè)下一個(gè)token。這避免了每次推理中進(jìn)行全模型計(jì)算。DeepSeek-V3的技術(shù)文檔中提到,在每次函數(shù)調(diào)用或向前傳播時(shí)會(huì)調(diào)用的參數(shù)量為370億(37B)。三是DeepSeek-V3首次實(shí)現(xiàn)了在低位精度(FP8)下進(jìn)行超大規(guī)模模型訓(xùn)練,并通過(guò)通信、負(fù)載均衡優(yōu)化確保了在大規(guī)模分布式訓(xùn)練中能夠最大化利用算力。四是在DeepSeek-R1的訓(xùn)練中,引入了一種稱(chēng)為群組相對(duì)策略?xún)?yōu)化(Group Relative Policy Optimization,GRPO)的強(qiáng)化學(xué)習(xí)環(huán)節(jié)(RL)優(yōu)化算法。在訓(xùn)練R1模型時(shí),通過(guò)GRPO實(shí)現(xiàn)了對(duì)生成結(jié)果的自動(dòng)化評(píng)估和強(qiáng)化學(xué)習(xí),相較于傳統(tǒng)強(qiáng)化學(xué)習(xí)中直接偏好優(yōu)化(DPO)依靠人工調(diào)整模型輸出方向,在很大程度上減少了對(duì)昂貴人工標(biāo)注數(shù)據(jù)的依賴(lài)。

        DeepSeek對(duì)算力市場(chǎng)和人工智能資本投入的影響

        DeepSeek引發(fā)的科技地震很大程度上也是資本市場(chǎng)對(duì)科技公司巨額資本支出質(zhì)疑的爆發(fā)。此前,亞馬遜、微軟、谷歌等云服務(wù)廠(chǎng)商紛紛表示2025年將持續(xù)增大人工智能(主要是GPU)采購(gòu)支出。而產(chǎn)業(yè)界對(duì)當(dāng)前生成式人工智能究竟能產(chǎn)生多大價(jià)值始終存在爭(zhēng)議。以高盛為代表的看多派認(rèn)為生成式人工智能將拉動(dòng)10%以上的GDP增長(zhǎng),而2024年諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者阿西莫格魯(Acemoglu)則認(rèn)為人工智能帶來(lái)的生產(chǎn)力增長(zhǎng)僅為0.5%。

        “高性?xún)r(jià)比”一直是DeepSeek進(jìn)行模型訓(xùn)練的重點(diǎn),早在2024年DeepSeek發(fā)布V2模型之際,就以GPT-4百分之一的價(jià)格引發(fā)了年中“AI價(jià)格戰(zhàn)”。

        經(jīng)濟(jì)學(xué)中的杰文斯悖論(Jevons paradox)指技術(shù)進(jìn)步提高了使用資源的效率,但因?yàn)槌杀鞠陆祵?dǎo)致需求增加,結(jié)果導(dǎo)致資源消耗的速度上升,而非減少。從實(shí)際效果上看也確實(shí)如此,在DeepSeek官網(wǎng)的API定價(jià)中DeepSeekR1的輸入定價(jià)為0.6美元/百萬(wàn)token,是o1-mini的20%,o1的4%;輸出價(jià)格為2.2美元/百萬(wàn)token,是o1-mini的18%,o1的3.6%(見(jiàn)圖1)。面向開(kāi)發(fā)者的超低價(jià)格以及對(duì)C端用戶(hù)免費(fèi)的策略在春節(jié)期間吸引了大量用戶(hù)使用其API和客戶(hù)端,DeepSeek官網(wǎng)應(yīng)用持續(xù)因線(xiàn)路繁忙無(wú)法使用,國(guó)內(nèi)DeepSeek的討論度也遠(yuǎn)超2023年初ChatGPT發(fā)布之時(shí)。從這個(gè)意義上說(shuō),DeepSeek開(kāi)啟了國(guó)內(nèi)普通用戶(hù)的人工智能“啟蒙”時(shí)代。

        DeepSeek重新分配了人工智能產(chǎn)業(yè)鏈中的價(jià)值,也為人工智能提供了一條可持續(xù)發(fā)展之路。在應(yīng)用端,企業(yè)需要在技術(shù)創(chuàng)新和商業(yè)可持續(xù)間找到一條平衡道路,不一定會(huì)選擇“最好的模型”,而是要選擇“更經(jīng)濟(jì)、合適”的模型。

        從長(zhǎng)遠(yuǎn)看,人們對(duì)生成式人工智能的期待在于早日實(shí)現(xiàn)通用人工智能(Artificial General Intelligence,AGI)。通過(guò)在實(shí)體產(chǎn)業(yè)中應(yīng)用生成式人工智能提高生產(chǎn)效率,乃至AI for Science(在諸如小分子藥物研發(fā)、合成材料等易出現(xiàn)生產(chǎn)力飛躍領(lǐng)域的人工智能應(yīng)用),是資本市場(chǎng)給出人工智能如此高估值的核心原因。材料學(xué)和生物學(xué)一直是人工智能應(yīng)用的前沿領(lǐng)域,在1月美國(guó)政府與OpenAI、軟銀、甲骨文共同發(fā)布的星際之門(mén)(Stargate)項(xiàng)目中明確提到要使用人工智能提供個(gè)性化醫(yī)療,用以研發(fā)mRNA疫苗及定制癌癥疫苗。

        隨著大語(yǔ)言模型能力的進(jìn)步,其應(yīng)用在實(shí)際生產(chǎn)中的場(chǎng)景已開(kāi)始逐漸增多,對(duì)生產(chǎn)關(guān)系的影響也開(kāi)始顯現(xiàn)。微軟表示由于LLM提高了軟件工程師的工作效率,微軟在2025年招聘中將不再新招軟件工程師。瑞銀正在使用人工智能通過(guò)即時(shí)信貸模式為中小企業(yè)提供貸款。匯豐和紐約梅隆銀行將生成式人工智能應(yīng)用于反欺詐領(lǐng)域。

        “規(guī)?;▌t”依舊是提高大模型性能的最有效方法。DeepSeek實(shí)現(xiàn)的是更高效率,而非挑戰(zhàn)“規(guī)?;▌t”。因此在未來(lái)一段時(shí)間內(nèi),市場(chǎng)對(duì)算力的需求將依舊保持強(qiáng)勁,科技公司的資本投入也將持續(xù)。在經(jīng)歷暴跌后,英偉達(dá)股價(jià)也開(kāi)始回調(diào),至當(dāng)?shù)貢r(shí)間2月10日收盤(pán),英偉達(dá)股價(jià)為133.5美元,較1月27日上漲12.8%。

        DeepSeek對(duì)人工智能開(kāi)源路線(xiàn)的影響

        開(kāi)源閉源一直是生成式人工智能發(fā)展?fàn)幷摰慕裹c(diǎn)問(wèn)題。科技廠(chǎng)商方面,開(kāi)源陣營(yíng)主要有Meta(LLaMA)、xAI(Grok)、阿里(千問(wèn))、DeepSeek;閉源陣營(yíng)則包括OpenAI(GPT)、Google(Gemini)、Anthropic(Claude)、字節(jié)跳動(dòng)(豆包)、智譜(GLM)等企業(yè)。OpenAI在成立之初,堅(jiān)持開(kāi)源路線(xiàn),但自發(fā)布ChatGPT以來(lái),OpenAI就開(kāi)始了閉源道路,被戲稱(chēng)為“Close AI”。在發(fā)布o(jì)3mini時(shí),OpenAI CEO Sam Altman在線(xiàn)上回復(fù)問(wèn)題時(shí)首次承認(rèn) OpenAI過(guò)去在開(kāi)源方面一直站在“歷史錯(cuò)誤的一邊”,并表示需要想出一個(gè)不同的開(kāi)源策略。

        DeepSeek在開(kāi)源模型中使用了最“大方”的MIT許可協(xié)議,允許用戶(hù)自由修改、定制、分發(fā)以及商業(yè)化使用DeepSeek源碼,并明確開(kāi)發(fā)者可以進(jìn)行模型蒸餾。在Github的R1項(xiàng)目頁(yè)面中,DeepSeek還放出了使用R1蒸餾的基于LLaMA、Qwen等開(kāi)源模型的小模型,我們?cè)趯?shí)測(cè)中發(fā)現(xiàn)相較于原模型,提供CoT的模型輸出能力明顯強(qiáng)于原模型。

        與其說(shuō)是技術(shù)路線(xiàn)之爭(zhēng),更不如說(shuō)開(kāi)源閉源是人工智能公司盈利的商業(yè)模式之爭(zhēng)。閉源模型通過(guò)對(duì)個(gè)人客戶(hù)實(shí)行會(huì)員制收費(fèi)、對(duì)開(kāi)發(fā)者或中小企業(yè)API進(jìn)行收費(fèi)以及與大型集團(tuán)合作開(kāi)發(fā)等模式盈利。開(kāi)源模型則對(duì)開(kāi)發(fā)者更加友好,通過(guò)免費(fèi)吸引更多開(kāi)發(fā)者和用戶(hù)參與到自主構(gòu)建的人工智能生態(tài)中,未來(lái)通過(guò)云服務(wù)等方式獲取利益。

        此前,開(kāi)源陣營(yíng)一度陷入沉寂。相較閉源的盈利模式,開(kāi)源模型在商業(yè)盈利方面周期更長(zhǎng)且更具有不確定性,尤其是初創(chuàng)公司都難以承受來(lái)自投資人的壓力。國(guó)內(nèi)最早開(kāi)展LLM研究的智譜AI在早年也堅(jiān)持開(kāi)源路線(xiàn),其在開(kāi)源社區(qū)發(fā)布的GLM-3模型一度是中文開(kāi)源LLM的明星項(xiàng)目。不過(guò)隨著2024年“AI價(jià)格戰(zhàn)”的打響,越來(lái)越多的開(kāi)源AI模型開(kāi)始退場(chǎng),能力也逐漸與閉源模型拉開(kāi)差距,一般認(rèn)為,閉源模型相較開(kāi)源模型有12個(gè)月左右的技術(shù)領(lǐng)先。DeepSeek的出現(xiàn)給開(kāi)源社區(qū)注入了一針“強(qiáng)心劑”,大大縮短了開(kāi)源和閉源模型間的差距。英偉達(dá)高級(jí)科學(xué)家Jim Fan這樣評(píng)價(jià):“我們生活在這樣一個(gè)時(shí)代:由非美國(guó)公司保持 OpenAI最初的使命——做真正開(kāi)放的前沿研究、為所有人賦能。這似乎講不通,但戲劇性的往往最有可能發(fā)生?!苯刂?月10日,DeepSeek V3和R1項(xiàng)目分別在Github上收獲了72k和80k的星標(biāo),R1模型在Hugging Face的下載量達(dá)294萬(wàn)。

        金融業(yè)應(yīng)用生成式人工智能的機(jī)遇與挑戰(zhàn)

        加快生成式人工智能應(yīng)用部署,推動(dòng)人力資本向智能化時(shí)代轉(zhuǎn)型升級(jí)。部分大型金融機(jī)構(gòu)已開(kāi)始應(yīng)用生成式人工智能應(yīng)用,主要集中在文本內(nèi)容摘要、輔助文字生成修改、企業(yè)知識(shí)庫(kù)等領(lǐng)域。然而,因?yàn)楸镜厮懔ο拗?、企業(yè)內(nèi)部培訓(xùn)不足、應(yīng)用場(chǎng)景集中在后臺(tái)管理部門(mén)等原因,金融行業(yè)生成式人工智能應(yīng)用使用比例仍處在較低水平,尤其是占金融從業(yè)人員比重最大的銀行、保險(xiǎn)業(yè)應(yīng)用嚴(yán)重不足。應(yīng)抓住DeepSeek的新系列模型降低模型推理成本的機(jī)遇,加快部署生成式人工智能應(yīng)用,增強(qiáng)對(duì)一線(xiàn)員工的人工智能提示詞、使用場(chǎng)景等方面的培訓(xùn),推動(dòng)金融企業(yè)人力資源轉(zhuǎn)型升級(jí),培養(yǎng)適應(yīng)于智能時(shí)代的金融人才。

        由內(nèi)部賦能擴(kuò)展至面客應(yīng)用,提升行業(yè)勞動(dòng)生產(chǎn)率。當(dāng)前,金融機(jī)構(gòu)主要應(yīng)用生成式人工智能的場(chǎng)景集中在內(nèi)部員工賦能,并無(wú)面客場(chǎng)景。面客是檢驗(yàn)生成式人工智能價(jià)值創(chuàng)造、提升行業(yè)勞動(dòng)生產(chǎn)率的“考場(chǎng)”。DeepSeek推理的價(jià)格已處于大規(guī)模面客應(yīng)用的成本可控范圍內(nèi),推理能力結(jié)合檢索增強(qiáng)生成(RAG)等技術(shù)也可有效防止大模型幻覺(jué)等問(wèn)題。因此可盡快推出面向B端客戶(hù)的人工智能基礎(chǔ)設(shè)施(AI as a Service)或面向C端客戶(hù)的智能客服、智能客戶(hù)關(guān)系管理、線(xiàn)上營(yíng)銷(xiāo)等服務(wù)。

        以金融信創(chuàng)工程為契機(jī),共同構(gòu)建國(guó)產(chǎn)算力生態(tài)圈。2025年1月13日,拜登政府發(fā)布《先進(jìn)人工智能技術(shù)負(fù)責(zé)任傳播的監(jiān)管框架》。進(jìn)一步限制了從美國(guó)到世界各地的尖端人工智能技術(shù)的出口。未來(lái),我國(guó)全行業(yè)應(yīng)用人工智能都將受到算力限制。多家國(guó)產(chǎn)算力已實(shí)現(xiàn)DeepSeek系列模型適配,目前國(guó)產(chǎn)算力部署的主要問(wèn)題在于沒(méi)有形成類(lèi)似于英偉達(dá)CUDA的完整生態(tài)。CUDA經(jīng)歷10余年的發(fā)展,在全球人工智能領(lǐng)域幾乎是所有開(kāi)發(fā)者都在使用的“底層基礎(chǔ)設(shè)施”,也是英偉達(dá)“最深的護(hù)城河”。金融企業(yè)作為人工智能應(yīng)用的前沿行業(yè),應(yīng)發(fā)揮構(gòu)建國(guó)產(chǎn)算力生態(tài)需求側(cè)“頭雁”作用,效仿CUDA建立之初的經(jīng)驗(yàn)。在CUDA推廣初期,英偉達(dá)廣泛派遣工程師前往科研機(jī)構(gòu)、企業(yè)幫助部署、共同解決CUDA部署中存在的問(wèn)題。建立國(guó)產(chǎn)算力的底層軟件,亦需要算力廠(chǎng)商、大模型廠(chǎng)商與應(yīng)用企業(yè)一道的合作構(gòu)建。

        建設(shè)金融行業(yè)算力基礎(chǔ)設(shè)施,保障金融數(shù)據(jù)安全,提升算力使用效率。相較大型金融機(jī)構(gòu),中小金融機(jī)構(gòu)科技研發(fā)支出較少,缺乏生成式人工智能應(yīng)用工具研發(fā)和本地化部署能力。不少中小金融機(jī)構(gòu)員工通過(guò)使用云計(jì)算廠(chǎng)商API或人工智能廠(chǎng)商應(yīng)用的方式獲取相關(guān)服務(wù),敏感金融數(shù)據(jù)上傳至云服務(wù)器,形成了金融數(shù)據(jù)安全隱患。另一方面,人工智能數(shù)據(jù)中心建設(shè)成本高昂,大型金融機(jī)構(gòu)本地部署、重復(fù)開(kāi)發(fā)的模式也導(dǎo)致算力和研發(fā)資源使用相對(duì)低效??尚Х隆皷|數(shù)西算”和“超算中心”模式,由金融機(jī)構(gòu)共同出資建立行業(yè)算力基礎(chǔ)設(shè)施,各機(jī)構(gòu)按需付費(fèi)使用,提升算力使用和研發(fā)效率。

        (作者單位:中國(guó)建設(shè)銀行辦公室)

        猜你喜歡
        算力開(kāi)源人工智能
        多方求解智能時(shí)代算力挑戰(zhàn)
        這個(gè)第二不一般
        都市人(2023年11期)2024-01-12 05:55:06
        衛(wèi)星通信在算力網(wǎng)絡(luò)中的應(yīng)用研究
        中國(guó)電信董事長(zhǎng)柯瑞文:算力成為數(shù)字經(jīng)濟(jì)的主要生產(chǎn)力
        五毛錢(qián)能買(mǎi)多少頭牛
        2019:人工智能
        商界(2019年12期)2019-01-03 06:59:05
        人工智能與就業(yè)
        數(shù)讀人工智能
        小康(2017年16期)2017-06-07 09:00:59
        下一幕,人工智能!
        大家說(shuō):開(kāi)源、人工智能及創(chuàng)新
        国产精品无套一区二区久久| 国产精品 人妻互换| 热久久国产欧美一区二区精品 | 国产99久久久国产精品免费看| 欧美黑人又粗又硬xxxxx喷水| 久久九九久精品国产| 亚洲岛国一区二区三区| av中文字幕一区人妻| 久久久熟女一区二区三区| 一区二区三区国产高清视频| 欧美做受又硬又粗又大视频| 亚洲欧美日韩成人高清在线一区| 中文人妻无码一区二区三区在线| 国产一区视频在线免费观看| 男女好痛好深好爽视频一区| 99久久国语露脸国产精品| 白色白在线观看免费2| 白白发在线视频免费观看2| 观看在线人视频| 欧美性巨大╳╳╳╳╳高跟鞋| 精品久久久久一区二区国产| 精品蜜桃一区二区三区| 精品国产一区二区三区18p| 在线观看 国产一区二区三区| 免费a级毛片无码免费视频120软件 | 国产啪啪视频在线观看| 痴汉电车中文字幕在线| 午夜福利一区二区三区在线观看| 色狠狠色狠狠综合一区| 加勒比东京热综合久久| 秀人网嫩模李梓熙大尺度| 精品国产一区二区三区av免费| 久久国产国内精品对话对白| 看av免费毛片手机播放| 国产精品久久久福利| 亚洲乱码中文字幕第一页| 亚洲人成人99网站| 久久精品国产自清天天线| 亚洲av日韩综合一区二区三区| 在线日本国产成人免费精品| 女女同性av一区二区三区免费看|