亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        智譜AI進(jìn)化

        2024-02-21 02:15:54何己派
        21世紀(jì)商業(yè)評(píng)論 2024年2期
        關(guān)鍵詞:人工智能模型

        何己派

        從張鵬辦公室的窗戶向外望,一眼就能看到對(duì)面的東升大廈,那是智譜AI初創(chuàng)團(tuán)隊(duì)從清華實(shí)驗(yàn)室出來后,最早的辦公地。

        智譜AI成立于2019年,規(guī)模快速擴(kuò)大。公司每年都要搬一次家,人員從當(dāng)初的30人左右,增加到現(xiàn)在的400余人。

        滾雪球般增長的,還有它的名氣,以及超高的融資額。

        智譜AI宣布,2023年累計(jì)獲得超25億元融資。其身后的投資機(jī)構(gòu),包括去年5月成立的社?;鹬嘘P(guān)村自主創(chuàng)新專項(xiàng)基金,極少下注同一家公司的美團(tuán)、螞蟻、騰訊、阿里等機(jī)構(gòu),也在其中。

        智譜AI集結(jié)了一幫技術(shù)大牛。核心團(tuán)隊(duì)里,CEO張鵬畢業(yè)于清華大學(xué)計(jì)算機(jī)系,董事長劉德兵是中國工程院高文院士弟子,總裁王紹蘭為清華創(chuàng)新領(lǐng)軍博士。

        這支學(xué)院派出身的團(tuán)隊(duì),瞄準(zhǔn)的賽道,是AI大模型。

        去年10月底,智譜推出全自研的第三代基座大模型ChatGLM3系列產(chǎn)品,多模態(tài)能力逼近GPT-4。由此,它成為國內(nèi)唯一對(duì)標(biāo)OpenAI全產(chǎn)品線的大模型創(chuàng)業(yè)公司。

        6月,在硅谷科技媒體The Information的盤點(diǎn)中,智譜AI被視為最有可能成為“中國的OpenAI”的5家企業(yè)之一,外界也常以此來形容智譜。

        但張鵬不愿意大家僅基于商業(yè)邏輯將二者對(duì)比,也不想被這個(gè)標(biāo)簽套住。至于技術(shù)上的追趕,團(tuán)隊(duì)所有人心里,一直有張動(dòng)態(tài)更新的時(shí)間表。

        “我們的目標(biāo),是盡快追平現(xiàn)有GPT-4的能力?!睆堸i向《21CBR》記者表示。

        智譜AI是從清華走出來的創(chuàng)業(yè)公司。

        上世紀(jì)90年代,清華計(jì)算機(jī)系成立了知識(shí)工程研究室,致力于知識(shí)工程理論、方法和應(yīng)用研究,屬于人工智能領(lǐng)域的一個(gè)分支。

        人工智能本身是門實(shí)踐性科學(xué),講究理論和工程落地結(jié)合,本世紀(jì)初,我們就開始把數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)等相關(guān)研究,落地為產(chǎn)品,推出AMiner系統(tǒng),做科研情報(bào)挖掘。

        之后,實(shí)驗(yàn)室做了一些落地嘗試,直到2019年,智譜AI成立,團(tuán)隊(duì)走出實(shí)驗(yàn)室,來做產(chǎn)業(yè)轉(zhuǎn)化。

        我一畢業(yè)就留在實(shí)驗(yàn)室工作,公司成立后,連同團(tuán)隊(duì)其他成員一起過來。

        整個(gè)團(tuán)隊(duì)三十來人,大家共事時(shí)間久,有的相處將近10年。無論是團(tuán)隊(duì)磨合,還是應(yīng)用轉(zhuǎn)化,從學(xué)校到公司的過渡,都非常平滑。剛成立半年時(shí),大家感覺跟在學(xué)校里沒有大差別。

        大的技術(shù)路線,早在公司孵化時(shí),我們就想清楚了。

        人工智能未來怎么發(fā)展,學(xué)術(shù)界、產(chǎn)業(yè)界當(dāng)時(shí)出現(xiàn)了多種聲音。讓大家焦慮的是,“AI四小龍”已經(jīng)把上一代人工智能技術(shù)落地的路徑,“蹚”得差不多,快碰到天花板了,下一代突破口在哪兒?未來該怎么辦?

        我們逐漸理清一個(gè)方向:要從感知智能,走向認(rèn)知智能。自2016年起,團(tuán)隊(duì)定下認(rèn)知智能的發(fā)展框架——數(shù)據(jù)和知識(shí)雙輪驅(qū)動(dòng),從那時(shí)到現(xiàn)在,基本在這一框架下探索,只是各階段側(cè)重點(diǎn)不同。

        2020年,Open AI發(fā)布參數(shù)規(guī)模達(dá)到1750億的GPT-3模型。我們意識(shí)到,人工智能的突破,有了新可能。

        這之前,GPT-1、GPT-2,參數(shù)量不大,本質(zhì)是延續(xù)上一代人工智能的路往前走了一點(diǎn),還沒到質(zhì)變的程度。

        GPT-3一出來,所有人看到了另一種可能,原來暴力“堆量”,堆到一定程度是會(huì)出現(xiàn)拐點(diǎn)的。沒有人想到,預(yù)訓(xùn)練語言模型的參數(shù)量被放大以后,會(huì)有“智能涌現(xiàn)”,而不只是能力的線性增長。

        GPT-3的發(fā)布節(jié)點(diǎn),恰逢智譜成立一周年。公司內(nèi)經(jīng)過幾輪討論,跟張鈸院士等清華老師,也做了很多探討。

        在大框架不變的前提下,預(yù)訓(xùn)練大模型的發(fā)展,沿著數(shù)據(jù)驅(qū)動(dòng)這條路,往前跨了一大步,上了新臺(tái)階。

        我們果斷圍繞這個(gè)方向轉(zhuǎn),投入到超大規(guī)模預(yù)訓(xùn)練模型的研發(fā)中。

        市面上主流的幾種預(yù)訓(xùn)練框架,BERT、GPT和T5,都來自國外公司。

        早期BERT的效果是超越GPT的,到了GPT-3,情況反轉(zhuǎn)。

        不同的訓(xùn)練框架,在不同維度上,擅長的能力不同,各自有適合的任務(wù)和場景。把它們各自的優(yōu)點(diǎn)結(jié)合起來,泛化出更多能力,是我們自研GLM預(yù)訓(xùn)練架構(gòu)的出發(fā)點(diǎn)。

        在許多具有百萬參數(shù)甚至更少訓(xùn)練步驟的基準(zhǔn)測試中,GLM在自然語言理解方面,實(shí)現(xiàn)了比BERT和T5更好的性能。這給了我們信心。

        基于GLM框架,開發(fā)百億參數(shù)的稠密模型以后,當(dāng)時(shí)GLM還沒完全定型,我們用了一些其他模型架構(gòu)比如MoE(Mixture of Experts),用“稀疏化”方法,成功訓(xùn)練出了一個(gè)萬億參數(shù)模型。

        通過稀疏化方式,雖能把模型參數(shù)推到很大,但這個(gè)“萬億”模型,實(shí)際效果沒有想象中那么好。

        GPT-3的出現(xiàn),給了我們啟發(fā):要堅(jiān)定走研發(fā)稠密基座模型的路。

        2021年,團(tuán)隊(duì)開始訓(xùn)練千億參數(shù)模型GLM-130B。國內(nèi)當(dāng)時(shí)做這塊的少,海外可借鑒的有限,OpenAI沒有公開技術(shù)細(xì)節(jié),大家不知道怎么復(fù)現(xiàn),也不確定門檻有多高。

        我們花了大約半年時(shí)間做前期籌備,進(jìn)行調(diào)研、設(shè)計(jì)、實(shí)驗(yàn)和調(diào)試,做各種工程實(shí)驗(yàn)。因?yàn)闇?zhǔn)備充分,訓(xùn)練GLM-130B,實(shí)際只花了兩個(gè)月。

        同百億參數(shù)模型的成本相比,訓(xùn)練一個(gè)千億模型,不是簡單的乘以10倍。

        最開始融資的時(shí)候,我們和投資人聊,需要把大模型的方方面面解釋得非常清楚。2021年,我可能也沒給大家講明白。ChatGPT火起來后,算是給所有人上了一課。

        2022年底,投資圈就敏銳地捕捉到了訊號(hào)。過完春節(jié),ChatGPT掀起討論熱潮,大家對(duì)大模型的態(tài)度,跟之前比有180度的大掉頭。熱度最高的時(shí)候,我們一天要接待兩三批投資人。

        投資人普遍認(rèn)可智譜的是三點(diǎn):

        一是切入賽道早,對(duì)大模型的認(rèn)知深刻;二是所有核心技術(shù),智譜全自研,底層的邏輯靠自己摸索出來,這使得團(tuán)隊(duì)的經(jīng)驗(yàn)積累,深且全面;三是懂國內(nèi)的To B市場,知道用什么樣的產(chǎn)品去做B端的商業(yè)化。

        團(tuán)隊(duì)里,工程師、研究員長期一起工作,這是公司最大的特點(diǎn),產(chǎn)學(xué)研一體化。

        這讓技術(shù)轉(zhuǎn)換到產(chǎn)品的過程很快,研究團(tuán)隊(duì)和工程師一配合,立馬就能把系統(tǒng)做出來,而后快速上線。

        公司成立之初,我們就是帶著技術(shù)和客戶入場的,早期做科研情報(bào)挖掘等產(chǎn)品,商業(yè)化落地做得不錯(cuò)。

        行業(yè)大環(huán)境變得快,在大方向不變的前提下,公司加快節(jié)奏,原本預(yù)計(jì)3~4個(gè)月做的事,會(huì)壓縮一半時(shí)間。

        2023年無論是團(tuán)隊(duì)擴(kuò)張、融資規(guī)模還是商業(yè)化落地,智譜都在提速。

        智譜的產(chǎn)品矩陣主要?jiǎng)澐譃槿龑印?/p>

        第一層是包括ChatGLM等在內(nèi)的基礎(chǔ)模型;第二層是工具平臺(tái)供應(yīng)鏈,提供標(biāo)準(zhǔn)化組件,可以通過產(chǎn)品化來提供服務(wù);再往上是應(yīng)用層,數(shù)字人、科技情報(bào)產(chǎn)品等。

        迭代頻率上,公司每3~6個(gè)月更新一代大模型。最新版本是去年10月推出的第三代基座大模型ChatGLM3。

        評(píng)測結(jié)果顯示,與ChatGLM二代模型相比,在44個(gè)中英文公開數(shù)據(jù)集測試中,ChatGLM3在國內(nèi)同尺寸模型中排名前列。

        ChatGLM3最大的一個(gè)亮點(diǎn),是智譜的模型能力與OpenAI實(shí)現(xiàn)了全線對(duì)齊,包括基座模型、語言模型、跨模態(tài)模型以及代碼解釋器等能力象限。

        商業(yè)模式方面,To B和To C兩條線都有,更側(cè)重B端。C端產(chǎn)品以免費(fèi)方式推動(dòng),主要包括生成式AI助手“智譜清言”,去年8月上線,為首批對(duì)外開放的大模型之一。

        B端的付費(fèi)主要是三種,API調(diào)用、私有化部署以及介于兩者之間的云端私有化方案,分別對(duì)應(yīng)不同規(guī)模企業(yè)的需求,非常靈活。

        公司重點(diǎn)布局的行業(yè),包括互聯(lián)網(wǎng)、金融、教育等,平穩(wěn)增長。

        客戶采用大模型后的效果,得落到具體業(yè)務(wù)里驗(yàn)證,這需要時(shí)間,但大家有信心。舉一個(gè)例子,幫程序員寫代碼的模型產(chǎn)品,平均工作效率至少提升30%。

        關(guān)于通用大模型和垂直行業(yè)大模型,智譜的思考重點(diǎn),一直是加碼基座大模型。

        所謂的行業(yè)大模型,不是個(gè)獨(dú)立的事物,跟通用模型不是平行的關(guān)系。一個(gè)模型,通用能力不夠強(qiáng),但專業(yè)能力很強(qiáng),這恐怕不太可能。

        這就好比一位行業(yè)專家,基礎(chǔ)知識(shí)很差甚至完全沒有,是不可想象的。無論哪個(gè)行業(yè),專有知識(shí)其實(shí)都建立在基礎(chǔ)知識(shí)之上。

        對(duì)標(biāo)OpenAI,我們期望盡快實(shí)現(xiàn)技術(shù)追趕,團(tuán)隊(duì)有一個(gè)動(dòng)態(tài)調(diào)整的時(shí)間表,當(dāng)前的目標(biāo),是盡快實(shí)現(xiàn)追平現(xiàn)有GPT-4的能力。接下來,我們會(huì)實(shí)現(xiàn)“技術(shù)+商業(yè)化”落地,兩條腿交替跑步前進(jìn)。

        除了自身保持進(jìn)步外,智譜還做了很多跟生態(tài)相關(guān)的事情,積極建設(shè)開源生態(tài)。

        公司很早就意識(shí)到,做大模型,需要舉全行業(yè)之力,不可能由某一家公司徹底壟斷市場。

        有一道物理題:一個(gè)金屬圓環(huán)加熱以后,它的內(nèi)徑會(huì)變大還是變小?

        答案是變大。內(nèi)部力量,會(huì)推動(dòng)整體勢能向外走。

        我希望大模型的生態(tài)圈也能像圓環(huán)一樣,一股勁一把火燒起來,大家協(xié)力,把生存空間做大。

        猜你喜歡
        人工智能模型
        一半模型
        我校新增“人工智能”本科專業(yè)
        p150Glued在帕金森病模型中的表達(dá)及分布
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
        2019:人工智能
        商界(2019年12期)2019-01-03 06:59:05
        人工智能與就業(yè)
        數(shù)讀人工智能
        小康(2017年16期)2017-06-07 09:00:59
        3D打印中的模型分割與打包
        下一幕,人工智能!
        亚洲一区二区三区中文字幂| 国产91 对白在线播放九色| 无码8090精品久久一区| 日韩人妻美乳中文字幕在线| 国产在线播放一区二区不卡| 欧美精品v国产精品v日韩精品| 麻豆国产高清精品国在线| 秀人网嫩模李梓熙大尺度| 亚洲天堂av一区二区| 三年的高清电影免费看| 天堂网www在线资源| 3亚洲日韩在线精品区| 亚洲1区第2区第3区在线播放| 国产av一级片在线观看| 中文字幕日韩精品一区二区三区| 中文字幕亚洲无线码| 亚洲日日噜噜噜夜夜爽爽| 大陆成人精品自拍视频在线观看| 97se亚洲国产综合自在线观看| 久久精品国产自清天天线| 亚洲av永久无码精品水牛影视| 一区二区高清免费日本| 三年的高清电影免费看| 亚洲国产成人久久综合一区77| 亚洲av午夜福利精品一区二区| 日本一二三四高清在线| 日日拍夜夜嗷嗷叫国产| 色老汉免费网站免费视频| 亚洲日产国无码| 亚洲一区二区三区2021| 无码国产伦一区二区三区视频| 亚洲欧美精品伊人久久| 午夜av内射一区二区三区红桃视 | 国产高清在线一区二区不卡| 小蜜被两老头吸奶头在线观看| 另类专区欧美在线亚洲免费| 永久免费看黄在线观看| 欧美 日韩 人妻 高清 中文| 中文乱码人妻系列一区二区| 另类人妖在线观看一区二区| 一区二区三区美女免费视频 |