耄耋之年的他,說話邏輯清晰、思維敏捷,輸出觀點(diǎn)快而密。說不到兩句,你就能感受到從他身上彌漫過來的強(qiáng)大自信。他就是張鈸,中國人工智能領(lǐng)域的奠基人之一,他的四代學(xué)生組成了中國最具代表性的一支AI隊(duì)伍——“清華代表隊(duì)”,其中一些人已成為國內(nèi)大模型建設(shè)的重要力量。
1978年,清華大學(xué)進(jìn)行部分院系調(diào)整,張鈸所在的電子系(原自動(dòng)控制系)改為計(jì)算機(jī)技術(shù)與應(yīng)用系,系中原來從事自動(dòng)控制研究的老師面臨兩個(gè)選擇:待在計(jì)算機(jī)系,或去新成立的自動(dòng)化系。他選擇了前者。
很多老師勸他:國家未來要大力發(fā)展工業(yè),自動(dòng)化是最有前景的方向之一。張鈸回憶,“有人說,你把已有的知識都丟掉了,還剩什么?我說,還剩一個(gè)腦袋?!?/p>
帶著“唯一的腦袋”留在計(jì)算機(jī)系,張鈸遇到的第一個(gè)任務(wù)是尋找有潛力的新方向。他翻閱國外學(xué)術(shù)期刊,發(fā)現(xiàn)美國很多大學(xué)的計(jì)算機(jī)系里都有一個(gè)方向:人工智能。
“當(dāng)時(shí),對于人工智能是什么,我也不是特別清楚,但它對我有極強(qiáng)的吸引力,因?yàn)檫@個(gè)領(lǐng)域里充滿了大量的未知。AI在國際上剛發(fā)展了約20年,很多原理都說不清,這恰恰是我的用武之地,如果問題都解決了,還需要我干什么?”張鈸說。
數(shù)學(xué)是張鈸最拿手的學(xué)科。閱讀大量人工智能文獻(xiàn)后,他敏銳地發(fā)現(xiàn):多數(shù)AI研究中沒有使用任何數(shù)學(xué)工具,這意味著,很多還未解決的問題有機(jī)會(huì)用數(shù)學(xué)辦法解決。
1980年,作為改革開放后的首批出國訪問學(xué)者之一,張鈸來到美國伊利諾伊大學(xué)香檳分校進(jìn)修。從1978年暑期起,他就開始研究機(jī)器人運(yùn)動(dòng)規(guī)律,他出國第二年,就與在安徽大學(xué)任教的弟弟張鈴?fù)冻鲋袊鳤I領(lǐng)域的第一篇論文。此時(shí),距離他決心轉(zhuǎn)戰(zhàn)AI還不到三年。
張鈸成為國際上第一批提出用數(shù)學(xué)模型解決AI問題的學(xué)者之一。
2002年,袁進(jìn)輝還在西安電子科技大學(xué)計(jì)算機(jī)系讀大三,成績年級第一,想申請清華直博,當(dāng)時(shí),張鈸是清華計(jì)算機(jī)系唯一的中國科學(xué)院院士。
此前,袁進(jìn)輝已讀過張鈸和張鈴共同撰寫的一本關(guān)于人工神經(jīng)網(wǎng)絡(luò)的專著。該書出版于20世紀(jì)90年代,那時(shí)人工神經(jīng)網(wǎng)絡(luò)是AI里很小眾的領(lǐng)域。
早期的人工神經(jīng)網(wǎng)絡(luò)只是淺層神經(jīng)網(wǎng)絡(luò),難以解決稍微復(fù)雜的現(xiàn)實(shí)問題。于是,連接主義起步不久就陷入低谷,只有少數(shù)人認(rèn)定這條路是正確的,其中就包括張鈸。
2012年,以深度神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)的深度學(xué)習(xí)徹底出圈。與早期的神經(jīng)網(wǎng)絡(luò)相比,深度神經(jīng)網(wǎng)絡(luò)“把深度加深了”,即中間的網(wǎng)絡(luò)層數(shù)變多之后,性能發(fā)生了重大變化,只需輸入大量的原始數(shù)據(jù),就可以“自學(xué)成才”。張鈸最初感到興奮,但隨后開始思考:深度學(xué)習(xí)的邊界在哪兒?
清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系教授、人工智能研究院副院長朱軍是張鈸的學(xué)生?!?013年前后,正是深度學(xué)習(xí)最熱的時(shí)候,很多激進(jìn)的觀點(diǎn)認(rèn)為,AI三五年內(nèi)就可能在自動(dòng)駕駛等復(fù)雜場景量產(chǎn),但張鈸是國內(nèi)最早公開談?wù)撋疃壬窠?jīng)網(wǎng)絡(luò)存在缺陷的專家之一。”朱軍說,此時(shí),張鈸快80歲了。
深度學(xué)習(xí)的一個(gè)關(guān)鍵弱點(diǎn)是容易被欺騙。張鈸團(tuán)隊(duì)發(fā)現(xiàn),深度神經(jīng)網(wǎng)絡(luò)的圖像識別很脆弱。一張以雪山為背景的圖片,只要加入一點(diǎn)“噪聲”,“自學(xué)”之后的AI就會(huì)將其識別成一條狗。這一問題絕非“雪山還是狗”這么簡單,而是指向一個(gè)困擾張鈸多年的更大難題:深度學(xué)習(xí)往何處去?
2022年11月30日,ChatGPT正式亮相。此前,人們根本無法想象AI模型可以變得如此強(qiáng)大?!敖^大多數(shù)AI研究者感到非常震驚?!睆堚撜f。
袁進(jìn)輝指出,ChatGPT的誕生讓人工智能進(jìn)入截然不同的發(fā)展階段。模型變大后,人們突然發(fā)現(xiàn),過去多少年解決不了的問題可以用統(tǒng)一的方法搞定?!斑@是一次工業(yè)革命級的技術(shù)革命?!?/p>
張鈸說,多數(shù)人理解ChatGPT就是“大數(shù)據(jù)+深度學(xué)習(xí)”,其實(shí)它真正的突破,首先在自然語言文本上。ChatGPT不是像第二代AI那樣,簡單地把文本作為數(shù)據(jù)來處理,而是把文本當(dāng)成知識(內(nèi)容)來處理?!爸挥挟?dāng)機(jī)器可以從大量的數(shù)據(jù)中獲取到知識,真正的轉(zhuǎn)變才會(huì)發(fā)生。所以,ChatGPT能力的強(qiáng)大源自兩點(diǎn):一是大模型;二是大文本。”
可以說,ChatGPT是張鈸預(yù)測中的第三代人工智能的雛形,但還遠(yuǎn)遠(yuǎn)不夠。
迄今為止,人類一直通過模擬的方式讓機(jī)器的行為與人類相似,但大模型還是一個(gè)“黑匣子”,這正是張鈸認(rèn)為AI理論下一步可能突破的地方。
在張鈸的倡議下,2018年,清華大學(xué)成立人工智能研究院基礎(chǔ)理論研究中心,朱軍為研究中心主任。
在張鈸看來,中國學(xué)生解決問題的能力很強(qiáng),但提出問題的能力不足。因此,在培養(yǎng)學(xué)生時(shí),張鈸格外重視訓(xùn)練學(xué)生“提出問題的能力”。
袁進(jìn)輝2003年起跟隨張鈸讀博,不像有的導(dǎo)師會(huì)出于“更容易出成果”或“項(xiàng)目有需要”等原因給學(xué)生指定博士選題,張鈸總是讓學(xué)生自己找題,鼓勵(lì)大家自主探索無人區(qū)。
AI領(lǐng)域最激烈的變化就集中在短短十幾年內(nèi),這一切都發(fā)生在張鈸77歲之后。朱軍說,張鈸自我要求極高,有強(qiáng)烈的好奇心與求知欲,快90歲時(shí)每天還在看國外最新的論文?!八俏乙娺^的學(xué)習(xí)能力最不可思議的人之一。最前沿的模型,他玩得比我們還溜?!?/p>
(摘自《中國新聞周刊》)