邱元陽
2022年11月30日,OpenAI發(fā)布了其最新的聊天機器人模型ChatGPT。這一模型一經(jīng)亮相就驚艷了全世界,因為它顛覆了人們對Chat(聊天)的認(rèn)識,它不是簡單的知識問答和聊天、搜索,而是具有內(nèi)容生產(chǎn)能力的AI,可以幫你寫論文、做報告,甚至寫代碼、進(jìn)行程序調(diào)試……
半年過去了,ChatGPT依舊熱度不減,并在進(jìn)行升級進(jìn)化,儼然是一個全能的“六邊形戰(zhàn)士”,還產(chǎn)生了一大批的模仿和追隨者。
GPT全稱是“Generative Pre-Training transformer”,直譯過來就是“生成式預(yù)訓(xùn)練模型”,它使用了Transformer模型來進(jìn)行自我深度學(xué)習(xí)和加強學(xué)習(xí)。不同于簡單的Chat,ChatGPT是典型的AIGC(AI Generated Content,人工智能生成內(nèi)容)或GAI(Generative AI,生成式AI),具有很強的內(nèi)容生產(chǎn)能力。
AIGC被認(rèn)為是繼PGC(專業(yè)生產(chǎn)內(nèi)容)、UGC(用戶生產(chǎn)內(nèi)容)之后的新型內(nèi)容創(chuàng)作方式,其特點是高效的自動化生產(chǎn)。隨著NLG(自然語言生成技術(shù))和AI模型的成熟,AIGC目前已經(jīng)可以自動生成文字、圖片、音頻、視頻,甚至3D模型和程序代碼。
目前,AI已經(jīng)從理解內(nèi)容走向了自動生成內(nèi)容,包括AIGC用于作畫、圖文、視頻等多類型的內(nèi)容創(chuàng)作。當(dāng)然,這其中也少不了機械的模仿和照搬,如曾經(jīng)鬧出把起重機畫成鶴的笑話的文心一言,讓人懷疑其文生圖功能是中譯英后“套皮”Stable Diffusion來生成圖像,但其修正和完善之后卻又似乎是因為采用了英文標(biāo)注的圖片素材。李彥宏在解釋“胸有成竹”等成語生成圖片因望文生義而尷尬時曾說,不能要求AI的各項能力都與人匹配,它不“像”人也沒什么不好,而且我們的AI還正在成長中,初級階段表現(xiàn)不佳也很正常,但是它會很快地進(jìn)步。畢竟,就連ChatGPT這種偶像級的AI也一樣犯過一本正經(jīng)地證明27是質(zhì)數(shù)這樣的錯誤,GPT從1.0到4.0一路走來,也是比較漫長和曲折的。
2015年,OpenAI成立,次年推出初代GPT,2019年發(fā)布GPT-2,可以生成語言并在一定程度上準(zhǔn)確識別語言;2020年發(fā)布GPT-3,可以生成各種類型的文本并理解文本的語義;2022年OpenAI推出的ChatGPT,正是在GPT-3模型基礎(chǔ)上構(gòu)建的,之后又發(fā)展到GPT-3.5。如今為大家所津津樂道的,已經(jīng)是GPT-4了。
人工智能的重大研究方向之一就是NLP(自然語言處理),也就是讓機器讀懂人類的語言。NLP研究有兩大方向,一個是谷歌的雙向技術(shù),以BERT為代表;另一個就是OpenAI的自回歸技術(shù),以GPT為代表。這兩種技術(shù)方向的競爭,背后就是谷歌與微軟的競爭。在Alpha GO之后,微軟終于靠ChatGPT扳回一局。飛速進(jìn)化的ChatGPT,已經(jīng)有了引領(lǐng)第四次工業(yè)革命的趨勢。
與以前的AI不同,ChatGPT解放的不是人的體力,而是腦力。如果它能取代人的部分工作,那么被取代的可能是腦力勞動而非體力勞動。想到這一點,不免讓人有些脊背發(fā)涼。
從程序員的角度看,他們不會相信GPT能產(chǎn)生智慧,因為GPT底層算法的本質(zhì)就是數(shù)學(xué)概率而已。但是從用戶角度看,GPT的智能已經(jīng)高得驚人,甚至到了需要叫停的地步。
計算機模型使用反向傳播算法,可以以一種完全不同于人類大腦的方式運行,在算法模型下進(jìn)行海量訓(xùn)練,會讓AI飛速進(jìn)化。深度學(xué)習(xí)之父、圖靈獎得主杰弗里·辛頓在接受Emtech采訪中公開警告AI風(fēng)險:人類終結(jié)已近在眼前。