如今,生成式人工智能正以顛覆性的創(chuàng)新重塑人類與技術(shù)的交互方式。它通過深度學習和算法優(yōu)化,以學習海量數(shù)據(jù)(如文本、圖像、音頻、視頻等),模擬人類的創(chuàng)造力,“理解”其中的模式和規(guī)律,然后生成形式多樣的內(nèi)容。這項技術(shù)從最初的理論探索到如今落地千行百業(yè),不僅展現(xiàn)了強大的創(chuàng)造力,更成為推動數(shù)字化轉(zhuǎn)型和產(chǎn)業(yè)升級的核心引擎。
1956 年的達特茅斯會議誕生了“人工智能”(Artificial"Intelligence,AI)一詞,被認為是這項技術(shù)發(fā)展的開端。但包括20世紀40年代沃倫·麥卡洛克等對人工神經(jīng)網(wǎng)絡的探索、1950"年艾倫·圖靈提出的圖靈測試等也是這項技術(shù)雛形的重要事件。達特茅斯會議之后的數(shù)十年間,由于技術(shù)發(fā)展路線的不明確,同時受限于算力與數(shù)據(jù),AI發(fā)展歷經(jīng)沉浮。20"世紀"80 年代至"90 年代,專家系統(tǒng)、隱馬爾可夫模型等理論學習、機器學習的模型和系統(tǒng)相繼提出,為后續(xù)的人工智能的發(fā)展奠定了一定基礎。由于"70 年代時人工智能的發(fā)展并未取得預期中的進展,導致"AI 一詞飽受批評,因此在"20 世紀"80 年代至"90 年代該方面的研究一般冠以“知識工程”或“知識智能系統(tǒng)”等名稱。
21 世紀初,深度學習的興起為生成式"AI帶來突破契機。2014"年,伊恩·古德弗洛提出生成對抗網(wǎng)絡(GAN),通過對抗訓練實現(xiàn)圖像生成質(zhì)的飛躍,標志著生成式"AI 進入技術(shù)覺醒期。2015"年,OpenAI"成立,開始全力推動生成式"AI 研究。2017"年,美國谷歌公司提出Transformer"架構(gòu)(如"BERT、GPT),極大提升了自然語言處理(NLP)能力。在論文《Attentionis"All You Need》中,研究者提出了這種名為Transformer"的全新神經(jīng)網(wǎng)絡架構(gòu),這一模型摒棄了傳統(tǒng)的循環(huán)神經(jīng)網(wǎng)絡(RNN)和卷積神經(jīng)網(wǎng)絡(CNN)的設計思路,轉(zhuǎn)而完全依賴于自注意力(self-attention)機制來處理序列數(shù)據(jù)。這一架構(gòu)的提出不僅解決了長序列建模的瓶頸,還為后續(xù)大語言模型(LLM)的爆發(fā)奠定基礎。
過去十余年,生成式"AI 經(jīng)歷了從單模態(tài)到多模態(tài)、從專用到通用、從學術(shù)研究到產(chǎn)業(yè)落地的高速發(fā)展,可簡要劃分為三個階段:
技術(shù)探索期(2014—2018"年)。"生"成對抗網(wǎng)絡成為圖像生成的主流技術(shù),英偉達的StyleGAN"即是基于生成對抗網(wǎng)絡的深度學習模型,廣泛應用于人臉生成、圖像編輯等領(lǐng)域,其核心創(chuàng)新在于通過映射網(wǎng)絡和自適應實例歸一化技術(shù)實現(xiàn)多層級風格控制?。
模型規(guī)?;冢?019—2021"年)。2018年,OpenAI"發(fā)布了最早的一代大型模型GPT-1。GPT-1運用幾十億文本檔案的語言資料庫進行訓練,模型的參數(shù)量為"1.17 億個。一年后發(fā)布的GPT-2"首次展現(xiàn)了大語言模型的涌現(xiàn)能力—"一這個模型的參數(shù)規(guī)模突破"15 億,可以生成連貫的新聞文本。隨后,谷歌旗下的"DeepMind研發(fā)的"AlphaFold 人工智能系統(tǒng)通過"AI 預測蛋白質(zhì)結(jié)構(gòu),解決了困擾生物學界"50 年的難題,展現(xiàn)了人工智能技術(shù)在生命科學研究和藥物開發(fā)進程中的顯著突破。2021"年,Stability"AI 發(fā)布"Stable Diffusion,將圖像生成的算力需求降低 90%",推動"AIGC(人工智能生成內(nèi)容)普及。
多模態(tài)與通用化期(2022"年至今)。2022"年"可"謂"是"生"成"式"AI 的"爆"發(fā)"元"年。OpenAI"推"出"ChatGPT—— 基"于"GPT-3 的3.5"版本,以對話式交互顛覆人機交互范式,不僅能夠回答問題,還能創(chuàng)作文章、編程,甚至模仿人類的對話風格,其幾乎無所不能的回答能力使得人們對大語言模型的通用能力有了全新的認識。這一模型上線兩個月便實現(xiàn)了用戶破億。同時,谷歌發(fā)布圖像生成模型,Midjourney"等初步實現(xiàn)的文生視頻、3D"建模等,生成式"AI 開始融合文本、圖像、音頻、視頻等多種信息,向通用人工智能(AGI)邁進。
中國的人工智能探索可以追溯到改革開放初期,“科學技術(shù)是第一生產(chǎn)力”提出后,中國在包括人工智能在內(nèi)的各方面技術(shù)研究開始向國際先進追趕。起初,受限于資源和專業(yè)人才的匱乏,中國的人工智能發(fā)展緩慢,相關(guān)研發(fā)成果明顯落后于西方水平。
近年來,隨著以美國科技企業(yè)為代表的生成式人工智能技術(shù)迅速發(fā)展,中國在該領(lǐng)域也全面發(fā)力并涌現(xiàn)出一批具有全球競爭力的企業(yè)和研究機構(gòu)。從大語言模型到AI"繪畫、視頻生成,中國在技術(shù)研發(fā)、產(chǎn)業(yè)應用和政策支持方面均取得顯著進展。
自"2017 年"Transformer 架構(gòu)提出并推動了全球生成式"AI 發(fā)展,中國學術(shù)界和產(chǎn)業(yè)界開始跟進。2018"年后,百度、阿里、騰訊等企業(yè)開始布局大模型,加速自研速度,紛紛發(fā)布了相關(guān)自研模型,如百度的“文心大模型”、阿里的“通義千問”、華為的“盤古大模型”等。隨著2022"年ChatGPT"引爆全球AInbsp;熱潮,中國科技公司也加快追趕步伐。2023"年,中國生成式AI"進入“百模大戰(zhàn)”,百度、阿里、騰訊、華為、字節(jié)跳動、科大訊飛、月之暗面、智譜"AI 等,推出了相關(guān)的模型產(chǎn)品,極大地豐富和活躍了中國生成式人工智能市場,推動了行業(yè)的發(fā)展與進步。2024"年,中國"AI 企業(yè)在多模態(tài)(文本+圖像+視頻)的生成式AI"上全面發(fā)力,字節(jié)跳動的“豆包”、百度的“文心一格”(AI"繪畫,現(xiàn)已整合至“文心一言”)等的推出,推動多模態(tài)"AI逐步成熟。
2025 年"1 月,深度求索(DeepSeek)最新"AI 模型的發(fā)布成為中國人工智能發(fā)展的關(guān)鍵節(jié)點。其開源模式、低訓練成本以及絲毫不遜色的成果表現(xiàn),迅速引爆全球"AI 行業(yè)。這也標志著中國已成功構(gòu)建起完整的人工智能生態(tài),開始由技術(shù)追趕者變成改變?nèi)?AI 格局的重要力量。
生成式"AI 技術(shù)作為涉及深度學習、自然語言處理、計算機視覺、強化學習和概率論等多個領(lǐng)域的復雜技術(shù),其正在打破行業(yè)邊界、重構(gòu)生產(chǎn)流程與交互體驗,逐步滲透到各行各業(yè)、方方面面。
內(nèi)容創(chuàng)作是生成式"AI 的最基本、最成熟的應用之一。文生文的輔助寫作,包括文案生成、文章潤色乃至代碼編寫等,已成為許多人工作和業(yè)余創(chuàng)作的選擇。隨著圖像、音頻等多模態(tài)生成模型的發(fā)展,文生圖、文生視頻等快速成為當下的內(nèi)容創(chuàng)作熱門方式。
智能交互也是生成式"AI 的重要應用。包括搜索引擎嵌入AI、AI"智能客服、AI"學習機、虛擬數(shù)字人等,基于生成式"AI 的智能交互融入人們工作、學習、生活日常。
生成式AI也顯著推動科研與生產(chǎn)效率提升?!按a農(nóng)們”的代碼開發(fā)、咨詢公司的數(shù)據(jù)分析、機械制造的工業(yè)設計等,生成式"AI 強大的數(shù)據(jù)分析、內(nèi)容識別和產(chǎn)出能力,為相關(guān)科研和生產(chǎn)提供了強大助力。
此外,在個性化教育和醫(yī)療輔助方面,生成定制化解題步驟、輔助早期癌癥篩查……生成式AI"正在不斷突破應用邊界,滲透到社會全行業(yè)。
隨著技術(shù)持續(xù)迭代,生成式"AI 將向更深層次、更廣領(lǐng)域拓展,呈現(xiàn)技術(shù)融合與能力躍升、應用場景深度滲透、挑戰(zhàn)與治理并進等發(fā)展趨勢。
可以預見,多模態(tài)深度融合,突破文本、圖像、視頻、音頻的邊界,實現(xiàn)全模態(tài)生成與交互將是生成式AI"下一步技術(shù)融合的重點。同時,具身智能的崛起——生成式"AI 與機器人技術(shù)結(jié)合,使物理實體具備環(huán)境感知與決策能力,也將成為其能力躍升的可能表現(xiàn)。
在應用場景深度滲透方面,醫(yī)療、法律、金融等專業(yè)性強的行業(yè)將出現(xiàn)行業(yè)定制化的專屬大模型,滿足專業(yè)性與合規(guī)性需求。AI"原生應用爆發(fā)、個性化服務升級也將持續(xù)滲透到各行業(yè)的深度應用場景中。
同時,生成式"AI 也面臨著問題和挑戰(zhàn),技術(shù)發(fā)展的同時加強治理將成為保障其穩(wěn)定推進的重要一環(huán)。數(shù)據(jù)安全與倫理將成為治理焦點,其中包括訓練數(shù)據(jù)的隱私保護、生成內(nèi)容的真實性與版權(quán)歸屬、AI"生成虛假信息的治理等。此外,算力與能耗瓶頸也會影響其發(fā)展,需要加快算力供應和能源結(jié)構(gòu)轉(zhuǎn)型,以保障其健康穩(wěn)定發(fā)展。
生成式"AI 正在重塑世界,從藝術(shù)創(chuàng)作到科學研究,其潛力無限。這一技術(shù)的崛起,不僅是技術(shù)的突破,更是一場關(guān)乎人類創(chuàng)造力、生產(chǎn)方式與社會結(jié)構(gòu)的深刻變革。如今,AI"變革已至,我們應積極擁抱"AI,探索技術(shù)賦能發(fā)展的無限可能。未來,隨著技術(shù)、倫理與治理體系的協(xié)同發(fā)展,生成式"AI 有望成為人類拓展認知邊界、創(chuàng)造美好生活的核心伙伴。這場由代碼驅(qū)動的創(chuàng)造力革命,已經(jīng)來到,期望更遠。
編者按:在科技浪潮的席卷下,人工智能正快速融入經(jīng)濟社會各行各業(yè)。人工智能賦能產(chǎn)業(yè)發(fā)展,成為推動經(jīng)濟高質(zhì)量增長的重要力量。本期策劃,我們從農(nóng)業(yè)、工業(yè)、服務業(yè)(文旅)等產(chǎn)業(yè)角度,以廣西、廣東、浙江等地的實際案例,了解正在不斷拓展的人工智能應用場景,見證人工智能賦能產(chǎn)業(yè)發(fā)展的生動實踐。