近十年來,清華大學(xué)新聞與傳播學(xué)院的沈陽團隊一直專注新聞傳播、計算機科學(xué)、信息管理和醫(yī)學(xué)等四個專業(yè)領(lǐng)域的研究,并通過撰寫相關(guān)專業(yè)報告,建立與公眾交流的橋梁。
我們推出的新媒體報告從2015年到2023年已經(jīng)有9個版本。2021年,我們發(fā)布的全球首份元宇宙學(xué)術(shù)報告更是在全網(wǎng)獲得超高人氣。2023年開始,相繼推出了人工智能生成內(nèi)容(AIGC)和大模型發(fā)展研究報告1.0及2.0版本,持續(xù)跟蹤和剖析這一領(lǐng)域的最新動態(tài)。
AI視頻或?qū)⒊蔀楝F(xiàn)實世界決策的新語言
人工智能從哲學(xué)層面上看,其實就是從“天人合一”理念過渡到“天人智一”的新境界。這意味著需要將人工智能與人的大腦和靈魂深度融合。在機器人中融入具身智能大模型,使其能夠感知并適應(yīng)環(huán)境,人工智能將會繞過人類與現(xiàn)實世界建立連接,這便是天與智的合一。
在此過程中,我們引入一個概念——“身心流固性”。具體而言,“身”的流動指的是社會身份的流動。隨著科技發(fā)展,我們的身份在真實世界與虛擬世界之間,在虛擬現(xiàn)實、混合顯示、增強現(xiàn)實等技術(shù)融合下,變得可以流動和變化;“心”的固性則是指我們的思維在一定程度上被AI所圈定。例如,當(dāng)你在抖音上瀏覽時,人工智能會根據(jù)你的喜好推送相應(yīng)內(nèi)容,這在一定程度上固化了你的思維和認知。同樣,視頻制作者也會根據(jù)觀眾反應(yīng)調(diào)整內(nèi)容,無論是AI,還是人類制作的內(nèi)容,都會被智能推薦邏輯去強化我們對現(xiàn)實世界的認知。
當(dāng)前,視頻已經(jīng)逐步成為我們認知與決策現(xiàn)實世界的新語言,未來AI生成的視頻內(nèi)容或?qū)⑦M一步加強這一進程。特別是在年輕人的圈層化趨勢上,不同青年群體傾向于選擇特定社交媒體平臺獲取信息。這些年輕人所選擇的平臺差異顯著,反映了他們不同的信息獲取和決策方式。
AI將極大提高工作效率,突破傳統(tǒng)局限
從鏡像進化論的視角看,人工智能的進化路徑與真實宇宙的進化過程呈現(xiàn)一種逆向關(guān)系。AI的發(fā)展首先是模擬意識,其次是模擬生命,最終是模擬空間。與此同時,人類也正在經(jīng)歷一個高度虛擬化的過程。隨著AI普及,人類的物理性勞動將逐漸轉(zhuǎn)變?yōu)榇竽X智力性勞動。
以藝術(shù)創(chuàng)作為例,過去需要畫家親身投入、手腦并用,如蘇東坡所言“心目手,三者皆得之矣”。然而,如今的AI藝術(shù)創(chuàng)作已經(jīng)轉(zhuǎn)變?yōu)橐环N可以通過語音指令完成的腦力勞動。按照這個趨勢,人類或許將更依賴語言提示,通過腦機接口進行思維交流,即可完成各種任務(wù)。AI機器人將進一步實體化,在國內(nèi)大模型的推動下,AI將進一步拓展其應(yīng)用范圍,最終將虛擬世界與真實世界相結(jié)合,實現(xiàn)人形機器人的實際應(yīng)用,幫助人類完成各種工作。這一過程體現(xiàn)了鏡像進化論的核心觀點。
因此,在追求高效知識產(chǎn)出的過程中,我們采用“零知識啟動”的策略。根據(jù)我們的分類,知識可分為熟知識、生知識和零知識。例如,某人患有一種罕見疾病,經(jīng)過醫(yī)院診斷,仍未能明確病因。對這種疾病,我們同樣缺乏了解,這便是我們所說的零知識狀態(tài)。面對此類問題,我們將患者的病情信息輸入AI系統(tǒng)中,讓AI不要局限于常規(guī)思維,嘗試從非傳統(tǒng)的角度推測,以尋找可能的罕見病因。AI隨后提供了一系列可能的罕見疾病列表。我們將這些結(jié)果轉(zhuǎn)達給醫(yī)院并與醫(yī)生探討,看能否從這些罕見病中找到確切病因。這個過程正是以零知識為基礎(chǔ),利用AI工具進行高知識生產(chǎn)的活動,也充分展示了AI在處理復(fù)雜和未知問題時的獨特優(yōu)勢。
當(dāng)然,我們在探討AI在教育領(lǐng)域的應(yīng)用時,會發(fā)現(xiàn)有不同矛盾存在。第一個矛盾是人在學(xué)習(xí)的過程中,主要以單學(xué)科學(xué)習(xí)為主,而AI具備跨學(xué)科學(xué)習(xí)能力,不受專業(yè)限制;第二個矛盾是中小學(xué)生在使用AI輔助學(xué)習(xí)時,往往直接獲得了一篇完整的作文,卻缺乏了寫作過程中的訓(xùn)練與實踐。而我們需要解決的問題是把結(jié)果過程化,促使他們主動思考與探索;第三個矛盾是如何將開放性的AI知識框架跟我們標(biāo)準(zhǔn)化的知識考核結(jié)合起來。
通過這幾個矛盾,我們意識到,如果完全依賴AI處理所有事務(wù),最終可能導(dǎo)致AI超越并取代人類,人類喪失主體性地位。因此,我們提出新的觀點:完成任何事務(wù)都可以劃分為100%的任務(wù)量,其中AI負責(zé)執(zhí)行99%,而人類則負責(zé)發(fā)揮審美、判斷、決策和認知能力,掌握1%的關(guān)鍵部分。我們倡導(dǎo)的理念是,將知識傳授給AI,將智慧保留給人類。
AI助手將成為未來人類改造現(xiàn)實世界的新伙伴
在AI應(yīng)用方面,我們可以將其歸納為三類核心應(yīng)用。第一是AI再創(chuàng),即利用AI將人類已完成的事物重新創(chuàng)造,如用AI繪制《西游記》的圖像,未來每個人都可以有自己的《西游記》。然而,這也將帶來版權(quán)和知識產(chǎn)權(quán)保護的問題。第二是AI擬真,即利用AI模擬真實世界,實現(xiàn)虛擬現(xiàn)實等應(yīng)用場景。第三是AI異感,即利用AI創(chuàng)造我們從未接觸過的宇宙、空間和事物,如AI提供的外星生命形態(tài)和硅基生命的理論。
在與AI的交流中,我們不僅可以獲得新的認知和理解,以及提高研究、文學(xué)藝術(shù)創(chuàng)作的效率,甚至可以使其不斷轉(zhuǎn)化和迭代升級。同時,我們在對AI的“人格”進行研究時發(fā)現(xiàn),在多數(shù)情境下,與AI交流,TA會傾向于支持你的觀點,展現(xiàn)溫暖和同理心,并與用戶價值觀對齊。
值得一提的是,我們的團隊中有一位博士后專門研究AI在療愈方面的應(yīng)用。例如,一位母親表示,她喜歡畫畫的孩子不太愿意與她交流。這位母親通過AI生成的一幅以母親為主題的畫作,成功實現(xiàn)了與孩子的溝通。這個例子說明了AI在尋找心理抑郁靶點方面具有一定潛力。通過定向AI的創(chuàng)作,我們可以針對特定心理問題進行靶向療愈。
關(guān)于智能分身的應(yīng)用,我們當(dāng)前已創(chuàng)建了六個智能分身。預(yù)計在未來一段時間,我們將實現(xiàn)智能分身引入微信平臺。屆時,當(dāng)雙方進行交流時,用戶可能是在與智能分身進行溝通。同時,智能分身還會定期報告交流情況,如今天與多少人進行了對話,并根據(jù)設(shè)定進行篩選。例如,在相親場景中,可以先通過虛擬人進行初次交流,若雙方感覺良好,再安排真實見面。綜上所述,智能體在未來將有一系列新發(fā)展,智能分身的應(yīng)用便是其中的重要一環(huán)。
關(guān)于如何將AI與中國產(chǎn)能相結(jié)合,我們國家擁有幾個明顯的優(yōu)勢領(lǐng)域。首先,中國擁有世界上最為完整和先進的智能制造產(chǎn)業(yè)鏈,特別是在中低端智能制造方面;其次,中國在短視頻、直播帶貨、短劇及移動游戲等方面,同樣保持世界領(lǐng)先地位。為了發(fā)揮這些優(yōu)勢,我們計劃將AI技術(shù)與這些領(lǐng)先全球的行業(yè)深度融合。
在產(chǎn)業(yè)應(yīng)用上,大飛機可謂人類制造的最復(fù)雜工業(yè)品,擁有高達200萬個零件。那么,借助AI的力量,我們是否有能力造出零件數(shù)量達千萬級的工業(yè)品?這無疑是一個巨大挑戰(zhàn)。在服裝領(lǐng)域,我們的目標(biāo)是在今年穿上由服裝大模型設(shè)計的AI服裝;在教育領(lǐng)域,我們提出了從“多能”到“超能”的轉(zhuǎn)變,注重培養(yǎng)學(xué)生對于AI應(yīng)用的綜合能力,等等。
經(jīng)過深入分析,我們得出一個基本結(jié)論:在未來十年內(nèi),手機仍將保持其主流交互和計算設(shè)備的地位,但隨著技術(shù)不斷進步,AR眼鏡和頭盔等設(shè)備有可能在未來十年之后逐漸取代手機的主導(dǎo)地位。在移動互聯(lián)網(wǎng)領(lǐng)域,短視頻已經(jīng)成為主要內(nèi)容消費形式,并正逐漸演變?yōu)锳I短視頻。對于非內(nèi)容操作方面,AI助手將成為主導(dǎo),預(yù)計每個人都將擁有自己的AI助手。清華大學(xué)已宣布2024年下半年新生開學(xué)時,每位新生將配備一個AI助手,并且開設(shè)了一百多門AI授課課程,充分展示了AI與實踐的緊密結(jié)合。
AI發(fā)展仍有短板
關(guān)于AI的短板,盡管人們要多談及其優(yōu)勢,然而AI幻覺仍是一大問題。以我個人經(jīng)歷為例,我曾嘗試將我與我愛人19歲時的照片進行AI合成。結(jié)果有的畫面我愛人多出一只手,而搭在我肩上的手竟有六根手指,這便是AI在繪制多個物體時可能出現(xiàn)的錯誤。然而,當(dāng)我們向AI提出具體要求時,如“請將臉部和手部表現(xiàn)得更清晰”,由于AI具備注意力機制,它在繪制手部時會更為專注,從而減少出錯的可能。這樣,AI在繪制其他部分時可能不必投入過多算力,從而提高整體準(zhǔn)確性。
在與AI的對話中,我們可以發(fā)現(xiàn),盡管AI具有強大的能力,但也存在其局限性。有時AI給出的答案并不能令我們十分滿意。因此,在與AI交流時,我們需要提出更具挑戰(zhàn)性的問題,利用AI去嘗試完成那些以前人類難以完成的任務(wù),這才是我們真正需要的。
隨著技術(shù)優(yōu)化和進步,AI現(xiàn)在繪圖出現(xiàn)六個手指頭的幻覺率已顯著下降至10%至20%,這體現(xiàn)了我們在人工智能領(lǐng)域研究的顯著進步。但對于容錯率較高的行業(yè),如科幻類電影制作,AI技術(shù)的運用可以更為大膽,因為即使出現(xiàn)一些瑕疵,觀眾也不會斤斤計較。然而,對于容錯率較低的行業(yè),如嚴(yán)格的醫(yī)療系統(tǒng),AI的應(yīng)用就需要更為謹(jǐn)慎,以免出現(xiàn)不可挽回的失誤。
綜上所述,盡管當(dāng)前的AI技術(shù)已經(jīng)能夠?qū)崿F(xiàn)許多人類難以完成的功能,但人工智能研究公司OpenAI正式對外發(fā)布的人工智能“文生視頻”大模型Sora仍然存在一些亟待解決的問題。首先,其物理模擬的準(zhǔn)確性有待提高;其次,Sora在處理空間關(guān)系時存在混淆現(xiàn)象;最后,其對于多角色交互的理解也面臨挑戰(zhàn)。這些問題的存在,使得我們對Sora1.0版本的評估分?jǐn)?shù)為70—80分,表明其仍有待完善。這同樣也為創(chuàng)作者提供了廣闊的空間和潛力。我們期待在未來的版本中看到Sora的進一步改進和優(yōu)化。W
(作者沈陽系清華大學(xué)新聞與傳播學(xué)院教授,新媒體研究中心主任,跨學(xué)科知名學(xué)者)