戴瑩瑩 萬雨亭
生成式人工智能技術(shù),是指具有文本、圖片、音頻、視頻等內(nèi)容生成能力的模型及相關(guān)技術(shù)。(1)國家網(wǎng)信辦等:《生成式人工智能服務(wù)管理暫行辦法》,2023-07-10,https://www.gov.cn/zhengce/zhengceku/202307/content_6891752.htm,訪問日期:2023-10-08。2022年底,OpenAI推出的ChatGPT使生成式人工智能引起公眾的廣泛關(guān)注。2023年上半年,GPT-4更是引起了學(xué)界大量的討論。新一代的ChatGPT能夠理解并生成符合人類自然語言習(xí)慣的“常識性、結(jié)構(gòu)性、對話性”文本,能夠與人展開自然、深入的多輪對話,是一種“革命性”媒介。(2)焦勇勤:《大模型媒介:ChatGPT引發(fā)的智能傳播革命及其社會影響》,《海南大學(xué)學(xué)報(人文社會科學(xué)版)》,網(wǎng)絡(luò)首發(fā),2023年10月8日。新文科建設(shè)是新時期我國高等學(xué)校人才培養(yǎng)改革的重要戰(zhàn)略,新文科建設(shè)的要義是推進哲學(xué)社會科學(xué)與新一輪科技革命和產(chǎn)業(yè)變革交叉融合,更新學(xué)科觀念和思想,產(chǎn)生新興的、深度交叉融合的學(xué)科專業(yè),產(chǎn)出新成果,培養(yǎng)新的創(chuàng)新人才。(3)張福貴:《技術(shù)主義道路與傳統(tǒng)文科的發(fā)展路向》,《山東大學(xué)學(xué)報(哲學(xué)社會科學(xué)版)》2021年第5期。毋庸置疑,將生成式人工智能融入新文科建設(shè),是高等教育教學(xué)改革的需要,也是學(xué)科發(fā)展的需要。在新一代人工智能工具推廣之后,傳統(tǒng)文科的教學(xué)理念、教學(xué)目標(biāo)、教學(xué)方式都將迎來巨大的改變。有人認(rèn)為,生成式人工智能就是一個潘多拉魔盒,它的濫用可能導(dǎo)致學(xué)術(shù)誠信、知識產(chǎn)權(quán)以及路徑依賴等問題,甚至可能對某些傳統(tǒng)學(xué)科、領(lǐng)域帶來顛覆性的沖擊。有人認(rèn)為,應(yīng)該冷靜、客觀地看待新技術(shù),生成式人工智能在很長時間內(nèi)都無法顛覆任何一個學(xué)科。(4)一些學(xué)者認(rèn)為,未來一二十年內(nèi),生成式AI無法完全取代人類學(xué)者,最多只能占據(jù)部分學(xué)術(shù)知識生成的份額。即使對一個小的學(xué)科分支而言,人工智能技術(shù)也遠不能起到顛覆性作用。參見陳云松:《ChatGPT對人文社科研究的價值與挑戰(zhàn)》,《探索與爭鳴》2023年第5期;王峰:《生成式人工智能與文學(xué)知識系統(tǒng)的創(chuàng)新》,《文藝爭鳴》2023年第7期。在新文科的發(fā)展建設(shè)進程中,應(yīng)當(dāng)如何正確認(rèn)識生成式人工智能,理性應(yīng)對生成式人工智能帶來的機遇和挑戰(zhàn),將新技術(shù)有效應(yīng)用于新文科建設(shè),最大化服務(wù)教學(xué)、科研和復(fù)合型人才的培養(yǎng),是當(dāng)下需要思考的問題。
信息技術(shù)輔助文科教學(xué)和科研是近40年尤其是數(shù)字人文興起之后的熱點議題,只是學(xué)術(shù)史對這方面的梳理不夠細致深入。(5)歐美“數(shù)字人文”這一概念在2004—2008年正式出現(xiàn)并流行,在2009年進入中國大陸和臺灣地區(qū)。一些學(xué)者將從1980年代中國典籍?dāng)?shù)字化實踐的開端到2009年“數(shù)字人文”進入中文世界之間的這段時間視作數(shù)字人文發(fā)展的“史前史”并加以研究。參見徐力恒:《華文學(xué)界的數(shù)位人文探索:一種“史前史”的觀察角度》,《中國文哲研究通訊》2020年第2期;舒健:《擁抱“大數(shù)據(jù)”對歷史研究的挑戰(zhàn)》,載舒健編:《大數(shù)據(jù)時代的歷史研究》,上海譯文出版社,2017年,第1-11頁;李友仁:《北美與西歐的數(shù)字人文中國研究狀況論析》,《山東社會科學(xué)》2019年第7期;邱偉云:《我國臺灣數(shù)字人文研究進程(2009—2017)》,《圖書館論壇》2020年第7期。由于中文文本信息處理的獨特性,直到1974年“七八四工程”(漢字信息處理系統(tǒng)工程)建設(shè)和1981年《信息交換用漢字編碼字符集》正式實施,計算機才具備處理中文材料的能力。1986年,我國的臺灣地區(qū)也公布了通用漢字編碼。(6)徐力恒:《華文學(xué)界的數(shù)位人文探索:一種“史前史”的觀察角度》,《中國文哲研究通訊》2020年第2期。這是中文材料數(shù)字開發(fā)和研究的必要條件。從此,計算機和數(shù)字技術(shù)與人文學(xué)術(shù)的關(guān)系越發(fā)密切。1985年,中國社會科學(xué)院文學(xué)研究所開展了古籍?dāng)?shù)字化的初步探索,出版了《十三經(jīng)注疏》《全唐詩》《全唐文》《大藏經(jīng)》等典籍的索引或整理本,并完成了《十三經(jīng)注疏》《諸子集成》以及部分朝代文學(xué)總集的電子化。(7)鄭永曉:《錢鐘書與中國社科院古代典籍?dāng)?shù)字化工程》,《山東社會科學(xué)》2019年第6期。但是,這些成果因最終以紙質(zhì)書籍形式出版,那些“龐大的數(shù)據(jù)庫本身除個別時段曾被少量學(xué)者試用外,其廬山真面目學(xué)界一直未能得見”(8)鄭永曉:《錢鐘書與中國社科院古代典籍?dāng)?shù)字化工程》,《山東社會科學(xué)》2019年第6期。。1990年,中國臺灣史語所與計算中心合作完成“二十五史全文資料庫”(后來擴充為“漢籍電子文獻資料庫”)(9)參見https://hanchi.ihp.sinica.edu.tw/ihp/hanji.htm。。1996年,香港中文大學(xué)建成收錄先秦兩漢至魏晉南北朝所有傳世文獻的“漢達文庫”,后又收錄出土文獻。2005年,在此基礎(chǔ)上成立“劉殿爵中國古籍研究中心”。(10)參見http://www.chant.org/。1997年,香港“迪志文化”與北京“書同文”兩家公司開發(fā)制作《四庫全書》電子光碟。“在其他更大型的資料庫出現(xiàn)之前,‘漢籍’和‘四庫全書’兩個全文資料庫可說是研究中國傳統(tǒng)文史的標(biāo)準(zhǔn)配備。這些工作所起到積累數(shù)位資料的作用,為后來的數(shù)位人文時代奠定了重要基礎(chǔ)?!?11)徐力恒:《華文學(xué)界的數(shù)位人文探索:一種“史前史”的觀察角度》,《中國文哲研究通訊》2020年第2期。數(shù)字人文的興盛、龐大的數(shù)據(jù)、便捷的檢索,為文科建設(shè)帶來了巨大的變化。
近年來,人工智能技術(shù)取得了長足的發(fā)展,并廣泛應(yīng)用于文科建設(shè)。2015年以后,“智能法學(xué)”或“人工智能法學(xué)”的概念出現(xiàn)。中國政法大學(xué)成立大數(shù)據(jù)和人工智能法律研究中心,北京理工大學(xué)成立人工智能法律研究中心,西南政法大學(xué)和上海政法學(xué)院均建立了人工智能法學(xué)院。(12)蘇宇:《“信息技術(shù)+法學(xué)”的教學(xué)、研究與平臺建設(shè):一個整體性的觀察與反思》,《中國法律評論》2021年第6期。2017年,會計、金融等專業(yè)開始出現(xiàn)人工智能的應(yīng)用。(13)鄒玲莉:《人工智能背景下會計人才培養(yǎng)面臨的挑戰(zhàn)與對策》,《經(jīng)貿(mào)實踐》2017年第7期。與此同時,浙江大學(xué)“智慧古籍平臺”將基于大數(shù)據(jù)的計量統(tǒng)計、聚類查詢、數(shù)據(jù)關(guān)聯(lián)等技術(shù)和基于人工智能的OCR識別(“光學(xué)字符識別”)、智能標(biāo)點和標(biāo)引等技術(shù)相結(jié)合,以科技賦能古籍的保護傳承。(14)《讓古籍“活起來” 浙江大學(xué)“智慧古籍平臺”上線》,2021-11-23,http://wwj.zj.gov.cn/art/2021/11/23/art_1639077_58878423.html,訪問日期:2023-10-08。北大數(shù)字人文中心正在開發(fā)的“吾與點”古籍智能處理系統(tǒng),其中的古籍文字識別、自動標(biāo)點和分段等功能也是人工智能技術(shù)在古籍?dāng)?shù)字化中的應(yīng)用。(15)《ChatGPT、人工智能與數(shù)字人文:傳統(tǒng)學(xué)問的科技未來?》,2023-02-21,https://www.thepaper.cn/newsDetail_forward_21973969,訪問日期:2023-10-08。
生成式人工智能產(chǎn)生之后,不斷促進文科建設(shè)的更新迭代。ChatGPT發(fā)布不久,各大瀏覽器以及微軟Office辦公軟件陸續(xù)植入相關(guān)插件,打開智能檢索和寫作的大門;許多筆記軟件則配備了AI助手,能滿足實時問答、圖片轉(zhuǎn)文字或?qū)P記內(nèi)容進行名詞解釋等需求。以各類網(wǎng)盤為主的云儲存產(chǎn)品也開通了智能助理,能夠?qū)W習(xí)用戶儲存的文檔和視頻文件,并提供問答對話服務(wù),能夠總結(jié)文檔內(nèi)容、給出文檔內(nèi)容大綱、學(xué)習(xí)文檔內(nèi)容并給用戶出題、撰寫讀后感以及觀后感等,甚至能給出回答的文獻或者視頻出處。雖然這些回答的準(zhǔn)確性有待提升,但在教育中應(yīng)用生成式人工智能的趨勢已然不可逆轉(zhuǎn)。
2023年7月13日,國家網(wǎng)信辦聯(lián)合國家發(fā)展改革委、教育部等七部門發(fā)布《生成式人工智能服務(wù)管理暫行辦法》(以下簡稱《辦法》),自2023年8月15日起正式施行。該《辦法》是全球首個有關(guān)生成式人工智能的監(jiān)管方案?!掇k法》第二章第五條指出,“鼓勵生成式人工智能技術(shù)在各行業(yè)、各領(lǐng)域的創(chuàng)新應(yīng)用”,“支持行業(yè)組織、企業(yè)、教育和科研機構(gòu)……在生成式人工智能技術(shù)創(chuàng)新、數(shù)據(jù)資源建設(shè)、轉(zhuǎn)化應(yīng)用、風(fēng)險防范等方面開展協(xié)作”。(16)國家網(wǎng)信辦等:《生成式人工智能服務(wù)管理暫行辦法》,2023-07-10,https://www.gov.cn/zhengce/zhengceku/202307/content_6891752.htm,訪問日期:2023-10-08。2023年9月7日,聯(lián)合國教科文組織(UNESCO)發(fā)布《生成式人工智能在教育與研究中的應(yīng)用指南》 (GuidanceforGenerativeAIinEducationandResearch,以下簡稱《指南》)。作為全球首個生成式人工智能應(yīng)用指南,《指南》對生成式人工智能的態(tài)度是謹(jǐn)慎而友好的。它一方面提醒各國政府盡快出臺相關(guān)法律法規(guī),加強對生成式人工智能的監(jiān)管,另一方面呼吁各國鼓勵和支持學(xué)界和教育工作者在教學(xué)和研究中合理利用人工智能技術(shù)。(17)UNESCO,Guidance for Generative AI in Education and Research,2023-09-07,https://unesdoc.unesco.org/ark:/48223/pf0000386693,2023-10-08.
在后信息社會走向縱深之時,人工智能時代接踵而至,信息技術(shù)與人文社科的交叉融合趨勢將進一步加深。從全球來看,數(shù)字人文、生成式人工智能在未來世界高等教育中將占有重要比重,如何提高師生的數(shù)字素養(yǎng)、借力生成式人工智能開啟教育新篇章成為未來高等教育的重中之重?!靶挛目啤笔侨斯ぶ悄軙r代高校推進文科教育、教學(xué)改革的新路徑,應(yīng)在教學(xué)、科研等環(huán)節(jié)充分合理利用生成式人工智能。
過去,數(shù)字技術(shù)和人工智能雖然影響了文科研究和教學(xué)的各個環(huán)節(jié),但通用性不強。舉例來說,制作學(xué)術(shù)地圖涉及的地理信息系統(tǒng)、社科研究常用的社會網(wǎng)絡(luò)分析與統(tǒng)計工具等,仍然需要專業(yè)學(xué)習(xí)才能掌握。而生成式人工智能有望一站式解決問題,消除專業(yè)軟件的使用門檻。一些學(xué)者對數(shù)字人文研究的評價很高,認(rèn)為它代表了今天的學(xué)術(shù)正處于“向新學(xué)術(shù)轉(zhuǎn)變與跨越的門檻上”,如同20世紀(jì)30年代開始的中國現(xiàn)代學(xué)術(shù)轉(zhuǎn)型期那樣。(18)史睿:《數(shù)字人文研究的發(fā)展趨勢》,《文匯報》(上海)2017年8月25日。生成式人工智能的出現(xiàn),不僅加快了學(xué)術(shù)轉(zhuǎn)型的步伐,也全面推進了教育教學(xué)改革,為新文科發(fā)展帶來了新的機遇。
在教育教學(xué)領(lǐng)域,生成式人工智能可能在新文科的教育格局、教育目標(biāo)、教育理念、教學(xué)方法、教學(xué)內(nèi)容等方面引發(fā)巨大的變革。首先,生成式人工智能改變了文科的知識生產(chǎn)方式,逐步推動了新文科教育數(shù)字化轉(zhuǎn)型,改變了傳統(tǒng)文科的教育格局。面對一個有可能“無所不知”的人工智能,教育工作者應(yīng)當(dāng)重新思考:人工智能時代文科的教育目標(biāo)是什么?新文科教育如何在與人工智能的對話中尋求新的育人之路、發(fā)展之道?新文科建設(shè)需要什么樣的人工智能學(xué)習(xí)和科研平臺,需要什么樣的新興學(xué)科、專業(yè)、課程和學(xué)位授權(quán)點?
其次,生成式人工智能改變了傳統(tǒng)的教學(xué)形式,為新文科建設(shè)重塑教學(xué)模式提供了時代契機。新的人工智能時代,為什么學(xué)習(xí),學(xué)習(xí)什么,怎么學(xué)習(xí)?學(xué)校、課堂和教師的角色和功能將如何調(diào)整?過去的教學(xué)方法和教學(xué)內(nèi)容還適用嗎?如果生成式人工智能進入課堂之后,課堂對話是否會由師生之間的人際交流演變?yōu)閹熒c人工智能之間的“人機交流”?這些問題是新文科建設(shè)不得不面對的重要議題。以課堂教學(xué)為例,生成式人工智能將逐漸改變師生的互動方式,改變傳統(tǒng)的教學(xué)方法。盡管生成式人工智能的總體發(fā)展還有很長一段路要走,但專門用于教育教學(xué)的大模型如各類EduGPT的技術(shù)突破可能會先一步到來。例如,華東師范大學(xué)計算機科學(xué)與技術(shù)學(xué)院EduNLP團隊研發(fā)的教育領(lǐng)域?qū)υ挻竽P虴duChat,能夠支持多樣化的教學(xué)場景,滿足師生個性化的學(xué)習(xí)要求。(19)參見https://www.educhat.top/。值得注意的是,生成式人工智能具有針對不同特點的學(xué)生因材施教的能力,這是傳統(tǒng)教育欠缺的地方。在2023第二十屆上海教育博覽會舉行的“人工智能與教育未來”高峰論壇上,上海師范大學(xué)校長袁雯在以《教育強國:人工智能與教育之變》為題的報告中總結(jié)了人工智能服務(wù)教育本質(zhì)的四個要點,也是對未來人工智能發(fā)展的美好展望,包括:提升學(xué)習(xí)效率,減少重復(fù);關(guān)注個體,激發(fā)學(xué)習(xí)者的潛能;消除差異,促進教育公平;在集體中發(fā)現(xiàn)和培養(yǎng)人才。(20)《大咖說|上海師大校長袁雯:人工智能時代,教育之“適變”“自變”與“不變”》,2023-10-05,https://mp.weixin.qq.com/s/Wgyif9RBZGyPuDw4vKxJ4w,訪問日期:2023-10-08。新文科建設(shè)中討論的開放式學(xué)習(xí)、深度學(xué)習(xí)、精準(zhǔn)學(xué)習(xí)、自主學(xué)習(xí)和個性化學(xué)習(xí)可能會提前到來。
最后,在教學(xué)資源、教學(xué)工具方面,生成式人工智能將逐漸改變信息獲取方式,大幅提升教與學(xué)的效率。舉例來說,生成式人工智能通過強大的數(shù)據(jù)檢索和組織能力,可以在最短的時間內(nèi)生成課程需要的文本、圖像、音頻或視頻內(nèi)容;輔助教師批閱作業(yè),大大縮短教師的工作量。例如,專用于批改學(xué)生作文、針對性提出修改建議的“批改網(wǎng)”(智能批改英語作文在線服務(wù)系統(tǒng))已經(jīng)被使用多年。
在學(xué)術(shù)研究領(lǐng)域,生成式人工智能對新文科未來的學(xué)術(shù)范式、研究方法、研究問題以及具體研究工作的開展等將產(chǎn)生較大影響。首先,強大的計算量、龐大的數(shù)據(jù)量、智能的訓(xùn)練方法、快速的寫作能力,推動著學(xué)術(shù)研究新范式(21)顧小清:《ChatGPT對教育生態(tài)的影響》,《探索與爭鳴》2023年第3期。、新格局的出現(xiàn),助推新文科數(shù)字化轉(zhuǎn)型的持續(xù)性展開。2007年,計算機科學(xué)家吉姆·格雷就曾宣稱,“科學(xué)世界發(fā)生了變化,對此毫無疑問。新的研究方式是通過儀器捕獲數(shù)據(jù)或通過計算機模擬生成數(shù)據(jù),然后用軟件進行處理,并且將所得到的信息或知識存儲在計算機中??茖W(xué)家們只是在這個系列過程中的最后階段才開始審視他們的數(shù)據(jù)。這種數(shù)據(jù)密集型科學(xué)的技術(shù)和方法是如此不同,因此值得將數(shù)據(jù)密集型科學(xué)與計算科學(xué)區(qū)分開來,作為科學(xué)探索的新的第四范式。”(22)轉(zhuǎn)引自董春雨、薛永紅:《數(shù)據(jù)密集型、大數(shù)據(jù)與“第四范式”》,《自然辯證法研究》2017年第5期。米加寧等學(xué)者認(rèn)為,人文社會科學(xué)領(lǐng)域的四個范式分別是社會科學(xué)的定性分析、社會科學(xué)的定量研究、社會科學(xué)的計算實驗的仿真研究、基于數(shù)據(jù)科學(xué)的大數(shù)據(jù)研究。(23)米加寧、章昌平等:《第四研究范式:大數(shù)據(jù)驅(qū)動的社會科學(xué)研究轉(zhuǎn)型》,《學(xué)?!?018年第2期。同時,生成式人工智能還可以充當(dāng)科研助理、PPT制作助理等角色。研究人員只需要向人工智能提問,就能從完整的知識系統(tǒng)中獲取需要的那一部分內(nèi)容。未來人文學(xué)者不需要掌握非常專業(yè)的編程技術(shù),就能更深度地參與相關(guān)研究;涉古專業(yè)研究人員不需要深厚的目錄學(xué)知識,就能快速浸入海量的古代文獻之中。“人機交互”的研究方式、工作方式將大幅度降低專業(yè)門檻的要求,降低專業(yè)知識的束縛,推動跨學(xué)科、跨領(lǐng)域的學(xué)術(shù)研究快速到來。
其次,從研究方法和操作層面來說,根據(jù)指定專業(yè)、領(lǐng)域、主題、時間、關(guān)鍵詞等信息,生成式人工智能可以快速查找文獻資料,自動篩選代表性論文,生成文獻綜述和論文的常規(guī)結(jié)構(gòu),提供專業(yè)的寫作指導(dǎo),大幅度提高學(xué)術(shù)研究的效率。在選題調(diào)研階段,研究人員通過關(guān)鍵詞提問、命令,或進行持續(xù)的綜合性問答,讓生成式人工智能完成概念解釋、資料檢索和整理等基礎(chǔ)工作,有助于研究人員追蹤某一領(lǐng)域的科研成果和參考文獻等。在研究中期,有較多工作量的任務(wù)如文本挖掘、情感分析、主題分析等也可以利用生成式人工智能輔助完成。對于需要較高思維水平的寫作,人工智能可以輔助研究人員高效完成構(gòu)思、素材收集、內(nèi)容校對等基本環(huán)節(jié)。同時,生成式人工智能還能輸出圖像、音頻和視頻,這就為科研成果可視化以及演講報告帶來極大的便利。有的學(xué)者把這種科研工作方法稱為人工智能對學(xué)術(shù)的“滲透”,甚至“入侵”。(24)王峰:《生成式人工智能與文學(xué)知識系統(tǒng)的創(chuàng)新》,《文藝爭鳴》2023年第7期。2023年7月7日,Nature新聞欄目刊登的一篇討論性文章稱,在生成式人工智能的幫助下,科學(xué)家用了不到1小時就完成了一篇研究論文。(25)Scientists Used ChatGPT to Generate an Entire Paper from Scratch — But is it Any Good?2023-07-07,https://www.nature.com/articles/d41586-023-02218-z,2023-10-08.
最后,隨著信息技術(shù)的不斷發(fā)展,生成式人工智能將不斷拓寬新文科的學(xué)術(shù)視野,開辟新的學(xué)術(shù)空間。以文學(xué)研究為例,未來由人工智能創(chuàng)作的文學(xué)作品會不斷涌現(xiàn),大量新的研究話題會不斷產(chǎn)生,并對現(xiàn)有的創(chuàng)作和研究理論造成強有力的沖擊。例如,元宇宙中的文學(xué)與藝術(shù)生產(chǎn),作為讀者的人工智能與接受美學(xué),甚至人工智能的解釋學(xué)等話題將逐漸從科學(xué)幻想走向現(xiàn)實。需要引起重視的是,生成式人工智能逐漸“入侵”傳統(tǒng)寫作領(lǐng)域。雖然目前人工智能還處于初級階段,聯(lián)想和想象的能力很弱,但從前些年微軟“小冰”創(chuàng)作并出版的現(xiàn)代詩、清華“九歌”創(chuàng)作的古詩詞到最近亞馬遜平臺上線的200多本署名為ChatGPT的電子書,(26)《“書籍海嘯”時代到來:一切都不再是原創(chuàng),但讀者喜歡?》,2023-07-11,https://www.bjnews.com.cn/detail/1689042597169551.html,訪問日期:2023-10-08。生成式人工智能表現(xiàn)出的“創(chuàng)作力”不容小覷。未來若將AI作家與傳統(tǒng)作家放在一起評判,最高產(chǎn)的詩人不再是陸游、楊萬里,而是一天就可以寫幾百首古體詩的AI作家。生成式人工智能同時還是閱讀面最廣的讀者、掌握資料最多的評論家。這些都將為文學(xué)闡釋帶來新的討論空間。
生成式人工智能的出現(xiàn),使新文科建設(shè)迎來了重要的轉(zhuǎn)折點。但是,生成式人工智能在廣泛應(yīng)用的同時,也帶來了不可預(yù)期的風(fēng)險和挑戰(zhàn)。舉例來說,生產(chǎn)誤導(dǎo)性信息,侵害知識產(chǎn)權(quán),因技術(shù)濫用造成的數(shù)據(jù)安全、數(shù)據(jù)污染等問題屢見不鮮。網(wǎng)信辦聯(lián)合教育部等七部門公布的《辦法》第二章第七條明確要求生成式人工智能服務(wù)提供者要“依法開展預(yù)訓(xùn)練、優(yōu)化訓(xùn)練等訓(xùn)練數(shù)據(jù)處理活動”,并給出具體要求,包括數(shù)據(jù)來源合法、不侵害他人知識產(chǎn)權(quán)、個人信息取用合法以及提高訓(xùn)練數(shù)據(jù)質(zhì)量等。(27)國家網(wǎng)信辦等:《生成式人工智能服務(wù)管理暫行辦法》,2023-07-10,https://www.gov.cn/zhengce/zhengceku/202307/content_6891752.htm,訪問日期:2023-10-08。這從一個側(cè)面說明,當(dāng)前生成式人工智能在真實性、準(zhǔn)確性、客觀性、多樣性等方面仍存在缺陷。
從生成內(nèi)容來說,目前生成式人工智能輸出的內(nèi)容仍存在真實性、準(zhǔn)確性等問題,這與模型訓(xùn)練數(shù)據(jù)來源的復(fù)雜、算法選擇的偏見甚至遭受惡意攻擊等因素有關(guān)。在使用人工智能的過程中,人機需要進行多輪對話才能得到較為理想的內(nèi)容。同時,生成式人工智能大模型訓(xùn)練時所用的數(shù)據(jù)過于龐大,一經(jīng)預(yù)訓(xùn)練后又無法對數(shù)據(jù)進行檢測,所以它們輸出內(nèi)容的過程缺乏透明度和可解釋性。雖然總體方法(包括所使用的算法)通常是可以解釋的,但特定的模型及其參數(shù)是不可檢驗的。目前尚不能夠在GPT模型經(jīng)過訓(xùn)練后將某條數(shù)據(jù)單獨刪除,(28)關(guān)于大模型訓(xùn)練數(shù)據(jù)無法刪除,及其帶來的遞歸風(fēng)險、倫理問題等,參見UNESCO,Guidance for Generative AI in Education and Research,2023-09-07,https://unesdoc.unesco.org/ark:/48223/pf0000386693,2023-10-08.這就為將來的GPT模型帶來了遞歸風(fēng)險,即未來的模型在生成文本時,還可能會用到以前的模型生產(chǎn)的錯誤文本。因此,生成式人工智能輸出的信息并非百分之百準(zhǔn)確,甚至可能是虛假信息和惡意制造的信息。人工智能科學(xué)家的實證研究表明,ChatGPT可能在特定主題的對話中產(chǎn)生“幻覺”內(nèi)容。所謂“幻覺”(Hallucination),即“模型可能會生成文本來描述現(xiàn)實中并不存在的情況,還可能會生成與常識或?qū)I(yè)知識有沖突的文本”(29)參見Junyi Li,Xiaoxue Cheng,Wayne Xin Zhao,et al.,HaluEval:A Large-Scale Hallucination Evaluation Benchmark for Large Language Models,2023-05-22,https://arxiv.org/pdf/2305.11747.pdf,2023-10-09.柯沛、雷文強、黃民烈:《以ChatGPT為代表的大型語言模型研究進展》,《中國科學(xué)基金》,網(wǎng)絡(luò)首發(fā),2023年10月10日。,這對生成式人工智能的研究和應(yīng)用均會產(chǎn)生負(fù)面影響。聯(lián)合國教科文組織發(fā)布的《指南》指出,由于缺乏嚴(yán)格的法規(guī)和有效的監(jiān)測機制,生成式人工智能輸出的錯誤材料越來越多地在互聯(lián)網(wǎng)上傳播,增加了數(shù)據(jù)污染的風(fēng)險。(30)UNESCO,Guidance for Generative AI in Education and Research,2023-09-07,https://unesdoc.unesco.org/ark:/48223/pf0000386693,2023-10-08.也就是說,在使用生成式人工智能的過程中,使用者需要有一定的專業(yè)素養(yǎng)。生成的內(nèi)容不能直接用于教學(xué)和科研,否則那些錯誤、虛假、零碎的知識有可能在課堂上蔓延。學(xué)生以人工智能作為自學(xué)工具,也要小心謹(jǐn)慎地使用,避免在不知不覺中接受了膚淺或者錯誤的內(nèi)容。
從生成方式來說,由生成式人工智能輸出的內(nèi)容可能存在侵犯知識產(chǎn)權(quán)、隱私權(quán)等問題。生成式人工智能的基礎(chǔ)是大數(shù)據(jù),而這些數(shù)據(jù)通常是從互聯(lián)網(wǎng)上搜集、整理出來的。如何判定作者,是否侵犯知識產(chǎn)權(quán),能否發(fā)表或者出版,對于教學(xué)和科研而言都是至關(guān)重要的。同時,無法在大模型中單獨刪除個別數(shù)據(jù)這一限制,(31)UNESCO,Guidance for Generative AI in Education and Research,2023-09-07,https://unesdoc.unesco.org/ark:/48223/pf0000386693,2023-10-08.也意味著個人信息一旦泄露就可能造成難以挽回的后果。研究人員、教師和學(xué)生應(yīng)該對人工智能生成的文本和圖像等的出處多加注意,謹(jǐn)慎判斷、檢驗和使用相關(guān)資源。舉例來說,人工智能撰寫或提供思路的文章是否應(yīng)當(dāng)發(fā)表?使用人工智能創(chuàng)作的質(zhì)量較高的內(nèi)容,是否需要在文中提及?是否應(yīng)署名人工智能?顯然,全面禁止并不可行。目前,在新文科建設(shè)的背景之下,學(xué)界和教育界應(yīng)該關(guān)注并思考如何將有關(guān)技術(shù)應(yīng)用于教學(xué)、科研,如何實施長期有效的監(jiān)管、審查,如何明確生成式人工智能可能出現(xiàn)的違規(guī)、違法行為,制定并及時更新相關(guān)行為準(zhǔn)則,避免學(xué)術(shù)誠信在人工智能時代走向岌岌可危的局面。隨著技術(shù)發(fā)展,作者撰寫文章乃至編輯審核文章都可能會用到更多人工智能工具。彼時,期刊論文發(fā)表的各方面主體都應(yīng)履行聲明義務(wù),給予讀者明確的信息。(32)高奇琦:《知識革命還是知識墮化——ChatGPT與知識生成秩序》,《中國社會科學(xué)評價》2023年第2期。例如,標(biāo)記人工智能生成的內(nèi)容、承擔(dān)的工作等。另外,有的行業(yè)已經(jīng)開辟人工智能“專用通道”。2023年3月,完全由人工智能生成內(nèi)容的新聞平臺NewsGPT開始運營。這種運營方式,給新聞傳媒等專業(yè)帶來了巨大的沖擊。
從技術(shù)應(yīng)用來說,生成式人工智能減少了大量簡單、重復(fù)、無趣的教學(xué)和科研服務(wù),減輕了教師和學(xué)生的負(fù)擔(dān),無形之中也增強了人們對人工智能的依賴。對技術(shù)及其產(chǎn)品的過度依賴會逐漸改變?nèi)说乃伎己托袨榉绞剑谖磥淼男挛目平ㄔO(shè)中需要警惕教師和學(xué)生基礎(chǔ)知識與能力的弱化。舉例來說,當(dāng)下學(xué)生原典閱讀能力普遍下降。從閱讀目的來看,學(xué)生借助高度發(fā)達的互聯(lián)網(wǎng)和信息檢索技術(shù),閱讀變得更加功利,“直接后果就是對經(jīng)典的疏離”(33)徐振:《教學(xué)過程中文學(xué)經(jīng)典深入人心的四種路徑》,《高等教育研究學(xué)報》2018年第2期。。從閱讀方式來看,碎片化閱讀成為主流閱讀方式,淺嘗輒止取代了深思熟慮。同時,學(xué)生借助各種基于原典二次創(chuàng)作的文本、圖片、視頻獲得相關(guān)知識,制造出“偽閱讀”(34)關(guān)于數(shù)字化閱讀時代曾引起教育界熱議的“偽閱讀”現(xiàn)象,可以參考吳晞的介紹:“所謂‘偽閱讀’,意謂不是真的在讀書,而是假讀書,尤其是不愿意下功夫研讀大部頭書、古文書、外文書。即便是一些以治學(xué)為生的所謂讀書人,也只是熱衷于走捷徑、找竅門、淺嘗輒止,或只是看一些零星的二手資料混日子?!眳⒁妳菚劊骸丁皞伍喿x”及其他》,《圖書館論壇》2016年第11期。的假象?;ヂ?lián)網(wǎng)和數(shù)字技術(shù)的高速發(fā)展、古籍?dāng)?shù)據(jù)庫的強大檢索功能與學(xué)生經(jīng)典原典閱讀量不足、基礎(chǔ)知識薄弱形成了鮮明對比。在未來人工智能龐大的數(shù)據(jù)庫資源的支持下,這種對比會加劇。舉例來說,2006年,谷歌推出了一款名為“谷歌寫作”的AI寫作工具,可以自動生成簡單的文章摘要和標(biāo)題;2009年,微軟研究院推出了一款名為“小冰”的AI寫作聊天機器人,可以進行自然語言對話和文本生成;2014年,OpenAI推出了一款名為“GPT”的AI寫作模型,可以生成更高級的文本和文章;2016年,微軟推出了“微軟小冰2.0”,進一步提高了自然語言處理和文本生成的能力……從簡短的自然語言對話到后來高質(zhì)量文本的生成,AI寫作的功能實現(xiàn)了質(zhì)的飛躍。但是,AI寫作的使用門檻低,它提供的海量信息和自動化生成可以幫助學(xué)生完成日常作業(yè)甚至撰寫論文。學(xué)生為了達到完成作業(yè)的目標(biāo)更傾向于使用人工智能,這在提高學(xué)習(xí)效率的同時,也減少了學(xué)生深度思考的機會,不利于學(xué)生學(xué)習(xí)遷移能力的發(fā)展。(35)朱永新、楊帆:《ChatGPT/生成式人工智能與教育創(chuàng)新:機遇、挑戰(zhàn)以及未來》,《華東師范大學(xué)學(xué)報(教育科學(xué)版)》2023年第7期。同時,學(xué)生選擇AI寫作時可能對他人的作品形成侵權(quán)糾紛或剽竊抄襲,形成不良的誠信觀和價值觀。國內(nèi)外一些高校禁止學(xué)生使用生成式人工智能,正是出于這種擔(dān)憂。(36)易憲容:《ChatGPT對人類社會運行機制的四種影響》,《探索與爭鳴》2023年第3期。
不僅如此,在生成式人工智能產(chǎn)生以后,以往數(shù)字人文研究中的“路徑依賴”明顯增強。學(xué)者們回顧數(shù)字人文“史前史”時期的研究發(fā)現(xiàn),當(dāng)今數(shù)字人文的主要研究方法即使用資料庫及相關(guān)檢索工具,很少有使用其他各類數(shù)字工具的動機,一定程度上造成了數(shù)字人文研究方法的路徑依賴。(37)徐力恒:《華文學(xué)界的數(shù)位人文探索:一種“史前史”的觀察角度》,《中國文哲研究通訊》2020年第2期。還有學(xué)者認(rèn)為,從索引工具開發(fā)到全文檢索,其研究邏輯依然是傳統(tǒng)的,并沒有范式上的創(chuàng)新。(38)項潔、翁稷安:《數(shù)位人文和歷史研究》,載項潔編:《數(shù)位人文在歷史學(xué)研究的應(yīng)用》,臺灣大學(xué)出版中心,2011年,第 18頁。以 ChatGPT 為代表的人工智能出現(xiàn)以后,這種路徑依賴非但沒有減少,還將向縱深發(fā)展。
人工智能技術(shù)的快速發(fā)展正深刻改變著高等教育,也影響著未來的新文科建設(shè)。盡管它還有很多弊端,也存在著風(fēng)險,但不可否認(rèn)的是人工智能與新文科建設(shè)深度融合的時代已經(jīng)到來。在這樣的大環(huán)境下,怎樣才能更好地利用生成式人工智能促進新文科的發(fā)展建設(shè),是我們必須深入思考的問題。
從培養(yǎng)方案來說,在“新文科”建設(shè)的導(dǎo)向下,未來教育應(yīng)以培養(yǎng)復(fù)合型文科人才為目標(biāo),重新思考教育理念、教學(xué)方法,優(yōu)化學(xué)科體系和課程內(nèi)容。教育變革的主要特點在于“從‘教的效率’轉(zhuǎn)向‘育的本質(zhì)’”,“從知識傳承轉(zhuǎn)向知識創(chuàng)新”。(39)朱世強:《人工智能驅(qū)動未來教育變革》,《中國社會科學(xué)報》2023年5月26日。教師要做的不僅是知識的傳授,更是引導(dǎo)學(xué)生會學(xué)習(xí)、會思考、會創(chuàng)新。正確引導(dǎo)學(xué)生學(xué)習(xí)人工智能的運行原理和應(yīng)用方法,學(xué)習(xí)人工智能時代迫切需要的技術(shù)和內(nèi)容,幫助師生適應(yīng)時代發(fā)展和社會需求。近年來,國內(nèi)許多高校的文科院系都開設(shè)了與人工智能、數(shù)字人文相關(guān)的暑期學(xué)校、工作坊。例如,四川大學(xué)文學(xué)與新聞學(xué)院網(wǎng)絡(luò)與新媒體專業(yè)本科生的培養(yǎng)方案里設(shè)置了“編程基礎(chǔ)”這門課程,需要一定技術(shù)基礎(chǔ)的社會關(guān)系分析和數(shù)據(jù)統(tǒng)計工具也成為專業(yè)學(xué)生必備的技能。浙江大學(xué)智慧古籍平臺和學(xué)術(shù)地圖發(fā)布平臺連續(xù)幾年舉行暑期實踐。這些實踐一方面促進了平臺的建設(shè),另一方面也讓學(xué)生學(xué)習(xí)并鍛煉了古籍OCR識別、文本標(biāo)注、地理信息系統(tǒng)運用等基礎(chǔ)技能。2023年下半年,四川大學(xué)與哈佛大學(xué)將聯(lián)合舉辦數(shù)字人文工作坊,旨在培養(yǎng)兼具人文學(xué)者問題視角與理工學(xué)者實踐能力的跨專業(yè)高水平學(xué)術(shù)人才,并探索學(xué)科融合與文理交叉的邊界。蘇州大學(xué)還設(shè)想過成立數(shù)字人文專業(yè)實驗班,以期結(jié)合數(shù)字素養(yǎng)和人文素養(yǎng),重塑人文專業(yè)教學(xué)模式。(40)周毅、李卓卓:《新文科建設(shè)的理路與設(shè)計》,《中國大學(xué)教學(xué)》2019年第6期。值得注意的是,在新文科建設(shè)和生成式人工智能融合的過程中,教育者應(yīng)更加關(guān)注教育公平、資源共享,盡量避免進一步加劇不同學(xué)生群體在技術(shù)和教育資源方面的差距。
從教學(xué)主體來說,要重視新文科背景下的教師隊伍建設(shè),充分提升教師數(shù)字人文素養(yǎng)。未來新文科課堂將融入更多的數(shù)字化、智能化資源,教師需要提升自身的數(shù)字人文素養(yǎng),加強對生成式人工智能的學(xué)習(xí)和使用。舉例來說,教師可以開展人機協(xié)同教學(xué)。在課前,教師可以利用人工智能整合教育資源、設(shè)計教案和收集學(xué)生信息;上課時,可以實時人機互動,開展課堂練習(xí),及時獲取學(xué)生反饋;下課后,人機協(xié)同批改作業(yè),提高工作效率。教師與學(xué)生組成的二元結(jié)構(gòu)真正擴容為“教師—機器—學(xué)生”三位一體的三元結(jié)構(gòu),教師的任務(wù)也將“由知識傳授轉(zhuǎn)變?yōu)橹R創(chuàng)造”。(41)劉利、周小兵、高雪松等:《“ChatGPT來了:國際中文教育的新機遇與新挑戰(zhàn)”大家談(上)》,《語言教學(xué)與研究》2023年第3期。聯(lián)合國教科文組織發(fā)布的《指南》建議世界各國通過培訓(xùn)和持續(xù)指導(dǎo),加強建設(shè)教師和研究人員在教育和研究中適當(dāng)使用生成式人工智能的能力。例如,新加坡通過其人工智能政府云集群(AGCC)提供了一個專門的平臺以支持教育機構(gòu)利用人工智能,其中還包括一個專門的GPT模型存儲庫。(42)UNESCO,Guidance for Generative AI in Education and Research,2023-09-07,https://unesdoc.unesco.org/ark:/48223/pf0000386693,2023-10-02.此外,應(yīng)組建專門的教育教學(xué)數(shù)據(jù)庫,訓(xùn)練專精于教育的生成式人工智能。有規(guī)劃、有導(dǎo)向地控制數(shù)據(jù)來源,提高真實、準(zhǔn)確數(shù)據(jù)的權(quán)重,清洗、剔除劣質(zhì)數(shù)據(jù),提高大模型的精準(zhǔn)度,使生成內(nèi)容具有可控和可驗證性。高等教育方面相關(guān)的人工智能雖然還未出現(xiàn),但可以用來訓(xùn)練的數(shù)據(jù)資源有很多,如各學(xué)科經(jīng)典教材、原典名著,學(xué)術(shù)論著和學(xué)術(shù)檢索數(shù)據(jù)庫,線上課程學(xué)習(xí)平臺以及各類數(shù)字人文成果等。
從學(xué)科建設(shè)來說,面對智能時代的諸多復(fù)雜問題,新文科建設(shè)應(yīng)積極推動學(xué)科交叉融合和跨學(xué)科研究。目前,文科學(xué)科發(fā)展存在著一個重要的問題,就是學(xué)科之間的互動性不夠強,交叉融合度不高。傳統(tǒng)的學(xué)科劃分日益細化,學(xué)科之間的隔閡也隨之?dāng)U大,學(xué)科知識體系的整體性、綜合性和全局性受到影響,形成了較為狹隘的思維方式與較為固定的學(xué)科范式——“孤立、靜止、片面地研究某一領(lǐng)域”。(43)參見王丹:《人類命運共同體引領(lǐng)下的高校新文科建設(shè)與人才培養(yǎng)》,《華南師范大學(xué)學(xué)報(社會科學(xué)版)》2023年第1期;劉曙光:《新文科與思維方式、學(xué)術(shù)創(chuàng)新》,《上海交通大學(xué)學(xué)報(哲學(xué)社會科學(xué)版)》2020年第2期。不同學(xué)科之間的交流不足影響了學(xué)生知識面的拓展,復(fù)合型文科人才的培養(yǎng)受到阻礙。舉例來說,可以加強文學(xué)學(xué)科與其他學(xué)科(如計算機科學(xué)、心理學(xué)等)的交流合作,可以通過組織各種類型的學(xué)術(shù)會議等形式建立跨學(xué)科交流平臺,讓來自不同學(xué)科的專家、學(xué)者有機會共同討論問題,分享研究成果和經(jīng)驗,開展跨學(xué)科研究項目,利用計算機科學(xué)、數(shù)據(jù)科學(xué)等技術(shù)發(fā)展數(shù)字人文,減少人文社會領(lǐng)域中不同學(xué)科之間的隔閡,更好地理解和應(yīng)對人工智能帶來的挑戰(zhàn)。
從技術(shù)規(guī)范來說,在新文科建設(shè)中應(yīng)用生成式人工智能,必須制定和完善相關(guān)準(zhǔn)則和制度。一是在理念層面,技術(shù)應(yīng)用應(yīng)堅持以人為本,重視人工智能技術(shù)可能帶來的道德倫理和法律問題。二是在制度層面,國家相關(guān)部門應(yīng)當(dāng)加強信息安全建設(shè),制定數(shù)據(jù)保護法規(guī),保護個人隱私、防止數(shù)據(jù)泄露,并提供相關(guān)的維權(quán)渠道,切實保障個人的合理權(quán)益。針對道德倫理問題,可以設(shè)立由專家、學(xué)者、法律顧問等組成的人工智能倫理委員會,對人工智能的發(fā)展和應(yīng)用進行監(jiān)督。加強對教師和學(xué)生的教育引導(dǎo),讓他們認(rèn)識到誠信與創(chuàng)新意識在人工智能時代的重要性,培養(yǎng)正確的價值觀和道德觀。三是在技術(shù)層面,研發(fā)可以檢測生成式人工智能的技術(shù)產(chǎn)品,識別是否存在考試作弊、剽竊抄襲等問題,提高人工智能應(yīng)用的透明度。
2010年之后,隨著信息技術(shù)的快速發(fā)展,生成式人工智能逐漸成為學(xué)界和教育界的熱門話題。時至今日,它已經(jīng)成為新一輪教育教學(xué)改革的核心驅(qū)動力,正對新文科建設(shè)的方方面面產(chǎn)生著深遠的影響。一方面,它給新文科建設(shè)帶來了極大的便利,促進了新文科教學(xué)和研究范式的轉(zhuǎn)型,引發(fā)學(xué)界重新思考教研的目標(biāo)、理念、內(nèi)容和方法等問題。另一方面,它也給新文科建設(shè)帶來了很多挑戰(zhàn)。生成式人工智能技術(shù)的不穩(wěn)定性、不確定性和侵犯知識產(chǎn)權(quán)等問題層出不窮。面對人工智能技術(shù)的新發(fā)展,新文科建設(shè)乃至于整個高等教育應(yīng)當(dāng)持友好而謹(jǐn)慎的態(tài)度?!叭斯ぶ悄?文科”研究的核心歸根到底還是在人,而人工智能只是一個輔助工具。哲學(xué)社會科學(xué)工作者在科研與教學(xué)中使用人工智能服務(wù)時要堅持以人為本的理念,正視人工智能帶來的變革與風(fēng)險,合理適當(dāng)利用新技術(shù),從價值導(dǎo)向、課程設(shè)置、教師培養(yǎng)、學(xué)科交叉等方面助推人工智能與新文科的建設(shè)。既要學(xué)習(xí)接受新技術(shù)和新問題,積極探索新領(lǐng)域和新方向,理解掌握新知識和新方法,還要謹(jǐn)防新風(fēng)險和新挑戰(zhàn)。