陸偉 劉家偉馬永強 程齊凱
(1.武漢大學信息管理學院,武漢,430072;2.武漢大學信息檢索與知識挖掘研究所,武漢,430072)
作為新一代專注于對話生成的語言模型[1],ChatGPT能夠根據(jù)用戶的輸入文本,利用自身強大的自然語言理解和生成能力產生自然流暢的回答,很多時候,還可以在多輪實時互動過程中給出問題的合理答案。一經推出,月活用戶量迅速過億[2],更是引發(fā)了各界廣泛熱烈的討論。除了具備根據(jù)上下文進行多輪對話問答的能力,ChatGPT還在信息抽取、文章撰寫、代碼生成、自動摘要、翻譯等場景展現(xiàn)了出色的性能,使得原本被認為不太可能的通用人工智能重新顯現(xiàn)了希望,也帶來了人機智能交互與協(xié)同新突破。比爾蓋茨甚至認為ChatGPT這類技術將變得和PC互聯(lián)網一樣重要[3]。下面我們將對ChatGPT的本質及其系列模型核心技術特征演進路徑進行分析,并以此為導線探析大模型對信息資源管理學科研究與實踐帶來的影響。
ChatGPT本質上是一個基于生成式預訓練語言模型GPT(Generative Pre-trained Transformer)[4]進一步開發(fā)的對話式生成模型。GPT與BERT[5]這兩類預訓練模型都采用了Transformer[6]作為底層結構,但BERT使用的是Transformer的Encoder,屬于雙向語言模型,而GPT則使用Decoder進行了單向語言模型的預訓練。GPT系 列 模型主 要 包含GPT[4],GPT-2[7],GPT-3[8],InstructGPT[9],GPT-3.5和ChatGPT。為了便于比較和理解ChatGPT演進過程[10],圖1梳理了GPT系列模型在各個階段的典型特征和關鍵改進。
圖1 ChatGPT 各個階段的典型特征和演進路徑Fig. 1 Typical Characteristics and Evolution Paths of ChatGPT at Each Stage
OpenAI目前還未發(fā)布ChatGPT對應的論文。綜合各方面的信息,ChatGPT是以GPT-3.5為底座,引入基于人類反饋的強化學習(Reinforcement Learning with Human Feedback,RLHF)[11]和高質量人機對話數(shù)據(jù),通過大規(guī)模分布式集群訓練得到。
ChatGPT成功的關鍵之一是使用了超大規(guī)模的預訓練語料并擁有超千億規(guī)模的模型參數(shù)。根據(jù)Chung等學者的研究[12],模型參數(shù)規(guī)模在大于62億的情況下,才能涌現(xiàn)出之前較小模型不具備的能力,而ChatGPT的參數(shù)據(jù)估計是1750億。基于海量規(guī)模的語料訓練,并應用所謂的上下文學習機制(In-Context Learning),ChatGPT可以適應廣泛的下游任務,在低資源和零數(shù)據(jù)場景下有較好的語言理解和生成能力。
除此之外,ChatGPT另一個重要工作是引入了RLHF,利用人類的偏好作為獎勵信號來微調模型,使得模型生成內容與人類常識、認知、需求、價值觀保持一致,理解人類語言和完成人類指令,由此生成的回復符合人的選擇偏好。同時,這也讓ChatGPT與之前的大模型相比,其對話生成實現(xiàn)了從命令驅動到意圖驅動的轉換。
在此基礎上,ChatGPT另外一個關鍵點是使用了高質量和多樣化的數(shù)據(jù),包括OpenAI搜集的歷史對話數(shù)據(jù)、人工精細化標注的多輪對話數(shù)據(jù)和候選項比較排序數(shù)據(jù)。通過高質量多樣化的數(shù)據(jù)微調、偏好獎勵引導優(yōu)化,讓模型能夠充分理解人類指令輸入的意圖,也為提升模型訓練穩(wěn)定性和性能上限提供了支持。
基于對ChatGPT本質及其系列模型核心技術特征演進路徑的分析,我們從支撐算法與技術、信息資源建設、信息組織與信息檢索、信息治理、內容安全與評價、人機智能交互與協(xié)同六個角度探析大模型對信息資源管理學科研究與實踐帶來的影響,形成以下觀點:
現(xiàn)有各類抽取、識別、分類、生成等細分領域的大部分任務主要使用大量標注數(shù)據(jù)、訓練或微調的范式,大模型技術的探索和應用相對較少,性能和效率還存在較大進步空間。未來需要優(yōu)化大數(shù)據(jù)的使用,完善相應的數(shù)據(jù)質量和效用評價機制,在大模型底座的加持下,要探索更加高效的算法,用好“小”而“精”的高質量領域數(shù)據(jù)。此外,隨著以ChatGPT為代表的大模型帶來的能力突破,各類抽取、識別、分類、生成等領域細分的大部分任務不再需要花費大量資金和人員去進行大規(guī)模標注,而是要探索運用低資源、零樣本提示學習思想,研發(fā)高效可遷移的算法技術,基于領域知識設計相應的指令,直接讓大模型生成任務結果,讓科研試錯更高效,集中更多精力在機理機制的發(fā)現(xiàn)和分析上。
ChatGPT“黑盒”式的生成機制大大地削弱了其在關鍵場景的應用價值。例如,在輔助梳理相關研究的場景中,有研究發(fā)現(xiàn)[13],ChatGPT生成的文獻綜述,文字整體看起來流暢,但是其中包含的參考文獻可能實際并不存在。人在總結相關工作時會有嚴謹?shù)膮⒖歼壿?,而機器目前更多是依賴從學習過的語料中回憶,其生成過程和生成邏輯無法鑒別,未來需要探索相關算法,進一步提升ChatGPT類模型生成過程和內容的可解釋性。
ChatGPT類大模型帶來了顛覆性的多源多模態(tài)信息匯聚與生成能力,推動了信息資源建設和AI內容生成的技術升級。ChatGPT類大模型覆蓋了海量的知識資源,其本身就是具備全域數(shù)據(jù)匯聚融合推理能力的新型信息源,未來需要探索針對這一新型數(shù)據(jù)源的建設組織與應用模式。ChatGPT類大模型還提供了強有力的數(shù)據(jù)關聯(lián)、任務解決和內容生成能力,推動形成了未來人類生成內容和AI生成內容并存的新型信息環(huán)境。如何針對這一環(huán)境開展信息資源建設、構建“面向未來”的新理論、新方法體系[14-15],將成為一個關鍵科學問題。ChatGPT類大模型在信息推理、數(shù)據(jù)整編、報告撰寫、知識庫構建等方面的能力也進一步推動了衍生信息資源的建設。
ChatGPT的出現(xiàn)將推動現(xiàn)有的信息組織與信息服務模式轉型。如何對ChatGPT生成的信息形成資源化利用,如何提供更加個性化的信息資源服務,從而進一步夯實信息資源支撐“四個面向”的基礎,是需要面對的挑戰(zhàn)。為此需要提出新的信息描述框架和組織模式,在AI生成內容快速增長的未來,構建面向多模態(tài)信息的增量式信息描述框架與組織模式,具備從互聯(lián)網、領域數(shù)據(jù)庫等復雜來源持續(xù)記錄和描述的能力。通過語義層面對多源多模態(tài)信息進行關聯(lián),實現(xiàn)大規(guī)模高質量動態(tài)資源的有效利用。此外,由于ChatGPT等主流大模型不具備動態(tài)信息持續(xù)更新功能,如何與傳統(tǒng)搜索引擎結合,從知識細粒度智能理解、可靠可信可解釋檢索的角度,提高信息組織與信息檢索的效果,實現(xiàn)由“檢索+推薦”模式到“感知+檢索+推薦+生成”模式的轉變[16]。
ChatGPT類大模型的規(guī)?;瘧脮砣斯ど尚畔⒌谋?。面對海量、來源不清、真假難辨的信息,人類面臨的信息過載和信息噪聲問題將會更加嚴重。在大模型生成內容快速增長的未來,對此類信息的加工、組織、評價和鑒別面臨極大的挑戰(zhàn)。在知識產權方面,ChatGPT等AI模型生成的內容所有權歸屬目前沒有明確的法律法規(guī)說明。近期的AI會議如ICML 2023[17]和ACL 2023[18]等,期刊如Nature[19]等,都及時更新和增加了關于AI協(xié)助寫作內容的政策,要求不能使用由ChatGPT或任何其他人工智能工具生成的文本。未來可能需要進一步解決語料庫版權問題,用戶和平臺版權歸屬問題,以及研發(fā)新的文字水印[20]技術來明確知識產權。與此同時,大模型中可能包含的價值觀和思維偏見會被惡意利用,就宗教、民族、人權等問題進行信息污染[21],因此需要推進數(shù)據(jù)采納與算法公平性研究,同時完善相應的內容審核制度??紤]到AI生成內容帶來信息倫理問題,未來還需要推進與哲學、法學和社會學等學科的跨學科研究,討論明晰針對AI生成內容的倫理觀,優(yōu)化信息治理能力。
盡管ChatGPT通過強化學習模型一定程度過濾了仇恨、種族歧視、涉恐涉暴涉政等有毒或敏感生成內容,但這一能力仍然存在不足,存在“越獄”的風險,可能會被不法使用[22]。例如,ChatGPT可能被用于偽造高可信釣魚郵件、發(fā)起社交網絡攻擊、盜取隱私、傳播錯誤信息和信息操縱[23]。未來,需探索如何幫助用戶有效鑒別ChatGPT生成的“Deepfake”[24]式虛假信息,以及鑒別機器生成的情緒化、偏見等[25]不和諧內容,推進針對AI生成內容的多維度評價研究[26-27],從信息內容自身質量、信息來源和信息獲取途徑等階段評價信息安全性和可靠性,綠色、高效地保障內容安全。
ChatGPT作為預訓練通用語言模型,對情感、暗示等人因信息仍然無法有效處理,暫時缺乏與語音、視覺、觸覺、腦電等信息的交互能力。未來還需要探索多場景、多模態(tài)輸入輸出,以及人因信息兼容的新型模型,推動更高水平的人機協(xié)同、人智協(xié)同。ChatGPT類大模型的進步還催生了新的用戶行為模式,需分析用戶感知和認知因素,探索人機共生環(huán)境下人機協(xié)同行為模式,從而進一步優(yōu)化智能信息服務、用戶隱私保護。需要強調的是,ChatGPT類大模型提供了打通人類智能和機器智能信道屏障的可能性,有助于實現(xiàn)人類智能和機器智能的深度融合,帶來的潛在效益可能遠超于其在問答和任務解決上的意義。
總之,以ChatGPT為代表的大模型是數(shù)智時代的典型技術和應用創(chuàng)新,其強大的信息加工、薈萃、整合和生成能力極大地加快了信息空間中信息資源的流動和循環(huán)速率,對信息資源管理學科研究和實踐帶來了挑戰(zhàn)和機遇。我們有必要對此保持密切關注,化解挑戰(zhàn),抓住機遇,促進相應的技術應用范式轉換,推動信息資源管理學科理論方法創(chuàng)新和治理變革,更高效地數(shù)智賦能行業(yè),以推動智慧圖書館、情報智能、智慧檔案、語義出版和數(shù)字人文等領域的快速發(fā)展,提升服務質量和效率。
作者貢獻說明
陸偉:提出研究思路,設計研究方案,論文修訂與定稿;
劉家偉, 馬永強:設計研究方案,收集和分析資料,論文撰寫與修改;
程齊凱:設計研究方案,論文修訂與定稿。