[摘 要] ChatGPT帶來的技術機遇將為圖書館知識服務轉型提供新思路。GPT類技術擁有情感分析能力、數(shù)據(jù)整理能力、知識推理能力、數(shù)字指導能力,將為圖書館傳統(tǒng)的參考咨詢服務、學科知識服務、情報服務以及教育培訓服務等場景帶來新的變革。圖書館在推進知識服務業(yè)務時應當提升多源多模態(tài)信息匯聚與整序能力,構建對話型生成式學術搜索引擎,促進情報檢索語言與人工智能融合,增強自然語言模型的邏輯推理能力,積極擁抱人工智能等生成技術,提高圖書館自身智慧知識服務水平。
[關鍵詞] ChatGPT 人工智能生成內容 圖書館 知識服務 人工智能
[中圖分類號] G250 [文獻標志碼] A [ DOI ] 10.19764 / j.cnki.tsgjs.20230788
[本文引用格式] 郭亞軍,馬慧芳,張鑫迪,等.ChatGPT賦能圖書館知識服務:原理、場景與進路[J].圖書館建設,2024(3):60-68.
*本文系國家社會科學基金項目“數(shù)智驅動的公共圖書館適老化服務模式創(chuàng)新研究”,項目編號:22CTQ013;河南省高等教育教學改革研究與實踐項目“三全育人導向下研究生思政教育協(xié)同創(chuàng)新研究與實踐”,項目編號:2021SJ GLX244Y;鄭州航院研究生教育創(chuàng)新計劃基金項目“元宇宙場域下的圖書館虛擬閱讀服務研究”,項目編號:2022CX42的成果之一。
ChatGPT Empowers Library Knowledge Services: Principles, Scenarios, and Approaches
Guo Yajun, Ma Huifang, Zhang Xindi, Feng Siqian
[Abstract] The technological opportunities brought by ChatGPT will provide new ideas for the transformation of library knowledge services. GPT-like technologies have the ability of sentiment analysis, data organization, knowledge reasoning, and digital guidance, which can bring certain improvements to traditional reference consultation, disciplinary knowledge, intelligence services, and education and training services in the library. When promoting knowledge service business, libraries should enhance the ability to gather and organize multi-source and multimodal information, build a dialogue based generative academic search engine, promote the integration of information retrieval language and artificial intelligence, enhance the logical reasoning ability of natural language models, actively embrace generation technologies such as artificial intelligence, and improve the library’s own level of intelligent knowledge service.
[Keywords] ChatGPT; AIGC; Library; Knowledge service; Artificial Intelligence
0 引 言
人工智能技術的發(fā)展推動著自動問答、數(shù)據(jù)分析、資源組織與信息查詢等智能服務不斷提升。同時,ChatGPT、Bard、文心一言等智能問答產(chǎn)品的出現(xiàn),將促進知識服務的快速迭代,為圖書館事業(yè)提供新的推動力。2022年中共中央、國務院印發(fā)的《關于推進實施國家文化數(shù)字化戰(zhàn)略的意見》[1]強調要建立具備情感計算、深度學習、模式識別的區(qū)域性智能計算中心,構建一體化的文化計算服務體系。國內文化產(chǎn)業(yè)在技術環(huán)境的變遷和國家機制的引領下,算力、人工智能、模型等將融入圖書館智能化建設的過程中,ChatGPT等生成式人工智能大模型也將促進圖書館知識服務與新興技術深度融合,推動多資源環(huán)境下知識服務場景的范式轉變,實現(xiàn)普惠大眾的圖書館智慧知識服務[2]。
國內外對于數(shù)字技術賦能圖書館知識服務的研究已取得諸多成果。例如,初景利等[3]提出“人工智能”“互聯(lián)網(wǎng)+”“智慧圖書館”和“云計算”等新場景已開始融入圖書館知識服務。Gao[4]結合多媒體技術對智慧圖書館知識服務質量形成機制、影響因素等方面提出鼓勵服務技術方法創(chuàng)新、建立意識激勵機制等服務策略。Ahmed等[5]認為圖書館和信息科學專業(yè)人員的信息和通訊技術(Information and Communication Technology,簡稱ICT)技能對增強圖書館服務非常重要。在ChatGPT問世后,圖情領域對其廣泛關注,儲節(jié)旺等[6]認為AIGC(AIGenerated Content,人工智能生成內容)視域下圖書館服務將優(yōu)化知識組織方式,提升知識服務能力;郭亞軍等[7]提出ChatGPT賦能圖書館智慧服務將實現(xiàn)資源建設、科研服務、咨詢服務、社會教育等服務場景間的融合協(xié)同;Chen[8]通過比較ChatGPT與傳統(tǒng)圖書館聊天機器人的參考咨詢服務能力,提出圖書館界應關注變革性技術帶來的影響;李書寧等[9]認為ChatGPT等智能技術將助力圖書館咨詢服務,助推知識服務改善圖書館檢索系統(tǒng)的用戶體驗;張曉林[10]認為支撐技術和機制已經(jīng)或者即將到位,技術與人才的發(fā)展都將面臨變革;Panda等[11]分析了ChatGPT替代圖書館傳統(tǒng)知識庫聊天機器人方案的可行性;趙瑞雪等[12]提出圖書館及相關信息機構應充分融合大數(shù)據(jù)和人工智能等新興技術,全面提高其智能知識服務水平。
以上研究認可了新興技術對圖書館相關服務的重要性,為本文更加深入探討ChatGPT技術主導下圖書館知識服務場景變革與推進路徑提供了參考。雖然ChatGPT目前尚未正式進入中國市場,但GPT類技術賦能知識服務的研究值得深入探索。基于以上背景,本研究從ChatGPT背后的支撐技術原理出發(fā),探討智能技術推動下圖書館知識服務的創(chuàng)新形式,分析技術變革對圖書館原有知識服務場景的影響,并提出ChatGPT賦能圖書館知識服務推進路徑,旨在豐富和拓展圖書館知識服務的研究內容和研究領域,為圖書館領域相關業(yè)務發(fā)展提供參考。
1 ChatGPT賦能圖書館知識服務作用原理
ChatGPT作為具備大規(guī)模語料庫訓練的生成式自然語言處理模型,具有自動文本生成、智能信息處理、語義搜索與判識、智能圖像生成等功能[13],它所展現(xiàn)的技術優(yōu)勢與圖書館知識服務的發(fā)展要求不謀而合。探討ChatGPT背后的支撐技術將有利于通用大模型的賦能,為創(chuàng)新圖書館知識服務注入情感分析能力、數(shù)據(jù)整理能力、知識推理能力和數(shù)字指導能力等新鮮血液,并為接下來服務場景變革研究提供理論支撐。本文根據(jù)ChatGPT背后的人類反饋強化學習(Reinforcement Learning from Human Feedback,簡稱RLHF)、變換器(Transformer)、思維鏈(Chain-of-thought,簡稱CoT)、AIGC等技術特點,分析圖書館知識服務新的增長點。ChatGPT賦能圖書館知識服務作用原理如圖 1 所示。
1.1 基于人類反饋強化學習技術的情感分析能力
RLHF是ChatGPT應用的核心技術機制之一。該技術通過模型學習人類指令與回答的這一過程,對語言模型進行監(jiān)督微調,再經(jīng)過標注人員對模型輸出結果按人類偏好進行排序,通過回答數(shù)據(jù)訓練獎勵函數(shù)、評估模型[14],利用強化學習的優(yōu)化策略使用獎勵函數(shù)以訓練監(jiān)督模型,從而優(yōu)化模型生成的答案質量[15]。RLHF技術的應用,使得自然語言模型生成的內容更符合人類的語言習慣,用戶與ChatGPT交流的過程更加自然。通過這樣的語言代碼生成的訓練方式,模型能夠在監(jiān)督微調的過程中理解用戶的交流意圖,拓展了自然語言模型的情感分析能力。
圖書館行業(yè)依靠人工智能、機器學習和語義平臺的支持,不斷在人機智能問答交流過程中進行創(chuàng)新和實踐,如上海交通大學圖書館的聊天機器人“小交”,主要功能是隨時隨地為讀者提供幫助,解決讀者的咨詢問題等。機器人提供的智慧服務已經(jīng)成為圖書館不可或缺的一部分。在RLHF技術支撐下,ChatGPT的互動模式、學習思維與技術理念能夠進一步匹配用戶的知識獲取與表達方式,且向用戶提供的相關信息具有結構條理性、內容飽滿度和語言規(guī)范性等擬人化的表現(xiàn)特征,甚至超越人類的回答反應速度,并擁有豐富的情感立場,重塑了圖書館智能參考咨詢服務的新樣態(tài)。除此以外,ChatGPT還可以處理多種語言,幫助圖書館員向更廣泛的用戶提供更加全面的智慧服務。GPT類技術的出現(xiàn)將為圖書館帶來新的契機,借助于ChatGPT開放接口對接圖書館服務系統(tǒng),從而實現(xiàn)對現(xiàn)有參考咨詢服務的超越。
1.2 基于變換器技術的數(shù)據(jù)整理能力
Transformer模型這一概念首次出現(xiàn)在谷歌研究人員于 2017 年發(fā)表的著名論文Attention is All You Need [16]中,其核心原理是基于注意力機制的深度神經(jīng)網(wǎng)絡結構,也是ChatGPT模型的基本組件之一。Transformer架構開發(fā)的預訓練語言模型脫離了人工標注數(shù)據(jù)集的弊端,能夠充分利用訓練資料的全局信息,有效捕捉數(shù)據(jù)集中的長距離依賴關系,使得大規(guī)模語言模型具備對自然語言的理解和生成能力,從而實現(xiàn)了模型質量的提升。從平行智能視角考慮,Transformer能夠駕馭大型語料庫,擁有高的計算能力和通用的預訓練能力,這一技術優(yōu)勢能夠為圖書館現(xiàn)有海量文本數(shù)據(jù)帶來數(shù)據(jù)整理優(yōu)化能力,最大限度地發(fā)揮圖書館學科知識服務的價值。
學科知識服務是圖書館由來已久的一項重要職能。 現(xiàn)有的服務方式基于一定的資源組織標準和方法,利用信息技術手段將特定學科或主題領域的數(shù)字資源集成在一個界面中,為用戶提供瀏覽檢索等增值服務的專門性門戶[17]。Transformer架構技術能夠遷移學習,快速適應其他任務。圖書館可以借助預訓練的Transformer模型,利用訓練數(shù)據(jù)中學習隱含語言規(guī)律和語言模型的強大功能,將圖書館現(xiàn)有的小型數(shù)據(jù)集微調Transformer預訓練語言模型,從而提高現(xiàn)有館藏數(shù)字資源的數(shù)據(jù)信息發(fā)現(xiàn)能力和資源組織水平。同時,Transformer模型在現(xiàn)有的技術進步上已實現(xiàn)較強的技術適用性,為圖書館學科知識服務預訓練已有的音視頻等多模態(tài)館藏信息資源提供用戶服務創(chuàng)新。
1.3 基于思維鏈技術的知識推理能力
CoT技術可以輔助ChatGPT等系統(tǒng)完成復雜推理任務,即將一個大問題分解為多個小問題,生成一系列的思維鏈提示的中間推理步驟[18]。CoT技術將傳統(tǒng)“問題—答案”的解決問題模式轉變?yōu)椤皢栴}—思維鏈—答案”模式,該技術的推理能力是面向用戶的,為用戶呈現(xiàn)答案的推理過程,但并不一定與模型的實際運行機制準確對應[19]。復雜推理是對以大型語言模型訓練的原始數(shù)據(jù)集進行增強,提高模型的泛化能力,通過改變語境、句子結構和替換詞匯等數(shù)據(jù)增強訓練的方法,實現(xiàn)對自然語言模型性能的提升。大型語言模型能夠通過人機對話中提供的上下文信息,領悟理解人類表達的語言請求,而CoT技術能夠讓機器在處理復雜任務時更加靈活,更準確地回答用戶提出的問題。
圖書館可以根據(jù)個人或項目團隊的研究目標和需求開展情報服務,利用CoT技術提供連續(xù)性的、跟蹤式的專題服務或定題服務,滿足用戶的個性化需求。ChatGPT的信息檢索能力、深度學習能力、知識推理能力都遠超個人的能力范疇,通過模仿人類的思維過程,實現(xiàn)智能創(chuàng)作,自動生成幫助用戶解決問題的內容。GPT-4新增的CoT技術能夠面向用戶解釋自身輸出結果的步驟和原因,這種解釋可以幫助館員在進行復雜的情報服務時更加高效率地理解并處理面臨的問題,增強了館員對于人工智能生成內容的信任,一定程度上抑制了自然語言模型回答的不真實性等問題。CoT技術充分體現(xiàn)出其針對復雜問題的推理能力,可以幫助館員在情報服務中實現(xiàn)貫穿研究項目始終的問題探究和解決路徑。
1.4 基于人工智能生成內容技術的數(shù)字指導能力
ChatGPT是基于人工智能生成技術的一種內容生產(chǎn)方式,可以實現(xiàn)海量數(shù)據(jù)計算、持續(xù)內容創(chuàng)新、深度認知交互[20]。內容生產(chǎn)主體經(jīng)歷了從專業(yè)人員到網(wǎng)絡用戶、再到人工智能的躍升,逐步形成“機械反饋—智能識別—深度學習”的技術生產(chǎn)驅動邏輯,人機交互實現(xiàn)了從被動式反饋向多維操控再到智能交互的變遷。以ChatGPT為代表的新一代AIGC技術具備了更強的數(shù)據(jù)分析能力、自然語言處理能力和數(shù)字指導能力,因此,圖書館的數(shù)字指導教學將是用戶掌握數(shù)字技能課程、體驗教育培訓推薦服務的重要途徑。全面深度地了解用戶的信息素養(yǎng)需求,挖掘用戶需求特征,提供多樣化的數(shù)字指導和服務幫助,能夠使用戶隨時獲取其所需的數(shù)字支持,并可以進一步優(yōu)化圖書館教育培訓服務。
ChatGPT賦能信息素養(yǎng)教育模式升級,能更好地提高學習的體驗感、交互感,適應新技術環(huán)境下用戶對于知識、技能的獲取要求。在GPT類模型的賦能下,圖書館能夠開發(fā)出基于人工智能的信息素養(yǎng)教育軟件,以自動識別檢索信息,提供個性化推薦服務。同時,利用“提示詞”技術自動搜索館藏各類資源,并生成豐富多彩的素材和教學文檔,讓用戶更好地理解信息素養(yǎng)教育的內容。搭載了預訓練數(shù)據(jù)庫的人工智能機器人則可以調研圖書館基于人工智能技術和數(shù)據(jù)可視化沉浸式服務的滿意度,搭建圖書館信息素養(yǎng)教育社區(qū),為用戶提供實時的信息傳遞,以及教育和研究活動的指導與幫助。
2 ChatGPT賦能圖書館知識服務應用場景
ChatGPT已成為當前機器學習和深度學習的集大成者,訓練好的自然語言模型只需微調即可應用于多種任務和場景,正在推動“數(shù)據(jù)即服務”向“模型即服務”的范式轉變,開創(chuàng)了模型主導內容生產(chǎn)的時代[21]。ChatGPT的出現(xiàn),為生成式的人工智能系統(tǒng)平滑地遷移到垂直領域的應用場景提供了示范。在圖書館知識服務領域,ChatGPT將對參考咨詢服務場景人性化、學科知識服務場景精細化、情報服務場景直觀化、教育培訓服務場景個性化等方面產(chǎn)生更加積極深遠的影響。
2.1 參考咨詢服務場景:從數(shù)智化到人性化
隨著Web 3.0時代的到來,圖書館服務方式和服務能力也在不斷發(fā)展。從紙質文獻到數(shù)字化文獻,從人工借還到自助借還,從傳統(tǒng)咨詢到智能咨詢,在轉型升級的過程中,機器人充當著體力和腦力勞動者,極大地解放了館員的勞動力,使得館員將更多精力投入到為用戶服務的創(chuàng)意工作中。服務范圍帶來的變化為用戶提供了更高效、便利的服務,也使得參考咨詢服務達到了貼近人性化水平。但現(xiàn)有的服務仍存在一些局限性,如圖書館無法為用戶提供每天24小時的人工參考咨詢服務,咨詢機器人只能回答一些簡單的問題等。當前的參考咨詢服務在節(jié)省人力、財力、時間上還有待進步,而ChatGPT能夠輔助圖書館處理用戶自然語言提問,很好地理解用戶意圖,提供及時準確的信息服務,幫助圖書館參考咨詢服務實現(xiàn)人性化的轉型。
ChatGPT技術能夠根據(jù)用戶的提問,通過語義分析,學習其語言環(huán)境,并通過模仿學習來改進聊天機器人的回復結果,將最佳答案提供給用戶。同時,ChatGPT技術可以幫助圖書館構建更加智能的人機問答系統(tǒng),精準識別用戶的提問,并以智能的方式回答用戶的問題。用戶可以通過自然語言與系統(tǒng)進行交流,獲得精準的答案。ChatGPT技術還可以通過深度學習技術,提高系統(tǒng)的智能服務水平,實現(xiàn)更準確的問答服務。在建立智能問答系統(tǒng)時,可以利用ChatGPT的預訓練模型進行微調,使其適應圖書館參考咨詢服務場景的問答。例如,可以利用ChatGPT對圖書館中的常見問題進行訓練,使得ChatGPT更好地回答這些問題。ChatGPT在深度學習算法的突破,不僅可以塑造機器人的性格,還能使機器人更好感知、理解、預測人類的需求,包括情感需求,并提供有情感的、精準的、實時的、專業(yè)的個性化服務。這都將驅動圖書館參考咨詢服務由數(shù)智化向人性化轉變。
2.2 學科知識服務場景:從專業(yè)化到精細化
智慧圖書館的核心目標是提供智慧化的“知識服務”[22],而知識服務的質量與知識組織息息相關。當前,圖書館的知識組織更多地是沿襲傳統(tǒng)的信息組織手段,即文獻編目。不管是手動編目還是自動編目,隨著用戶需求資源類型的多樣化和個性化程度不斷提升,圖書館所提供的專業(yè)化知識組織活動已經(jīng)難以滿足用戶的需求,這直接影響圖書館的學科知識服務水平。
ChatGPT的出現(xiàn)可以推動圖書館知識組織的優(yōu)化,升級知識服務。圖書館利用ChatGPT在文本、圖像、視頻之間的跨模態(tài)生成功能以及生成標題和摘要功能,可以建立館藏結構性和非結構性數(shù)據(jù)之間的關聯(lián),建立文本、圖像與視頻之間的關聯(lián),并通過對現(xiàn)有資源重新聚類,自動形成主題化、專題化的分類揭示,為用戶提供更高效、更精準、更多樣的學科知識服務。ChatGPT依靠強大的機器學習可以深入文獻資源的內容,使得圖書館資源描述從主題、關鍵詞、摘要、來源等表面信息組織方式,轉變到語義內容組織方式,圖書館挖掘細粒度、多粒度知識對象的能力顯著提升[23],實現(xiàn)知識組織的精細化管理。ChatGPT與圖書館現(xiàn)有的數(shù)字資源進行重新整合、主題識別、語義關聯(lián)分析、分類,形成具有豐富檢索內容的知識庫系統(tǒng),支持用戶自然語言檢索、多模態(tài)檢索,并且可以自動生成答案,補充來源和案例說明,根據(jù)用戶需求進行智能化推薦,還支持對話聊天框形式。微軟已經(jīng)在搜索引擎(Bing)和瀏覽器(Edge)中應用下一代OpenAI模型,以提升檢索效果和改善用戶體驗[24]。隨著ChatGPT和圖書館知識組織的深度結合,能夠為圖書館用戶提供更加精細化的服務交互體驗。
2.3 情報服務場景:從寬泛化到直觀化
圖書館信息檢索服務的效果,直接影響?zhàn)^員提供情報服務的檢索體驗,也關系圖書館服務水平的高低。而圖書館現(xiàn)有的檢索系統(tǒng),包括各類商業(yè)數(shù)據(jù)庫和自建數(shù)據(jù)庫以及目錄檢索系統(tǒng)和資源發(fā)現(xiàn)系統(tǒng),基本上以關鍵詞和主題檢索為主,借助布爾邏輯式和高級檢索來限制檢索范圍,支持篩選優(yōu)化,以提高檢索效率和效果。但館員通過專業(yè)檢索的檢索結果并不能提供針對性的內容,相反檢索結果呈現(xiàn)范圍較為寬泛,而ChatGPT具有強大的創(chuàng)作和生成功能,能夠根據(jù)上下文語義進行多輪對話,圖書館情報服務人員可以通過ChatGPT,快速有效地獲得直觀的答案而非從海量的檢索結果中進行篩選分析,極大地提高了檢索效率和準確率,進而縮短圖書館情報服務周期,為用戶提供更高效的情報服務。
ChatGPT可以對已有的訓練數(shù)據(jù)進行知識總結和檢索輸出,目前已實現(xiàn)自動分類、智能索引、自動標引、機器翻譯、自動文摘等進程。機器智能創(chuàng)作邏輯結構對數(shù)據(jù)分析、情報研判、智庫支持等情報服務功能產(chǎn)生變革性影響,豐富和充實了圖書館情報服務方法論體系。作為大模型最新應用進展代表的GPT-4不僅可以在理解上下文語義的情況下生成文字、圖像、音頻、視頻等多模態(tài)信息,還可以實現(xiàn)非結構化的文案撰寫、多語言的翻譯任務和程序代碼的編寫,拓展了情報服務內容,能夠更好地輔助館員滿足用戶的多樣化需求。同時,館員在利用ChatGPT進行檢索時,自然語言模型通過理解輸入內容,將更加符合檢索結果的信息反饋給館員,滿足了館員對情報的直觀化需要,豐富了館員對于檢索結果的理解。通過對信息的整理,一次性或是定期不間斷地為用戶提供相關服務內容,完成定題服務。在人工智能技術的支持下,圖書館需要進一步對海量元數(shù)據(jù)進行資源整合,夯實數(shù)字化數(shù)據(jù)存儲,加強數(shù)字信息資源建設,為動態(tài)精準智能化信息檢索奠定資源基礎。
2.4 教育培訓服務場景:從普適化到個性化
在人工智能和互聯(lián)網(wǎng)時代,自媒體盛行,使得用戶更加注重創(chuàng)意,而圖書館僅僅依靠普適化推送的服務方式將無法吸引用戶的興趣,需要結合新的技術去創(chuàng)新服務方式,以增加用戶黏性。圖書館現(xiàn)有的服務推薦系統(tǒng)往往基于用戶的歷史借閱記錄或者圖書的元數(shù)據(jù)進行推薦,這種方式容易陷入信息過載的困境,當用戶的個性化信息素養(yǎng)技能需求與圖書館資源推薦不匹配時,就很有可能致使用戶產(chǎn)生消極使用情緒,導致圖書館用戶的流失。ChatGPT強大的自然語言處理能力、深度學習能力將使自動推薦系統(tǒng)可以根據(jù)用戶聊天內容中的信息需求,自動推薦與其最相關且適宜的內容,從而提高用戶使用館藏資源的積極性。
圖書館的教育培訓功能正在逐漸被網(wǎng)絡和社會機構所弱化。轉變服務模式,以用戶為中心提供精準的個性化服務內容,將是圖書館強化知識服務主體地位的有效途徑。圖書館可以利用ChatGPT技術建立一個智能化的自動推薦系統(tǒng),用戶通過自然語言描述個人的閱讀偏好和學習興趣,或者ChatGPT根據(jù)用戶歷史瀏覽記錄提取關鍵信息,利用人工智能技術對用戶的閱讀行為、內心想法和興趣指向進行預測的功能,為用戶精準地推薦相應水平的個性化教育培訓資源。同時,傳統(tǒng)教育培訓服務更多地是舉辦線下或線上活動,而ChatGPT的出現(xiàn),使得圖書館教育培訓服務方式不必局限于活動形式,可以采取一對一的輔導方式、內容推薦方式實現(xiàn)從用戶主動型訂閱搜索、被動型推薦投送到互動型智能推薦的轉變,催生以用戶為核心、以交互推薦為表現(xiàn)的教育培訓服務新模式。隨著GPT 類技術的不斷發(fā)展,預示著教育培訓用戶推薦服務將產(chǎn)生新一輪范式的轉變,自然語言處理技術等將為用戶提供更加個性化的服務。
3 ChatGPT賦能圖書館知識服務的推進路徑
ChatGPT技術的演進已經(jīng)在人機自然交流、語料體系整理、知識演繹推理和自然語言理解等功能上取得巨大進展,AIGC的時代已經(jīng)來臨。圖書館可以借助已有的技術變革機遇,針對參考咨詢服務、學科知識服務、情報服務、教育培訓服務等知識服務場景,在提升多源多模態(tài)信息匯聚與整序能力、構建對話型生成式學術搜索引擎、促進情報檢索語言與人工智能融合,以及增強自然語言模型的邏輯推理能力等方面實現(xiàn)變革性開拓,推動圖書館知識服務躍上新臺階。
3.1 提升多源多模態(tài)信息匯聚與整序能力
在圖書館資源建設中,經(jīng)常提到“多源數(shù)據(jù)”“多模態(tài)信息”與“多源融合”等概念,其表達的是多來源大規(guī)模的文本、視頻、音頻等不同模態(tài)的數(shù)據(jù)集[13]。而在大語言模型技術的發(fā)展中,訓練數(shù)據(jù)的體量、質量、種類、模態(tài)決定了模型最終生成的效果,機器學習領域 CLIP(Contrastive LanguageImage Pre-Training,對比語言-圖像預訓練)模型和Diffusion(擴散)模型的出現(xiàn)使不同模態(tài)的數(shù)據(jù)在語義特征尺度上實現(xiàn)融合轉換,為多模態(tài)語義融合提出了解決方案,讓 ChatGPT 僅通過輸入文字內容就可以生成音頻、視頻或 3D 模型。在大數(shù)據(jù)時代背景下,圖書館能否依靠模型提升業(yè)務效率的前提,取決于其能否滿足不斷增長的語料和算法需求。高價值語料工作是圖書館服務的基礎。知識時代既蘊含大量知識,也創(chuàng)造海量知識,而知識本身就是模型時代的語料。圖書館積累匯聚了海量的語料信息資源,大都以文本形式保存。提升多元多模態(tài)信息匯聚與整序能力,將館藏語料信息源激活啟用,從而發(fā)揮語料的最大社會效益和經(jīng)濟效益,是圖書館需要關注的重點議題。
多源多模態(tài)信息匯聚與整序是圖書館開展知識服務研究的基礎。多源多模態(tài)信息匯聚是ChatGPT加持下圖書館開展參考咨詢服務的必經(jīng)之路,圖書館匯聚了海量的主題館藏、電子圖書資料、文獻資源和業(yè)務數(shù)據(jù)等,具有多維度、多元化特點,將館藏中相對高質量的資源數(shù)據(jù)作為大語言模型的預訓練語料,利用人工智能算法實現(xiàn)數(shù)據(jù)融合分析,實現(xiàn)ChatGPT技術支持下以用戶需求為中心的精確人性化微觀人機問答服務,也為多維度資源匯聚下館員宏觀決策提供依據(jù)。多源多模態(tài)信息整序是指圖書館依托高性能算力支持集成各類數(shù)據(jù)整序技術,面向多模態(tài)數(shù)據(jù)進行關聯(lián)整序,動態(tài)重組知識單元,面向圖書館參考咨詢服務重構信息資源序列,創(chuàng)新多模態(tài)信息組織能力,發(fā)掘館藏資源的服務能力,挖掘信息資源深層隱性知識,進而提升人機交流服務內涵,促進知識交流。在這種模式下,用戶可以直接與大規(guī)模資源對象中的分布式內容和隱含知識實時交互,有助于降低用戶使用門檻、提升館藏資源服務體驗。
3.2 構建對話型生成式學術搜索引擎
在圖書館檢索系統(tǒng)與搜索引擎并行發(fā)展的時代里,超過八成的用戶轉向了以搜索引擎為信息查詢起點,借助搜索引擎實現(xiàn)自己的檢索目標[25]。為吸引用戶利用圖書館精確高效地找到所需資源并比較信息內容的關聯(lián)性,實現(xiàn)學科知識服務的精準性,圖書館提升學術檢索服務變得迫在眉睫,而ChatGPT的出現(xiàn)有助于解決這一難題。大語言模型的核心要素算法、算力、數(shù)據(jù)已經(jīng)實現(xiàn)從量變到質變的飛躍,使ChatGPT具備較好的語言理解、數(shù)據(jù)整理、邏輯推理與內容生成能力。深度學習、自然語言處理等人工智能技術在學術檢索中的應用,帶來了搜索引擎向對話型學術搜索引擎的升級。因此,圖書館需要加強建設大規(guī)模語料庫,訓練關聯(lián)數(shù)據(jù)成為語料資源,創(chuàng)新知識組織方法,將文獻資源庫轉換成知識庫,提高用戶對知識庫中學術搜索引擎的利用率,充分發(fā)揮ChatGPT自然語言處理能力,推進圖書館學科知識服務應對用戶不斷變化的信息需求能力,提升圖書館與用戶之間的黏性。
對于圖書館學科知識服務來說,ChatGPT可以幫助圖書館構建更智能交互化的學術搜索引擎,結合傳統(tǒng)的OPAC系統(tǒng),并利用神經(jīng)網(wǎng)絡、語義網(wǎng)、自然語言處理、深度學習等人工智能技術,實現(xiàn)資源檢索到資源發(fā)現(xiàn)的轉變,從而提高檢索結果的準確度,更好地滿足用戶的搜索需求。同時,ChatGPT還能夠通過理解用戶的交流意圖,結合用戶搜索主題、歷史記錄、偏好興趣等分析用戶需求,為用戶提供智能交互的擬人化搜索體驗,減少了用戶信息篩選環(huán)節(jié),進一步提高學科知識服務效率。從用戶接受度層面而言,圖書館將ChatGPT與傳統(tǒng)搜索引擎相結合,將創(chuàng)新用戶檢索體驗,最大程度地提高學術搜索引擎的高效化和智能化水平。
3.3 促進情報檢索語言與人工智能融合
ChatGPT在人機自然語言交互方面取得的成功表明了檢索語言的重要價值,圖書館也要提升在大語言模型中情報檢索語言改革的能力。ChatGPT對信息的檢索和問答已經(jīng)刷新了人們對人工智能的服務認知和服務體驗。因此,當前的情報服務工作不能停留在傳統(tǒng)的人工檢索式的定向、定題、限量等服務層面。圖書館情報服務要充分利用新的模式、方式,擴大創(chuàng)新情報檢索語言的應用范圍,依托人工智能技術,結合已有的文摘、索引、目錄檢索服務,在館員為用戶提供情報服務時,要盡可能細化情報檢索匹配條件,按照服務需求進行高精確度檢索,方便館員或用戶快速準確地獲取所需信息。人工智能技術的應用與情報檢索語言的組織、管理息息相關,見證了情報服務的變革、創(chuàng)新和發(fā)展,是情報服務開展的著力點、切入點和關鍵點。
ChatGPT正在實現(xiàn)模糊搜索到精準推送的跨越,改變了以往關鍵詞檢索的服務形式,通過人機交流對話理解上下文自然語言內容,能夠為館員提供文字總結或是與檢索結果相關的網(wǎng)頁鏈接[26]。情報檢索語言是圖書館提供情報服務必不可少的手段和工具,ChatGPT的出現(xiàn)將引領檢索語言的代際變革。圖書館情報服務系統(tǒng)將形成新的檢索語言范式,通過將自然語言轉換為檢索規(guī)范語言,從而實現(xiàn)情報檢索語言與人工智能的融合,從自動文摘、自動綜述等檢索結果出發(fā),優(yōu)化知識組織與情報檢索的效果。此外,圖書館情報服務挖掘信息數(shù)據(jù)的使命是幫助用戶從海量的信息中發(fā)現(xiàn)更有價值的知識,其目的不是替用戶做判斷,而是供用戶做判斷,即給用戶提供有價值的結果性的信息描述,盡可能減少“黑箱”的干擾。基于海量數(shù)據(jù)情報信息,圖書館要積極探索情報檢索語言與自然語言處理等人工智能生成技術的融合,以滿足用戶對情報檢索語言的差異化、多樣性和靈活性需求。
3.4 增強自然語言模型的邏輯推理能力
Web3.0時代,以ChatGPT為代表的自然語言模型能夠通過上下文語境理解用戶提出的問題,為用戶提供精準的信息內容,并可以在持續(xù)的交互過程中基于人類反饋強化學習技術實現(xiàn)機器學習,以增強大模型的完善程度和能力。ChatGPT擁有的邏輯推理能力由訓練語料的概率計算決定,并非由人類思維邏輯推理得到,其生成的結果高度依賴訓練語料的質量,并且,ChatGPT存在明顯的訓練語料局限,當用戶提出超出訓練語料范圍的問題,自然語言模型可能生成錯誤的答案誤導用戶。從長遠發(fā)展來看,如果圖書館在應用ChatGPT等人工智能生成軟件時不重視此類情況,可能會造成虛假知識泛濫、虛構歷史等錯誤的教育信息推薦與生成情景,且當用戶學習辨別能力有限時,大模型的應用反而會影響圖書館教育培訓服務的初衷和愿景。
圖書館在應用ChatGPT外掛基礎設施為用戶提供教育信息培訓服務時,應盡可能挖掘和整理館藏資源,或多館聯(lián)盟訓練屬于圖書館的大規(guī)模自然語言模型,使其訓練語料符合多樣性、高質量、大規(guī)模等特點,并對各種館藏數(shù)據(jù)進行規(guī)范化清洗。通過大量的館藏訓練語料庫培養(yǎng)大模型的邏輯推理能力,使模型能夠在充分理解用戶的意圖后提供正確、完整的教育培訓信息推薦服務。因此,邏輯推理對圖書館提供教育培訓等服務至關重要,將邏輯推理能力納入自然語言理解系統(tǒng)自人工智能技術出現(xiàn)以來一直是一個活躍的研究主題[27]。ChatGPT目前僅僅學會了推理的表面邏輯,不具備較強的邏輯推理能力和因果關系的數(shù)理運算能力。對于圖書館建立大模型來說,邏輯推理仍然具有挑戰(zhàn)性,圖書館應在突破訓練語料的限制上,在與用戶的交互過程中不斷學習,了解用戶真正的信息素養(yǎng)需求,實現(xiàn)對模型的調優(yōu)和反饋,讓用戶獲得一種創(chuàng)造性和主動性的交互體驗。
4 結 論
ChatGPT的發(fā)展歷程是科技進步的一個縮影,從全景視角來看,未來不論是國家之間還是企業(yè)之間的競爭合作,信息技術都將是一個重要的參考指標。本文分析了ChatGPT背后支撐技術的作用原理帶來的服務能力的變革,相較于傳統(tǒng)的信息技術在圖書館知識服務的應用,新興技術的實踐將帶來情感分析能力、數(shù)據(jù)整理能力、知識推理能力、數(shù)字指導能力四個方面的轉變。結合對參考咨詢服務、學科知識服務、情報服務以及教育培訓服務等知識服務特有場景變革的影響,本文從圖書館發(fā)展視角出發(fā),提出圖書館需提升多源多模態(tài)信息匯聚與整序能力、構建對話型生成式學術搜索引擎、促進情報檢索語言與人工智能融合,以及增強自然語言模型的邏輯推理能力等路徑,以期為圖書館知識服務的理論與實踐發(fā)展提供參考。
參考文獻:
[1] 中共中央辦公廳國務院辦公廳印發(fā)《關于推進實施國家文化數(shù)字化戰(zhàn)略的意見》[EB/OL].[2023-04-26].http:// www.gov.c n/xinwen/2022-05/22/content 5691759. htm.
[2] 張曉林,梁娜.知識的智慧化、智慧的場景化、智能的泛在化——探索智慧知識服務的邏輯框架[J].中國圖書館學報,2023,49(3):4-18.
[3] 初景利,任嬌菡,王玨.圖書館知識服務與出版知識服務的比較分析[J].圖書情報知識,2021,38(6):110-122.
[4] GAO Y J. Intelligent library knowledge innovation service system based on multimedia technology[J]. Personal and ubiquitous computing,2020,24(3):333-345.
[5] AHMED S, SHEIKH A.Information and communication technology skills among library and information science professionals:a predictor of enhanced library services[J].Journal of librarianship and information science,2021,53(3):444-453.
[6] 儲節(jié)旺,杜秀秀,李佳軒.人工智能生成內容對智慧圖書館服務的沖擊及應用展望[J].情報理論與實踐,2023, 46(5):6-13.
[7] 郭亞軍,郭一若,李帥,等.ChatGPT賦能圖書館智慧服務:特征、場景與路徑[J].圖書館建設,2023(2):30-39,78.
[8] CHEN X.ChatGPT and its possible impact on library reference services[J].Internet reference services quarterly,2023,27(2):121-129.
[9] 李書寧,劉一鳴.ChatGPT類智能對話工具興起對圖書館行業(yè)的機遇與挑戰(zhàn)[J].圖書館論壇,2023,43(5):104-110.
[10] 張曉林.從猿到人:探索知識服務的鳳凰涅槃之路[J].數(shù)據(jù)分析與知識發(fā)現(xiàn),2023,7(3):1-4.
[11] PANDA S, KAUR N.Exploring the viability of ChatGPT as an alternative to traditional chatbot systems in library and information centers[J].Library hi tech news,2023, 40(3): 22-25.
[12] 趙瑞雪,黃永文,馬瑋璐,等.ChatGPT對圖書館智能知識服務的啟示與思考[J].農(nóng)業(yè)圖書情報學報,2023, 35(1):29-38.
[13] 葉鷹,朱秀珠,魏雪迎,等.從ChatGPT爆發(fā)到GPT技術革命的啟示[J].情報理論與實踐,2023,46(6):33-37.
[14] CHRISTIANO P F,LEIKE J,BROWN T,et al.Deep reinforcement learning from human preferences[J]. Advances in neural information processing systems, 2017,30(1):4302-4310.
[15] SCHULMAN J,WOLSKI F,DHARIWAL P,et al.Proximal policy optimization algorithms[J/OL].arXiv, 2017[2023-05-08].https://doi.org/10.48550/arXiv. 1707.06347.
[16] VASWANI A,SHAZEER N,PARMAR N,et al.Attention is all you need[C]//Advances in Neural Information Processing Systems.Cambridge:MIT Press,2017:5998-6008.
[17] 姚雪梅.面向知識服務的公共圖書館空間再造研究[J].圖書館工作與研究,2023,323(1):28-34.
[18] WEI J,WANG X,SCHUURMANS D,et al.Chain of thought prompting elicits reasoning in large language models[J/OL].arXiv,2022[2023-05-08].https://doi.org/ 10.48550/arXiv.2201.11903.
[19] 桑基韜,于劍.從ChatGPT看AI未來趨勢和挑戰(zhàn)[J].計算機研究與發(fā)展,2023,60(6):1191-1201.
[20] 何哲,曾潤喜,秦維,等.ChatGPT等新一代人工智能技術的社會影響及其治理[J].電子政務,2023,244(4):2-24.
[21] 張智雄,曾建勛,夏翠娟,等.回應AIGC的信息資源管理學人思考[J].農(nóng)業(yè)圖書情報學報,2023,35(1):4-28.
[22] 蔡迎春,嚴丹,周瓊,等.元宇宙時代智慧圖書館的實踐路徑——從圖書館的智慧化走向智慧的圖書館化[J].中國圖書館學報,2023,49(4):103-113.
[23] 張智雄,于改紅,劉熠,等.ChatGPT對文獻情報工作的影響[J].數(shù)據(jù)分析與知識發(fā)現(xiàn),2023,7(3):36-42.
[24] Reinventing search with a new Al-powered Microsoft Bing and Edge your copilot for the web[EB/OL].[2023-05-12].https://blog smicro soft com/blog/2023/0207/ reinventing search-wih-a-new-ai-poweredmicrosoft-bing-and- edge-your-copilot-for-the-webl.
[25] CATHY D R,JOANNE C,MATTHEW C,et al.Perceptions of libraries,2010:context and community[R/OL].[2023-05-02].https://fieseric.edgov/fulltext/ED532601.pdf.
[26] 曹樹金,曹茹燁.從ChatGPT看生成式AI對情報學研究與實踐的影響[J].現(xiàn)代情報,2023,43(4):3-10.
[27] CRESSWELL M J.Logics and languages[M].London: Routledge,2016:45.
[作者簡介]
郭亞軍 1979 年生,博士,鄭州航空工業(yè)管理學院信息管理學院教授、研究生導師,研究方向為元宇宙、虛擬圖書館、知識管理、ChatGPT等,本文通訊作者,ORCID:0000-0001-8441-3328。E-mail:guoyajun0619@126.com。
馬慧芳 1996年生,鄭州航空工業(yè)管理學院信息管理學院圖書情報碩士研究生,研究方向為ChatGPT、知識管理。
張鑫迪 1996年生,鄭州航空工業(yè)管理學院信息管理學院圖書情報碩士研究生,研究方向為元宇宙、數(shù)字人文、信息無障礙。
馮思倩 1998年生,鄭州航空工業(yè)管理學院信息管理學院圖書情報碩士研究生,研究方向為信息行為、元宇宙、知識管理。
[收稿日期:2023-05-28]