摘 要:生成式人工智能技術對于改變檔案服務思維方式與發(fā)展理念,推動其向智慧服務方向轉變具有強大支撐作用?;贏rcGPT語言模型,本文構建了主體維、功能維、資源維、技術維等四維一體的數(shù)智化檔案資源服務體系,并提出理念重塑、流程再造和技術賦能等策略,以期搭建虛實智能聯(lián)動的檔案資源服務平臺,提供個性化、模塊化、全周期、注重全景式漫游交互體驗的檔案知識化服務,推動數(shù)智化檔案資源服務體系的創(chuàng)新與發(fā)展。
關鍵詞:檔案資源;服務體系;ArcGPT;生成式人工智能;數(shù)智化;服務平臺
1 引言
當前,檔案資源服務體系“數(shù)智化”轉型升級過程中,仍面臨著應用層面不均衡、技術更新滯緩、服務模式單一、資源整合不足等現(xiàn)實困境。[1]《“十四五”全國檔案事業(yè)發(fā)展規(guī)劃》(以下簡稱《規(guī)劃》)將加快檔案開放、擴大檔案利用、提供優(yōu)質(zhì)服務等視為重要任務,積極推動知識管理、人工智能等新興技術在檔案信息深層次加工和利用中的應用與深度融合,以期為檔案事業(yè)發(fā)展提供持久動力。[2]
2023年9月8日,習近平總書記在聽取黑龍江省委省政府工作匯報時強調(diào),要整合科技創(chuàng)新資源,引領發(fā)展戰(zhàn)略性新興產(chǎn)業(yè)和未來產(chǎn)業(yè),加快形成新質(zhì)生產(chǎn)力。[3]檔案事業(yè)高質(zhì)量發(fā)展,需要構建以創(chuàng)新開發(fā)利用為導向、以新興技術為手段實現(xiàn)數(shù)智賦能的數(shù)智化檔案資源服務體系,革新檔案資源生產(chǎn)結構、推動檔案資源要素優(yōu)化組合、激發(fā)資源開發(fā)生產(chǎn)活力,以便提供更加質(zhì)優(yōu)、可持續(xù)的檔案資源開發(fā)成果,不斷催生檔案資源開發(fā)新模式、新動能。
美國對齊研究中心的生成式預訓練語言模型(Alignment Reasearch Center Generative Pre-trainedTransformer, ArcGPT)是檔案智能開發(fā)與服務重點實驗室主持研發(fā)的為實際存檔應用程序量身定制的生成式大型語言模型,該模型可通過構建檔案領域知識庫和檔案業(yè)務指令數(shù)據(jù)集進行針對性訓練,為用戶提供檔案知識問答、文檔對話、智慧編研、檔案密級篩查和開放審核等檔案智能化服務。通過引入ArcGPT生成式大型語言模型,開展檔案資源智能問答與交互、數(shù)據(jù)分析與挖掘、個性化服務定制,構建數(shù)智化檔案資源服務體系,將提升檔案管理效率、驅動信息共享與合作、促進智能化決策,推動檔案資政服務、公共服務、文化教育能力明顯提升,推動檔案資源服務體系朝著數(shù)智化、便捷化的新階段邁進。
2 基于ArcGPT的數(shù)智化檔案資源服務體系模型建構
“數(shù)智化”就是數(shù)字化和智能化兩個過程或兩個層面的有機融合,即“數(shù)智化=數(shù)字化+智能化”。數(shù)字化匯聚了大量數(shù)據(jù),形成了從物理世界到虛擬世界的映射,而智能化基于大量數(shù)據(jù)的智能分析,提供面向問題解決和決策支持的智慧應用服務,其核心在于主體對于作用客體的價值重構和技術賦能。因此,根據(jù)數(shù)智化檔案資源服務體系的參與各要素和運行機制,可以從主體維、功能維、資源維、技術維四個維度來實現(xiàn)個性化、模塊化的檔案服務模型搭建?;贏rcGPT的數(shù)智化檔案資源服務體系模型如圖1所示。
2.1 主體維:行動共同體構建。從數(shù)智化檔案資源服務體系的作用機制上看,作用主體對檔案事業(yè)與外部環(huán)境的響應與調(diào)適是數(shù)智化檔案資源服務模式和服務方向轉變的主要內(nèi)在推動因素。這個作用主體不是個體的檔案學者,而是具有共同的檔案服務發(fā)展目標、專業(yè)責任等價值理念以及相關概念、理論、方法論等共識性認識的檔案工作者組成的行動共同體。正是行動共同體的求索精神和對檔案事業(yè)的熱愛,檔案資源服務體系才得以建立,形成了自己獨特的發(fā)展特色,不斷走向規(guī)范化和專業(yè)化。
通過形成全領域、跨周期的合作機制,檔案資源服務體系能夠匯聚多方智慧和資源,打破信息孤島,共同推動數(shù)智化檔案服務的發(fā)展,實現(xiàn)資源的共享和優(yōu)化配置。
2.2 功能維:功能模塊化設計。根據(jù)用戶需求和服務場景,數(shù)智化檔案資源服務體系將功能進行模塊化劃分,如可設置檔案信息管理、檔案知識問答、智慧編研、檔案密級篩查和開放審核等模塊。每個模塊都具備獨立的功能和接口,可以根據(jù)需要進行組合和定制,從而滿足用戶的個性化需求。
從結果導向上看,功能模塊的設置必須覆蓋檔案數(shù)據(jù)收集、檔案數(shù)據(jù)處理、檔案數(shù)據(jù)利用、檔案數(shù)據(jù)展示、個性化服務窗口、效果評價與反饋等全周期、各方面;從功能導向上看,以高科技、高效能、高質(zhì)量為主要特征的功能模塊必須具有強大的自然語言和理解能力、海量知識抓取和存儲功能、檔案數(shù)據(jù)清洗和價值挖掘功能、個性化精準推送和傳播能力。[4]可以通過通用數(shù)據(jù)中心構建豐富的機器學習模型,快速發(fā)揮ArcGPT各類底層技術支撐作用,集成AI、應用程序和數(shù)據(jù),優(yōu)化客戶體驗和業(yè)務流程,跟蹤用戶需求并做出及時反饋,以提升客戶體驗、降低勞動成本。
2.3 資源維:資源整合與利用??萍紨?shù)據(jù)、工業(yè)信息資產(chǎn)、改革發(fā)展檔案等檔案資源對于政府與企業(yè)等有關組織合規(guī)管理、投資決策、生產(chǎn)運行的支撐作用越發(fā)明顯,也對檔案知識服務中知識資源的組織、知識產(chǎn)出的質(zhì)量、知識服務的方式提出了更高要求,助推檔案知識服務在能力和質(zhì)量上加速提升,促使檔案信息資源進行增值再利用。
數(shù)智化檔案資源服務體系的首要環(huán)節(jié)便是建立知識資源庫。一方面,需要明確檔案管理與業(yè)務實際的知識使用情況,對現(xiàn)有知識進行盤點、分類以及對重要性進行區(qū)分。據(jù)此,提出知識需求,編制文件歸檔范圍,制定合理的檔案分類體系。另一方面,應加強工作經(jīng)驗和典型工作案例等隱性知識的積累與書面材料的形成,建立自身的知識標準體系,明確各項業(yè)務工作的知識要素,特別是對于管理與技術咨詢得到的專家知識應利用口述檔案或者其他載體實現(xiàn)檔案化沉淀;對于典型工作案例,業(yè)務部門應定期對隱性知識進行識別、提煉與更新,形成相關文件進行歸檔,檔案部門應確保歸檔知識文件的系統(tǒng)性與規(guī)范性。
此外,應明確檔案與知識融合管理的目標與原則,將資源分類、知識庫建設、應用、保護、更新等知識管理工作流程要求與檔案管理八大工作環(huán)節(jié)規(guī)范進行融合,規(guī)范統(tǒng)一,構建新的檔案知識管理工作模式。同時,推動檔案、圖書情報、檔案、知識產(chǎn)權等知識資源業(yè)務集成,構建知識集散中心,打破檔案管理與文件管理的界限,推動工作前移,對知識來源文件進行全生命周期管理,并進行價值與質(zhì)量評估。
2.4 技術維:技術應用與創(chuàng)新。基于ArcGPT構建數(shù)智化檔案資源服務體系,通過數(shù)字化處理、整合和分類,構建數(shù)字資源庫。知識圖譜、語言模型、機器學習模型、以生成式AI為代表的人工智能新興技術等先進技術的引入、應用和推廣,為數(shù)智化檔案資源服務體系提供了技術支撐,通過自然語言處理、機器學習等技術,滿足智能問答、自動分類、智能推薦等功能,進一步推動知識抽取、知識融合、知識發(fā)現(xiàn)等功能的實現(xiàn)。
首先,通過分類、關鍵詞提取、實體關系提取、摘要生成、向量嵌入等技術,針對多模態(tài)檔案數(shù)據(jù)資源進行知識提取,以此實現(xiàn)文檔的智能處理、數(shù)據(jù)清洗和分析。
其次,需要根據(jù)實體對齊和個性化業(yè)務需求形成數(shù)字檔案專題知識庫,完成數(shù)據(jù)集成和知識融合。
最后,通過自動化工具如自動標記、推理規(guī)則等與語言模型相結合,創(chuàng)建和管理知識圖譜、數(shù)據(jù)看板、視頻集,推動窗口端的個性化、模塊化搭建,揭示數(shù)據(jù)聯(lián)系和邏輯,提升內(nèi)容發(fā)現(xiàn)的效率和質(zhì)量,深度推進知識發(fā)現(xiàn)。
ArcGPT語言模型能夠通過模擬真實的檔案室環(huán)境和提供自由的交互操作,讓用戶仿佛置身于其中。用戶可以通過鼠標或觸摸屏等設備進行交互操作,進行自由瀏覽和探索,如放大縮小視圖、旋轉檔案、查看詳細信息等,獲得更加真實、直觀和便捷的檔案服務體驗。
3 基于ArcGPT的數(shù)智化檔案資源服務體系實現(xiàn)策略
在推動數(shù)智化檔案服務的創(chuàng)新與發(fā)展過程中,理念重塑、流程再造和技術賦能等策略發(fā)揮了重要作用。理念重塑強調(diào)以用戶為中心,注重服務質(zhì)量和效率的提升;流程再造通過優(yōu)化和再造檔案服務流程,提高了服務的規(guī)范化和自動化水平;技術賦能則依托先進的技術手段,為檔案服務提供了強大的技術支持和創(chuàng)新動力。這些策略推動了檔案服務的現(xiàn)代化和智能化發(fā)展。
3.1 理念重塑:樹立數(shù)智化檔案服務創(chuàng)新理念?!兑?guī)劃》指出:“檔案事業(yè)堅持人民立場。貫徹以人民為中心的發(fā)展思想,堅持檔案工作為了人民、依靠人民,建設好覆蓋人民群眾的檔案資源體系和方便人民群眾的檔案利用體系,提高人民群眾滿意度?!盵5]因此,基于ArcGPT的數(shù)智化檔案資源服務體系必須樹立人民主體地位、數(shù)智創(chuàng)新服務的建設理念,延伸檔案服務領域、提升人民參與度和參與體驗,充分實現(xiàn)檔案對國家和社會的價值。通過“制度創(chuàng)新+數(shù)智賦能”融合優(yōu)勢,持續(xù)優(yōu)化檔案服務環(huán)境,積極釋放政策效能,聚力支持高新技術推動檔案資源服務體系的智慧發(fā)展、新科技的應用、數(shù)據(jù)安全的治理和科技成果的轉化,推動檔案資源服務體系數(shù)智化轉型和升級產(chǎn)學研一體化發(fā)展。如百度文心大模型借助AIGC技術,經(jīng)由海量數(shù)據(jù)的學習分析,實現(xiàn)了對《富春山居圖》高精度的殘卷修復,為檔案文獻遺產(chǎn)數(shù)字化修復還原提供了新的思路。[6]
3.2 流程再造:打造全周期數(shù)智化服務的流程?,F(xiàn)代知識服務,更側重于知識利用效率和效果。為此,全周期數(shù)智化檔案資源服務體系需集知識獲取、數(shù)據(jù)清洗、知識利用和知識后評價于一體,以提升用戶黏性。
第一層是指檔案知識的發(fā)現(xiàn),通過構建檔案資源知識管理機制以及電子化、數(shù)字化和海量抓取存儲,建立檔案數(shù)據(jù)資源庫。政府部門負責構建立體式的制度政策支持創(chuàng)新體系,優(yōu)化“技術+文化+治理”環(huán)境,推動檔案支撐公共決策、人人都是檔案員理念深入社會各領域、全方位;政府和企業(yè)檔案機構承擔職能,建立檔案資源服務、知識傳授和傳播機制;社會組織和個人承接部分職能,開展規(guī)范化和差異化的檔案資政知識傳授指導服務活動。[7-9]
第二層是指數(shù)據(jù)價值的提煉,即“智慧數(shù)字化”,運用數(shù)字技術,把人從繁雜的勞動中解脫出來,由新興技術實現(xiàn)檔案資源數(shù)據(jù)的清洗和提煉。如耶魯大學的“讓二戰(zhàn)大屠殺受害者發(fā)聲(Let Them Speak)”項目,通過結合自然語言處理技術,實現(xiàn)了對近3 000份大屠殺幸存者所留存下的視聽資料、文本證詞等材料的數(shù)據(jù)清洗、文本挖掘與可視化,以此探究更深層次的語義關聯(lián)、集體記憶等內(nèi)容。[10]
6TJoEhSnswsgdHftowQTavULh5gPp+A9+UblXVJrCVU=第三層是指效率應用的賦能,把檔案數(shù)據(jù)的價值落地到應用場景,構成人機深度對話,使機器繼承人的某些邏輯和思維,實現(xiàn)深度學習,甚至能啟智于人,以智慧為紐帶。一方面,采用基于用戶需求的知識獲取與存儲、業(yè)務流程的導航、任務驅動的學習模式以及重塑內(nèi)容的方法,使用戶能夠快速、準確地獲取所需信息;另一方面,建立知識后評價模式,提供知識管理、合作、學習和適應以及監(jiān)測、評估和學習方面的服務生產(chǎn)和傳播的知識影響的指數(shù)的框架和方法,以衡量產(chǎn)品到達用戶后產(chǎn)生的傳播范圍、參與程度、消費情況、受眾感知,以及對公共政策和運營業(yè)務的影響等方面價值與效果。據(jù)此,不斷修正用戶服務,解決ArcGPT數(shù)智化檔案資源服務體系發(fā)展面臨的挑戰(zhàn)、提升ArcGPT數(shù)智化檔案資源服務體系聲譽以及改善運營效率。
3.3 技術賦能:構建虛實智能聯(lián)動的服務平臺。應用新興技術,結合知識發(fā)現(xiàn)、知識創(chuàng)造和知識應用的價值理念,構建虛實智能聯(lián)動的服務平臺,使檔案資源走向前端、走向價值創(chuàng)造。
第一,充分落實檔案資源“存量數(shù)字化、增量電子化”的要求,加強檔案管理系統(tǒng)檢索技術的效能,提升基于檔案的提取知識能力。同時,通過知識圖譜、數(shù)據(jù)挖掘、機器學習自然語言處理、智能搜索與智能推薦等人工智能技術和算法的分析與解釋能力,推動檔案工作從被動向主動,從傳統(tǒng)服務向知識服務轉變,增強知識分析與利用的能力,進而對檔案知識進行特征識別與建模,實現(xiàn)知識結構的重新組織。
第二,充分發(fā)揮技術革命作用,使數(shù)據(jù)增值,提高大數(shù)據(jù)的效用。數(shù)智化的終極目標便是機在人中、人在機中,實現(xiàn)資源在人、機中的高效流轉、多模呈現(xiàn)、價值創(chuàng)造。通過對企業(yè)生產(chǎn)建設、合規(guī)管理、經(jīng)營運維等方面的記錄和管理,為數(shù)字化技術的應用提供更多的數(shù)據(jù)支撐,推動數(shù)字化轉型和智能化升級,為數(shù)智化檔案資源服務體系的建設和發(fā)展提供更加堅實的基礎。[11-14]如中國石油天然氣集團有限公司通過新技術的應用,從數(shù)字檔案管理系統(tǒng)1.0到2.0的跨越,實現(xiàn)9大功能模塊、100項二級功能的全面升級,為檔案智能服務、深度開發(fā)利用等提供了檔案數(shù)據(jù)資源支撐。[15]
第三,形成知識產(chǎn)權。檔案資源服務走向前端,必須轉化為管理體系文件、轉化為企業(yè)技術標準,擁有一套自己的工作體系與標準并嵌入到用戶業(yè)務系統(tǒng),存入知識庫或相關系統(tǒng)。同時,在平臺集成專家知識分享模塊,構建學習型組織,促進知識的分享、交流,進一步提升知識創(chuàng)新能力。
4 結語
數(shù)智化檔案資源服務體系通過引入ArcGPT,能夠優(yōu)化檔案資源要素組合、激發(fā)檔案資源開發(fā)動力、活化檔案資源數(shù)據(jù)要素價值,推動檔案資源服務體系現(xiàn)代化與智能化轉型、提升檔案資源服務的效率與質(zhì)量、促進檔案資源個性化與模塊化服務。未來,隨著人工智能技術的更新迭代與數(shù)字化轉型的不斷深入,基于ArcGPT的數(shù)智化檔案資源服務體系將進一步優(yōu)化與完善,借助諸如增強現(xiàn)實(AR)、虛擬現(xiàn)實(VR)等創(chuàng)新技術的應用,推動檔案資源服務體系朝著數(shù)智化、開放化、系統(tǒng)化方向邁進并實現(xiàn)跨越式轉型。
本文系國家社科一般項目“面向高質(zhì)量發(fā)展的檔案治理效能評估及提升研究”(項目編號:23BTQ107)、河南省檔案局科技項目“基于組合分析法的檔案數(shù)據(jù)治理效能評估研究”(項目編號:2024-X-014)的階段性成果之一。
參考文獻:
[1]汪媛.揚州市民生檔案資源服務體系建設研究[D].揚州:揚州大學,2015.
[2][5]國家檔案局.中辦國辦印發(fā)《“十四五”全國檔案事業(yè)發(fā)展規(guī)劃》[EB/OL].[2024-04-01]. https://www.saac.gov.cn/daj/yaow/202106/899650c1b1ec4c0e9ad3c2ca7310eca4.shtml.
[3]求是網(wǎng).習近平在黑龍江考察時強調(diào) 牢牢把握在國家發(fā)展大局中的戰(zhàn)略定位 奮力開創(chuàng)黑龍江高質(zhì)量發(fā)展新局面[EB/OL].(2023-09-08)[2024-03-07].http://www.qstheory.cn/yaowen/2023-09/08/c_1129853352.htm.
[4]許劍穎,馮桂珍.ChatGPT賦能檔案服務:技術特征、應用場景與實現(xiàn)路徑[J].山西檔案,2023(06):111-120.
[6]新浪網(wǎng).用AI畫筆連接山河,文心大模型助力《富春山居圖》“山水合璧”[EB/OL].(2022-07-21)[2024-03-21]. https://news.sina.com.cn/sx/2022-07-21/detail-imizmscv2915979.shtml.
[7]歸吉官,邵曉瑜.新時代我國檔案資政服務體系:基本認知、內(nèi)容框架及結構模型[J].檔案管理,2023(01):26-29.
[8]黃洛鋒,曹紅.干部人事檔案專項審核及其研究述評[J].山西檔案,2019(01):100-106.
[9]馬宏正.政務檔案在線平臺的信息資源庫建設與服務功能創(chuàng)新[J].山西檔案,2017(03):60-62.
[10]The Yale Digital Humanities Lab.Let themspeak[EB/OL].(2022-12-25)[2024-03-25]. https://Its.fortunoff.library.yale.edu/.
[11]李靜丹.數(shù)智賦能勞動就業(yè)檔案服務體系建設研究[J].蘭臺內(nèi)外,2023(18):9-11.
[12]劉怡瑤,李姍姍.檔案事業(yè)現(xiàn)代化視域下檔案館服務價值共創(chuàng)機制與路徑[J].山西檔案,2023(06):70-77.
[13]岳幸暉,楊智勇.人工智能在檔案管理中的應用圖景與風險防范[J].檔案與建設,2023(10):36-40.
[14]趙梓吟.中國式現(xiàn)代化背景下城建檔案利用服務的時代使命、現(xiàn)實痛點與建設路徑[J].檔案與建設,2024(03):98-103.
[15]中國石油新聞中心.中國石油數(shù)字檔案館通過國家檔案局試點驗收[EB/OL].(2021-01-21)[2024-03-21]. http://news.cnpc.com.cn/system/2021/01/21/030022553.shtml.
(單位:1.河南警察學院警察管理系 婁海婷,博士,講師;2.鄭州大學信息管理學院 孫大東,博士,副教授,博士研究生導師 來稿日期:2024-05-24)