摘要:生成式人工智能是指具有文本、圖片、音頻、視頻等內(nèi)容生成能力的模型及相關(guān)技術(shù)。論文從政策基礎(chǔ)、技術(shù)基礎(chǔ)、實(shí)踐基礎(chǔ)三個(gè)方面分析生成式人工智能輔助檔案編研工作的可行性,并構(gòu)建數(shù)據(jù)處理層、模型訓(xùn)練層、智能應(yīng)用層、機(jī)制保障層,為生成式人工智能輔助檔案編研工作提供方案。
關(guān)鍵詞:ChatGPT 生成式人工智能 檔案編研工作
2022年,ChatGPT(Chat Generative Pretrained Transformer)橫空出世,成為引爆輿論的焦點(diǎn)。它是Open AI推出的聊天機(jī)器人程序,是在模仿人類語(yǔ)言的大型預(yù)訓(xùn)練語(yǔ)言模型(LLM)基礎(chǔ)上產(chǎn)生的一種生成式人工智能語(yǔ)言模型。經(jīng)過多次版本迭代,ChatGPT從GPT-1進(jìn)化到了GPT-4,可以執(zhí)行多種任務(wù),如多語(yǔ)種翻譯、文章摘要、角色扮演問答等。這種革命性的創(chuàng)新,掀起人們應(yīng)用生成式人工智能創(chuàng)作內(nèi)容的浪潮。在此背景下,生成式人工智能創(chuàng)新檔案編研模式,將促進(jìn)傳統(tǒng)人工編研向自動(dòng)化、智能化編研轉(zhuǎn)變,根據(jù)大量數(shù)據(jù)在不同的專業(yè)領(lǐng)域中構(gòu)建知識(shí)圖譜,發(fā)現(xiàn)編研脈絡(luò)及相關(guān)資源,大幅提高編研效率,得出具有高可靠性的結(jié)論,產(chǎn)生優(yōu)秀的編研成果。[1]
2023年7月13日,我國(guó)多部門聯(lián)合公布了《生成式人工智能服務(wù)管理暫行辦法》(以下簡(jiǎn)稱《辦法》),指出生成式人工智能是指具有文本、圖片、音頻、視頻等內(nèi)容生成能力的模型及相關(guān)技術(shù)。從現(xiàn)有的生成式人工智能模型來看,其功能特征主要體現(xiàn)為三個(gè)方面:一是強(qiáng)大的自然語(yǔ)言理解與交互能力。用戶可以使用自然語(yǔ)言與人工智能進(jìn)行互動(dòng),實(shí)現(xiàn)“人機(jī)智能交互”。二是多元化應(yīng)用場(chǎng)景的自適應(yīng)能力。通過對(duì)數(shù)據(jù)集進(jìn)行預(yù)訓(xùn)練,并根據(jù)不同的應(yīng)用場(chǎng)景進(jìn)行微調(diào),模型能夠適應(yīng)各種不同的應(yīng)用場(chǎng)景。三是開放場(chǎng)域的多模態(tài)內(nèi)容創(chuàng)造能力。生成式人工智能能夠輸出文本、音像、數(shù)字人等不同模態(tài)的內(nèi)容,實(shí)現(xiàn)了從“決策AI”到“生成式AI”,從“用戶生成內(nèi)容”到“人工智能生成內(nèi)容”,從“時(shí)空革命”到“知識(shí)革命”的技術(shù)躍遷。[2]從工作內(nèi)容看,檔案編研工作實(shí)質(zhì)上也是一項(xiàng)內(nèi)容生成工作。生成式人工智能憑借其強(qiáng)大的數(shù)據(jù)分析和處理能力,為檔案編研工作提供了全新的輔助手段,能夠大幅提升檔案編研工作的質(zhì)量和效率。
(一)政策基礎(chǔ)
《“十四五”全國(guó)檔案事業(yè)發(fā)展規(guī)劃》(以下簡(jiǎn)稱《規(guī)劃》)指出:“創(chuàng)新檔案工作理念、方法、模式,加快全面數(shù)字轉(zhuǎn)型和智能升級(jí)”“積極探索知識(shí)管理、人工智能、數(shù)字人文等技術(shù)在檔案信息深層加工和利用中的應(yīng)用。”《辦法》同時(shí)也是全球首部生成式人工智能領(lǐng)域的監(jiān)管法規(guī)。除此之外,我國(guó)在科技發(fā)展、網(wǎng)絡(luò)安全、個(gè)人信息保護(hù)、互聯(lián)網(wǎng)信息等多個(gè)方面已發(fā)布了多項(xiàng)法律、行政法規(guī)等規(guī)范性文件,構(gòu)成了人工智能領(lǐng)域多層級(jí)、立體化的規(guī)范治理體系,[3]為生成式人工智能在檔案編研工作中的應(yīng)用提供了強(qiáng)有力的政策保障。
(二)技術(shù)基礎(chǔ)
從生成式人工智能的運(yùn)行機(jī)制看,生成式人工智能的運(yùn)行機(jī)制主要包括三個(gè)步驟:首先,數(shù)據(jù)收集與處理,包括數(shù)據(jù)收集、數(shù)據(jù)清洗、數(shù)據(jù)轉(zhuǎn)換等過程。其次,模型預(yù)訓(xùn)練與模型微調(diào)。加工處理后的數(shù)據(jù)使用機(jī)器學(xué)習(xí)算法進(jìn)行模型訓(xùn)練,并根據(jù)應(yīng)用場(chǎng)景特色和數(shù)據(jù)特征進(jìn)行微調(diào)。最后,生成內(nèi)容。模型訓(xùn)練完成后,生成式AI可以利用已學(xué)習(xí)到的“知識(shí)”,根據(jù)輸入的指令,輸出新的內(nèi)容。這與檔案編研工作的流程(選題、選材、加工、編寫)十分契合。從生成式人工智能的技術(shù)支撐看,人工神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)和生成式對(duì)抗網(wǎng)絡(luò)(GAN)是生成式人工智能三個(gè)重要的技術(shù)支撐。這些技術(shù)積累為生成式人工智能在檔案編研工作的應(yīng)用提供了良好的技術(shù)基礎(chǔ),使生成式人工智能實(shí)現(xiàn)“思維類人”和“行為類人”,從而高質(zhì)高效地完成檔案編研工作。
(三)實(shí)踐基礎(chǔ)
過去,單一的以紙質(zhì)為載體的出版物是傳統(tǒng)編研成果的主要表現(xiàn)形式,其加工過程以文字校稿、圖片排版、布局調(diào)整為主,在形式上很難有突破和創(chuàng)新。[4]隨著新一代信息技術(shù)的發(fā)展,檔案編研呈現(xiàn)出編研素材廣泛化、編研手段技術(shù)化、成果形式豐富化、利用途徑多樣化的特征。[5]“AI+檔案”逐漸成為檔案事業(yè)發(fā)展的新趨勢(shì)。人工智能在檔案編研工作方面得以活化延展,針對(duì)檔案資源,收集信息需求,利用數(shù)據(jù)分析技術(shù)在原有檔案編目的基礎(chǔ)上進(jìn)行二次、三次編研加工,形成系統(tǒng)全面的匯編成果,主動(dòng)為機(jī)構(gòu)工作提供參考。[6]以國(guó)網(wǎng)江蘇省電力公司為例,該公司已經(jīng)建成一體化工程檔案利用平臺(tái),包含基礎(chǔ)服務(wù)、系統(tǒng)首頁(yè)、全景展示、檔案利用、系統(tǒng)管理、權(quán)限管理6個(gè)模塊,以及42個(gè)核心功能,初步實(shí)現(xiàn)了基于線路工程檔案的智能輔助編研應(yīng)用,并形成電子化、網(wǎng)絡(luò)化的編研成果。[7]
(一)數(shù)據(jù)處理層
1.多模態(tài)數(shù)字化采集。多模態(tài)數(shù)字化采集,即對(duì)各種不同形式的檔案信息資源進(jìn)行數(shù)字化轉(zhuǎn)化,實(shí)現(xiàn)機(jī)器可識(shí)讀和處理。在新的信息環(huán)境下,信息技術(shù)的發(fā)展使信息形態(tài)愈發(fā)多樣化,檔案信息呈現(xiàn)出多媒體、多格式、多粒度的多模態(tài)特征。以名人檔案為例,其形式包括文本、照片、視頻等多種媒體,不同媒體的格式也各不相同,如視頻有AVI、WMV、Mpeg-4等多種格式。在信息粒度方面,浙江省檔案館建立了地方名人專題數(shù)據(jù)庫(kù),并按時(shí)代、行業(yè)等維度進(jìn)行細(xì)分,而江西省檔案館將收錄的數(shù)字名人檔案按行業(yè)和類別進(jìn)行了劃分,[8]形成多種粒度的檔案信息?!兑?guī)劃》明確指出,要建設(shè)以檔案數(shù)字資源為主導(dǎo)的檔案資源體系,推進(jìn)“存量數(shù)字化、增量電子化”。在檔案編研工作中,不同模態(tài)的數(shù)字檔案資源能為模型進(jìn)行多模態(tài)訓(xùn)練奠定資源基礎(chǔ),使模型可以實(shí)現(xiàn)多種異構(gòu)模態(tài)數(shù)據(jù)協(xié)同推理,有利于多模態(tài)數(shù)據(jù)傳播外需與高級(jí)認(rèn)知智能內(nèi)需相互促進(jìn)。
2.多層級(jí)數(shù)據(jù)化組織。檔案資源數(shù)字化轉(zhuǎn)化后的數(shù)據(jù),通過文字轉(zhuǎn)換規(guī)則利用“one-hot”編碼進(jìn)行“詞向量”轉(zhuǎn)化,進(jìn)而被模型識(shí)讀和處理。模型則通過“注意力機(jī)制”計(jì)算不同層級(jí)的“詞向量”編碼,即提取話語(yǔ)間的語(yǔ)義,從而輸出內(nèi)容。因此,多層級(jí)數(shù)據(jù)化組織應(yīng)包含兩方面的內(nèi)容:一是數(shù)據(jù)預(yù)處理;二是數(shù)據(jù)深加工。前者是對(duì)所采集數(shù)字檔案資源進(jìn)行預(yù)處理。后者即對(duì)預(yù)處理后的檔案數(shù)據(jù)進(jìn)行文本挖掘和語(yǔ)義分析?;谏疃葘W(xué)習(xí)算法提取檔案的特征信息,通過“檔案語(yǔ)義參照框架”[9]自動(dòng)對(duì)非結(jié)構(gòu)化檔案數(shù)據(jù)進(jìn)行聚類整合,并按照文本、音頻、視頻、圖像等不同形式進(jìn)行分布設(shè)計(jì),形成分布式的具有語(yǔ)義關(guān)聯(lián)的結(jié)構(gòu)化檔案數(shù)據(jù)集,即“檔案語(yǔ)境知識(shí)庫(kù)”[10]。檔案資源從“數(shù)字化”到“數(shù)據(jù)化”再到“知識(shí)化”,既有利于確保選材的真實(shí)可靠和齊全完整,又有利于快速檢索到所需要的檔案數(shù)據(jù),大幅提升模型計(jì)算效率,使生成式人工智能輔助檔案編研工作成為可能。
(二)模型訓(xùn)練層
1.基礎(chǔ)模型預(yù)訓(xùn)練。生成式人工智能之所以“智能”,一是因?yàn)槠浠诖罅康臉颖緮?shù)據(jù)進(jìn)行了預(yù)訓(xùn)練,通過訓(xùn)練獲得理解人類意圖的能力,而不必額外執(zhí)行理解自然語(yǔ)言的任務(wù);二是因?yàn)槠湓陬A(yù)訓(xùn)練中學(xué)到的“知識(shí)”沉淀在了大量的模型參數(shù)中,而模型越大,越智能。以ChatGPT為例,從GPT-1到GPT-3,參數(shù)從1.5億個(gè)增長(zhǎng)到1750億個(gè),增長(zhǎng)了1000多倍。因此,模型預(yù)訓(xùn)練成為生成式人工智能輔助檔案編研工作的關(guān)鍵環(huán)節(jié)。這關(guān)乎檔案編研工作是否足夠“智能”,能否生成高質(zhì)量的檔案編研成果。由于檔案形式多樣,單一模態(tài)的模型不符合多樣化檔案編研成果需求的實(shí)際情況,應(yīng)選擇融合模型訓(xùn)練,如自然語(yǔ)言文本可以選擇RNN或LSTM模型,圖像可以選擇GAN、VAE、neural-en? hance或擴(kuò)散模型。經(jīng)過訓(xùn)練的模型,可以從未見過的數(shù)據(jù)中做出有用的“預(yù)測(cè)”,即生成內(nèi)容。
2.訓(xùn)練方法與優(yōu)化。首先,從已有的檔案編研成果中,選擇數(shù)量多且質(zhì)量高的樣本數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練,使模型學(xué)習(xí)檔案編研的“知識(shí)”,而海量的數(shù)據(jù)樣本能夠使模型在不同場(chǎng)景下通過對(duì)參數(shù)的調(diào)整來適應(yīng)下游多種任務(wù),進(jìn)而提升學(xué)習(xí)語(yǔ)言結(jié)構(gòu)的能力。高質(zhì)量的樣本數(shù)據(jù),能夠避免模型出現(xiàn)“幻覺”,即形成非基于真實(shí)數(shù)據(jù)生成的內(nèi)容或信息。其次,選擇合適的訓(xùn)練方法。根據(jù)訓(xùn)練的檔案數(shù)據(jù)集是否有標(biāo)簽,訓(xùn)練方法可以劃分為監(jiān)督學(xué)習(xí)(使用帶有標(biāo)簽的數(shù)據(jù)來訓(xùn)練模型)和無監(jiān)督學(xué)習(xí)(使用沒有標(biāo)簽的數(shù)據(jù)來訓(xùn)練模型)。從數(shù)據(jù)類型看,檔案數(shù)據(jù)可分為結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)。前者具有嚴(yán)格的格式和長(zhǎng)度規(guī)范,更易于機(jī)器識(shí)別,可使用無監(jiān)督學(xué)習(xí)進(jìn)行訓(xùn)練。后者需要人工對(duì)檔案數(shù)據(jù)進(jìn)行標(biāo)注,再使用監(jiān)督學(xué)習(xí)進(jìn)行訓(xùn)練。最后,微調(diào)與優(yōu)化模型。檔案編研模型需要根據(jù)檔案編研工作的特性和原則進(jìn)行微調(diào),并通過“強(qiáng)化學(xué)習(xí)+人類反饋”機(jī)制持續(xù)優(yōu)化模型,以適應(yīng)不同的檔案編研主題。
(三)智能應(yīng)用層
1.智能人機(jī)交互。智能人機(jī)交互是生成式人工智能較為普遍的功能之一。在檔案編研工作中,智能人機(jī)交互應(yīng)具備以下四個(gè)特性:第一,易用性。編者可以直接使用自然語(yǔ)言對(duì)生成式人工智能輸入指令,如檔案編研的工作規(guī)劃、主題挖掘、關(guān)鍵詞提取、內(nèi)容總結(jié)等。第二,即時(shí)性。生成式人工智能實(shí)時(shí)響應(yīng)編者的請(qǐng)求和反饋,不需要等待人工干預(yù),還可以根據(jù)歷史對(duì)話分析上下文語(yǔ)境,進(jìn)行多輪交互。第三,個(gè)性化。生成式人工智能可以根據(jù)編者對(duì)編研主題的個(gè)性化需求和偏好,提供定制化的服務(wù)和解決方案,從而更好地滿足編者的需求。第四,多模態(tài)。編者可以通過多種方式(如語(yǔ)音、圖像、文本等)與用戶進(jìn)行交互,如輸入一張照片或一段語(yǔ)音,要求AI分析或總結(jié)其中的內(nèi)容。
2.智能內(nèi)容生成。一般意義上的機(jī)器學(xué)習(xí)或深度學(xué)習(xí),可以分為生成式和判別式。以大事記編研為例,判別式人工智能需要先編寫“大事記”的規(guī)則,才能識(shí)別“何為大事記”,主要用于分類。而生成式人工智能通過訓(xùn)練“大事記”標(biāo)簽數(shù)據(jù)和非標(biāo)簽數(shù)據(jù),構(gòu)建基礎(chǔ)模型,根據(jù)編者輸入的指令或內(nèi)容,輸出新的“大事記”內(nèi)容。因此,智能內(nèi)容生成是生成式人工智能最大的特色。按照內(nèi)容生成的類型,生成式人工智能可以分為以下四種類型:一是文本處理類。這種類型的生成式人工智能主要用于文本的處理和生成。例如,在國(guó)外,搜索引擎Bing和辦公軟件Office一般會(huì)接入GPT-4,實(shí)現(xiàn)檢索和辦公的智能化。二是計(jì)算機(jī)視覺類。這種類型的生成式人工智能主要用于圖像和視頻的處理與生成,如Midjourney、Stable Diffusion。三是音頻創(chuàng)作類。這種類型的生成式人工智能主要用于音頻的處理與生成,如Boomy、Riffusion。四是智能體類。這種類型的生成式人工智能主要用于模擬人類行為或進(jìn)行智能決策。這些技術(shù)可以根據(jù)輸入的環(huán)境數(shù)據(jù)和其他相關(guān)信息,自動(dòng)生成符合特定目標(biāo)的新行為或決策。例如,PeopleAI和Historical Figures可以通過模擬與名人的聊天來教授學(xué)生歷史。隨著讀圖時(shí)代的到來,人們更加傾向于可視、可聽的信息接收模式,如新媒體與檔案編研工作的交融,催生了新的編研形式——微編研。[11]因此,檔案編研成果不應(yīng)僅僅為單一模態(tài)的紙質(zhì)檔案編研成果,檔案編研模型應(yīng)集成多模態(tài)輸入和跨模態(tài)輸出功能應(yīng)用,產(chǎn)出更多類型或復(fù)合型的編研成果,如文本到文本、圖像、視頻、音頻,或圖像到文本、圖像、視頻、音頻等。
(四)機(jī)制保障層
1.資源共享機(jī)制。資源共享機(jī)制是生成式人工智能輔助檔案編研工作的核心機(jī)制。資源共享機(jī)制主要包括兩個(gè)方面。一方面是檔案資源共享。由于各地經(jīng)濟(jì)發(fā)展水平、管理水平、政策的影響,檔案資源共享問題始終制約著檔案工作水平。要發(fā)揮檔案存史、資政、育人的作用,實(shí)現(xiàn)檔案的價(jià)值,檔案編研工作必須走檔案資源共建共享的發(fā)展道路,為建設(shè)檔案知識(shí)庫(kù)進(jìn)行檔案編研模型訓(xùn)練奠定資源基礎(chǔ)。另一方面是模型資源共享。據(jù)統(tǒng)計(jì),1760億參數(shù)的語(yǔ)言模型BLOOM的完整訓(xùn)練需要排放大約24.7噸二氧化碳,而GPT-3一次完整訓(xùn)練的二氧化碳排放量達(dá)到了驚人的502噸,提高了20倍。[12]因此,各自為政建設(shè)獨(dú)立的檔案編研模型顯然不符合我國(guó)綠色發(fā)展的道路。國(guó)外已有相關(guān)建設(shè)經(jīng)驗(yàn),瑞典國(guó)家圖書館團(tuán)隊(duì)利用NVIDIA DGX系統(tǒng),開發(fā)了20多個(gè)開源的Transformer模型。這些模型每月被多達(dá)20萬(wàn)名開發(fā)者下載,可以支持圖書館和其他學(xué)術(shù)機(jī)構(gòu)的研究。[13]資源共享機(jī)制既可以減少重復(fù)建設(shè)成本,又可以避免各自為政的“信息孤島”現(xiàn)象的出現(xiàn)。
2.確權(quán)免責(zé)機(jī)制。確權(quán)免責(zé)機(jī)制是生成式人工智能輔助檔案編研工作的基礎(chǔ)機(jī)制。生成式人工智能在展現(xiàn)創(chuàng)造力的同時(shí),也帶來了諸多風(fēng)險(xiǎn)和挑戰(zhàn)。以著作權(quán)為例,我國(guó)還未有對(duì)生成式人工智能著作權(quán)方面的規(guī)定。根據(jù)《中華人民共和國(guó)著作權(quán)法》,人工智能不是“人”且不足以成為“擬制人”。雖然人工智能生成的文字、音樂、繪畫、圖形等生成物具有作品的外觀,但是歸根結(jié)底屬于人類的智力勞動(dòng)成果,其著作權(quán)也就屬于人類主體。[14]可見,生成式人工智能僅僅是一項(xiàng)輔助檔案編研工作的科技工具,檔案編研成果的著作權(quán)仍屬于檔案編研工作者或檔案編研機(jī)構(gòu)。盡管生成式人工智能在技術(shù)上取得了巨大突破,在檔案編研工作中應(yīng)用生成式人工智能時(shí)仍應(yīng)盡量規(guī)避數(shù)據(jù)濫用、數(shù)據(jù)違規(guī)等風(fēng)險(xiǎn)。此外,還需要構(gòu)建相關(guān)免責(zé)機(jī)制,為生成式人工智能輔助檔案編研保駕護(hù)航,讓檔案工作者以更加開放的心態(tài)積極擁抱新技術(shù)。
3.人機(jī)對(duì)齊機(jī)制。人機(jī)對(duì)齊機(jī)制是生成式人工智能輔助檔案編研工作的重要機(jī)制。人機(jī)對(duì)齊機(jī)制的核心是確保機(jī)器學(xué)習(xí)系統(tǒng)的目標(biāo)與人類設(shè)計(jì)意圖相吻合?!掇k法》第四條第一款“堅(jiān)持社會(huì)主義核心價(jià)值觀,不得生成煽動(dòng)顛覆國(guó)家政權(quán)、推翻社會(huì)主義制度,危害國(guó)家安全和利益……以及虛假有害信息等法律、行政法規(guī)禁止的內(nèi)容”;2021年9月25日,《新一代人工智能倫理規(guī)范》提出了增進(jìn)人類福祉、促進(jìn)公平公正、保護(hù)隱私安全、確??煽乜尚?、強(qiáng)化責(zé)任擔(dān)當(dāng)、提升倫理素養(yǎng)等6項(xiàng)基本倫理要求。檔案工作具有政治性和機(jī)密性,涉及國(guó)家利益、社會(huì)利益和個(gè)人利益?;诖?,生成式人工智能輔助檔案編研工作應(yīng)當(dāng)嚴(yán)格遵守人機(jī)對(duì)齊機(jī)制,不得將其用于違反法律、違背道德的用途。正如喬布斯所言:“人工智能對(duì)未來社會(huì)起到重要作用,每一項(xiàng)技術(shù)都有可能被濫用。我們必須遵守正確的道德準(zhǔn)則,確保人工智能的應(yīng)用成果是有益的。”
以ChatGPT為代表的生成式人工智能勢(shì)必會(huì)改寫內(nèi)容創(chuàng)作的生態(tài)。利用生成式人工智能輔助檔案編研工作是時(shí)代潮流。理論上,生成式人工智能與檔案編研工作流程相契合。技術(shù)上,生成式人工智能可以通過自然語(yǔ)言處理、深度學(xué)習(xí)等技術(shù),將大量的歷史文獻(xiàn)資料進(jìn)行自動(dòng)化處理,提取其中的關(guān)鍵信息,如時(shí)間、地點(diǎn)、人物、事件等,從而為檔案編研提供更加豐富、全面的數(shù)據(jù)支持。可見,生成式人工智能在檔案編研工作中具有廣泛的應(yīng)用前景和技術(shù)基礎(chǔ)。
*本文系國(guó)家社會(huì)科學(xué)基金項(xiàng)目“中共云南地方組織沿革檔案資料整理及專題數(shù)據(jù)庫(kù)建設(shè)(1926—1950)”(項(xiàng)目編號(hào):22BTQ084)的研究成果之一。
注釋及參考文獻(xiàn):
[1]劉麗,王兆偉,張明智,等.生成式人工智能對(duì)檔案工作的影響——從ChatGPT談起[J].浙江檔案,2023(9):47-50.
[2]郭小東.生成式人工智能的風(fēng)險(xiǎn)及其包容性法律治理[J].北京理工大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2023,25(6):93-105;117.
[3]劉紅林.中國(guó)AIGC創(chuàng)業(yè),法律監(jiān)管、政策匯總[EB/OL].(2023- 07- 31)[2023- 09- 30].https://mp. weixin.qq.com/s/A70bzUCi2K-wW_6WQtYUFA.
[4]李莎莎.信息化條件下檔案編研工作新思考[J].北京檔案,2021(4):25-27.
[5]吳志杰.新技術(shù)環(huán)境下檔案編研工作探析[J].北京檔案,2019(6):25-27.
[6]牛力,黎安潤(rùn)澤,劉慧琳.融合、延展、重構(gòu):物理與數(shù)字雙空間業(yè)務(wù)轉(zhuǎn)型視角下的檔案信息技術(shù)應(yīng)用思考[J].檔案學(xué)通訊,2023(5):19-27.
[7]王永梅,孫平.線路工程檔案智能輔助編研[J].中國(guó)檔案,2016(2):60-61.
[8]李耕華,鄒政民,田常清.我國(guó)檔案館數(shù)字名人檔案資源建設(shè)現(xiàn)狀研究——基于對(duì)31個(gè)省級(jí)綜合檔案館網(wǎng)站的調(diào)查[J].浙江檔案,2022(4):60-62.
[9]趙生輝,胡瑩,宋和平.檔案語(yǔ)義參照框架:邏輯、架構(gòu)與實(shí)證[J].檔案學(xué)通訊,2023(1):53-60.
[10]趙生輝,胡瑩,宋和平.檔案文本語(yǔ)境知識(shí)庫(kù)建設(shè)理論與實(shí)踐研究[J].檔案學(xué)研究,2023(1):132-139.
[11]胡吉明,羅行,陳曄.新媒體環(huán)境下的檔案微編研內(nèi)容結(jié)構(gòu)研究[J].北京檔案,2022(6):16-20.
[12]車萬(wàn)翔,竇志成,馮巖松,等.大模型時(shí)代的自然語(yǔ)言處理:挑戰(zhàn)、機(jī)遇與發(fā)展[J].中國(guó)科學(xué):信息科學(xué),2023,53(9):1645-1687.
[13] nvidia.瑞典國(guó)家圖書館利用AI解讀百年數(shù)據(jù)[EB/OL].(2023- 10- 13)[2023- 10- 15].https://mp. weixin.qq.com/s/sWWdQp-ek-aNACkivSCFVQ.
[14]徐家力.人工智能生成物的著作權(quán)歸屬[J].暨南學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版),2023,45(4):37-49.
作者單位:云南大學(xué)歷史與檔案學(xué)院