摘 要:人工智能技術(shù)作為當(dāng)前最熱門的檔案管理新工具,在檔案開發(fā)利用方面具有獨(dú)特優(yōu)勢(shì)。本文從人工智能應(yīng)用維度出發(fā),認(rèn)為在開發(fā)利用中自主開放審核技術(shù)、語義分析技術(shù)、數(shù)字檔案編研技術(shù)能夠提升效果。在實(shí)踐中,市政檔案管理部門存在著制度、技術(shù)、安全等方面的隱患,需要加強(qiáng)系統(tǒng)建設(shè)、技術(shù)應(yīng)用、制度供給,推動(dòng)市政工程技術(shù)檔案開發(fā)利用工作提檔升級(jí)。
關(guān)鍵詞:人工智能;市政工程;檔案;開發(fā)利用
市政工程技術(shù)檔案是指市政設(shè)施在規(guī)劃、建設(shè)、維護(hù)中形成的、具有較高保存價(jià)值的文字、圖表、音視頻、數(shù)據(jù)等。這些檔案資源在實(shí)現(xiàn)設(shè)施監(jiān)督、管理、維護(hù)和保證人民群眾利益方面具有重要作用。人工智能技術(shù)拓展了檔案開發(fā)利用的價(jià)值廣度和效率,成為檔案管理的變革因素,為市政工程技術(shù)檔案開發(fā)利用提供了廣闊的空間。
1 人工智能技術(shù)在檔案開發(fā)利用中的應(yīng)用維度
人工智能技術(shù)在服務(wù)檔案開發(fā)利用中主要通過以下幾個(gè)維度展開。
1.1 自主開放審核技術(shù)
開展市政工程技術(shù)檔案開放鑒定工作。劃分檔案開放與控制使用范圍,是提升城市智慧化建設(shè)的內(nèi)在要求,也是服務(wù)民生、服務(wù)社會(huì)的直接體現(xiàn)。隨著市政工程技術(shù)檔案數(shù)量的不斷增加、收集范圍的不斷延伸以及群眾需求的不斷增強(qiáng),檔案利用的需求不斷擴(kuò)大,檔案的利用面不斷拓展,使得檔案開放鑒定工作顯得尤為重要。目前依靠人工判斷的方式,影響和制約檔案鑒定的效率和質(zhì)量。開展智能審核方法和技術(shù)的研究十分必要。通過借助自主開放審核技術(shù),建立智能開放審核系統(tǒng),進(jìn)一步融合專業(yè)鑒定人員的專業(yè)知識(shí)和經(jīng)驗(yàn),建立具有突出層次關(guān)系的語義層次網(wǎng)絡(luò),建立適配于市政工程檔案劃控開放鑒定的語義規(guī)范、框架、模型和知識(shí)庫,從而提升檔案開放審核的速度和質(zhì)量。
1.2 語義分析技術(shù)
近年來,伴隨數(shù)據(jù)化的發(fā)展,市政工程檔案存儲(chǔ)形式發(fā)生根本轉(zhuǎn)變,數(shù)字資源呈現(xiàn)指數(shù)式增長態(tài)勢(shì)。但是,數(shù)據(jù)化檔案通過關(guān)鍵詞準(zhǔn)確率不高的弊端逐步顯現(xiàn),如何效滿足數(shù)字時(shí)代檔案利用的效率要求成為主要課題。語音識(shí)別技術(shù)在圖像識(shí)別、語音識(shí)別等多個(gè)領(lǐng)域的突破性進(jìn)展,為信息高效準(zhǔn)確查詢提供了新的途徑。語義分析(Semantic Analysis)是人工智能的一個(gè)分支,是自然語言處理技術(shù)的幾個(gè)核心任務(wù),涉及語言學(xué)、計(jì)算語言學(xué)、機(jī)器學(xué)習(xí)以及認(rèn)知語言等多個(gè)學(xué)科,語義分析任務(wù)有助于促進(jìn)其他自然語言處理任務(wù)的快速發(fā)展。語音識(shí)別技術(shù)融入檔案管理系統(tǒng),利用其深度學(xué)習(xí)優(yōu)勢(shì),通過建立有效的模型和系統(tǒng),實(shí)現(xiàn)在各個(gè)語言單位的自動(dòng)語義分析,促使自然語言處理能力的提高,在輸入自然語言時(shí),能夠檢索出與其相關(guān)的更多詞匯,避免機(jī)械匹配的不足,提升模糊查詢的準(zhǔn)確率,協(xié)助查詢者快速找到目標(biāo)。
1.3 數(shù)字檔案編研技術(shù)
人工智能技術(shù)可以運(yùn)用知識(shí)表示與處理技術(shù)實(shí)現(xiàn)檔案垂直領(lǐng)域的知識(shí)優(yōu)化,并通過大數(shù)據(jù)手段進(jìn)行用戶需求分析,助力檔案數(shù)據(jù)價(jià)值、知識(shí)價(jià)值的發(fā)揮,滿足用戶多元化、個(gè)性化的利用需求。具體而言,數(shù)字檔案編研技術(shù)包含三個(gè)層次:一是基礎(chǔ)檔案數(shù)據(jù)庫。這是智能編研的基礎(chǔ),數(shù)據(jù)庫以專題檔案為基礎(chǔ),構(gòu)建基于數(shù)據(jù)結(jié)構(gòu)的知識(shí)圖譜和單元,建立系統(tǒng)化的資源結(jié)構(gòu)和脈絡(luò)。二是借助數(shù)據(jù)挖掘、文本分析等技術(shù),對(duì)異構(gòu)資源進(jìn)行優(yōu)化組合,根據(jù)用戶需要調(diào)整,通過私有化部署大型語言模型直接生成編研內(nèi)容或者提綱。三是可視化展示。編研成果通過App、網(wǎng)站、新媒體等平臺(tái)向公眾推廣,展示檔案文化的獨(dú)特魅力。
2 人工智能技術(shù)在檔案開發(fā)利用中的不足
人工智能作為新技術(shù),在市政部門檔案管理應(yīng)用中還存在不少不足和困境。
2.1 制度供給不足
人工智能技術(shù)應(yīng)用的制度環(huán)境不夠完善。在制度規(guī)劃上頂層設(shè)計(jì)不足,主要表現(xiàn)在市政工程行業(yè)對(duì)人工智能技術(shù)的認(rèn)識(shí)不足,習(xí)慣性地認(rèn)為人工智能只應(yīng)用于傳統(tǒng)產(chǎn)業(yè)轉(zhuǎn)型升級(jí)、政府治理現(xiàn)代化和民生改善等領(lǐng)域,忽視了在檔案領(lǐng)域中的應(yīng)用,缺乏具體的實(shí)施辦法和操作指南。人工智能在市政工程中的制度環(huán)境、應(yīng)用范圍、準(zhǔn)入條件等謀劃不夠,缺乏長遠(yuǎn)的系統(tǒng)規(guī)劃和評(píng)估體系。人工智能技術(shù)的應(yīng)用需要制定更多更明確的法規(guī)政策、行業(yè)規(guī)范,保障人工智能在應(yīng)用中的數(shù)據(jù)安全,確保人工智能安全、可靠、可控。
2.2 信息共享不足
開發(fā)利用需要豐富的信息資源作為基礎(chǔ),隨著數(shù)字時(shí)代的到來,產(chǎn)生了大量市政工程技術(shù)檔案數(shù)字資源,但是部門之間普遍存在“不愿”“不敢”和“不會(huì)”共享開放的問題,制約共享共建的落實(shí),市政工程技術(shù)檔案管理部門在規(guī)劃、組織、體系和資金建設(shè)方面存在共享“藩籬”。部門、行業(yè)、機(jī)構(gòu)之間橫向聯(lián)系不足,常態(tài)化機(jī)制不健全,導(dǎo)致信息資源共享不順暢,信息價(jià)值無法充分發(fā)揮。研究團(tuán)隊(duì)、部門之間檔案信息資源互動(dòng)不充分,大數(shù)據(jù)應(yīng)用呈現(xiàn)出發(fā)展初級(jí)階段特征,處于“盲人摸象”階段。
2.3 技術(shù)應(yīng)用不足
市政工程領(lǐng)域人工智能還局限在服務(wù)智慧化階段,在檔案開發(fā)利用上應(yīng)用較少。在“一次辦好”理念的指引下,市政部門對(duì)政務(wù)檔案服務(wù)重視高,但是利用如知識(shí)庫技術(shù)、專家系統(tǒng)、模糊信息處理技術(shù)、數(shù)據(jù)挖掘技術(shù)、智能平臺(tái)等不足,檔案資源無法有效地向用戶展示,影響檔案服務(wù)利用效果。同時(shí),隨著人工智能在各行業(yè)的廣泛應(yīng)用,該領(lǐng)域人才需求呈爆發(fā)式增長,人才供給總量卻嚴(yán)重不足,市政工程部門人才引進(jìn)難度高,供需不平衡的矛盾較為凸顯。
2.4 安全建設(shè)不足
保障數(shù)據(jù)安全是促進(jìn)人工智能應(yīng)用的重要基礎(chǔ)。一方面,人工智能技術(shù)本身就具有多重風(fēng)險(xiǎn),系統(tǒng)內(nèi)風(fēng)險(xiǎn)和衍生風(fēng)險(xiǎn)交織,安全問題異常復(fù)雜。另一方面,市政部門缺乏較為完善的制度規(guī)定和規(guī)范,有的重要數(shù)據(jù)未能進(jìn)行分級(jí)分層管理,涉密數(shù)據(jù)失密風(fēng)險(xiǎn)加大。有的將人工智能技術(shù)完全代替人工審核,增加危及數(shù)據(jù)主權(quán)、信息安全的潛在風(fēng)險(xiǎn)。面對(duì)生成式人工智能引發(fā)的不確定性,需提前研判可能的安全風(fēng)險(xiǎn),找好人工智能與開發(fā)利用的平衡點(diǎn),重視防范風(fēng)險(xiǎn),構(gòu)建安全可靠的開發(fā)利用環(huán)境。
3 人工智能技術(shù)在市政工程技術(shù)檔案開發(fā)利用中的進(jìn)路
在新技術(shù)革命大潮下,人工智能技術(shù)融入開發(fā)利用已成為必然選擇,市政檔案管理部門需要從以下幾個(gè)方面進(jìn)行探索。
3.1 應(yīng)用好自主開放審核成果
要將開放審核流程再造與市政工程檔案信息化建設(shè)深度融合,堅(jiān)持前置和事后審核相結(jié)合,在數(shù)字檔案歸檔前開展前置審核,對(duì)存量檔案開展事后審核。
3.1.1用好自然語言處理技術(shù)(NLP)。作為人工智能的重要分支,該技術(shù)融合計(jì)算機(jī)科學(xué)、人工智能和語言學(xué)的知識(shí),旨在讓計(jì)算機(jī)能夠更好地與人類進(jìn)行自然語言交流。在開放審核時(shí),采用NLP技術(shù)可以使系統(tǒng)更好地理解檔案文本內(nèi)容,根據(jù)上下文對(duì)關(guān)鍵詞進(jìn)行語義分析,從而避免僅憑關(guān)鍵詞產(chǎn)生的錯(cuò)判與漏判問題。
3.1.2用好手寫體識(shí)別技術(shù)。在市政工程技術(shù)檔案眾多的圖紙、圖表、竣工圖中,存在大量字跡差距較大的手寫體,OCR識(shí)別率不高,影響檔案開放審核的進(jìn)度。引入人工智能識(shí)別技術(shù)后,可以對(duì)不同字跡進(jìn)行分析與學(xué)習(xí),建立語義通順度模型,根據(jù)行業(yè)特點(diǎn)引入文本糾錯(cuò)機(jī)制,以此提升手寫體OCR可識(shí)別率及準(zhǔn)確率。對(duì)于涉密檔案,通過批量智能化檢測(cè)待校核掃描件,對(duì)數(shù)字化加工工作查漏補(bǔ)缺,精準(zhǔn)、快速地發(fā)現(xiàn)疑似涉密的檔案,并注明疑似涉密的標(biāo)識(shí)信息,對(duì)密級(jí)、時(shí)效等智能化分析,以實(shí)現(xiàn)對(duì)涉密文件的有效管理。
3.1.3用好機(jī)器學(xué)習(xí)技術(shù)。機(jī)器學(xué)習(xí)通過訓(xùn)練算法模型形成數(shù)據(jù)模式,實(shí)現(xiàn)對(duì)檔案的分類、聚合等任務(wù),該技術(shù)能夠?qū)徍艘罁?jù)與結(jié)果轉(zhuǎn)化為審核知識(shí)庫,借助訓(xùn)練模型持續(xù)提升學(xué)習(xí)能力,不斷提升審核準(zhǔn)確率,成為自助審核的關(guān)鍵技術(shù)。
3.2 構(gòu)建好語義分析利用體系
3.2.1融入語義分析技術(shù)。在檔案管理系統(tǒng)融入語義分析技術(shù),在文本分類和情感分析的基礎(chǔ)上利用好問答系統(tǒng)和信息抽取功能。該功能作為語義分析技術(shù)的最新成果,能夠使計(jì)算機(jī)回答問題和從大量文本中提取所需信息。
3.2.2應(yīng)用搜索引擎。在市政工程技術(shù)檔案應(yīng)用領(lǐng)域,搜索引擎通過理解查詢意圖和分析網(wǎng)頁內(nèi)容來提供相關(guān)搜索結(jié)果,將相關(guān)內(nèi)容直接推送給查詢者,實(shí)現(xiàn)檔案資源供給最大化;在科研方面,文本處理和語義分析技術(shù)被用于從技術(shù)文獻(xiàn)中提取有用信息,為利用者提供市政技術(shù)豐富的文獻(xiàn)資源,為科研提供支持,推動(dòng)工程技術(shù)能力的提高。
同時(shí),虛擬助手能夠回答查詢者的語音指令,實(shí)現(xiàn)智能化的對(duì)話交互,提高工作效率。在實(shí)踐中,語義分析技術(shù)也面臨著處理復(fù)雜的上下文依賴、識(shí)別隱含信息和處理多語種等方面的問題,需要進(jìn)一步優(yōu)化突破。
3.3 發(fā)揮好數(shù)字檔案編研優(yōu)勢(shì)
數(shù)據(jù)挖掘、文本挖掘和知識(shí)圖譜是數(shù)字編研技術(shù)支撐,在提升市政工程技術(shù)檔案編研智慧化方面具有顯著作用。
3.3.1數(shù)據(jù)挖掘。它被視為人工智能的一個(gè)子領(lǐng)域,通過發(fā)現(xiàn)數(shù)據(jù)中的模式和關(guān)聯(lián)來幫助訓(xùn)練和改進(jìn)人工智能系統(tǒng),為提升人工智能水平提供重要的數(shù)據(jù)支持。在市政技術(shù)工程檔案中的結(jié)構(gòu)設(shè)計(jì)原理、工程測(cè)量、道路勘察設(shè)計(jì)、城市軌道交通的資料是城市規(guī)劃設(shè)計(jì)和可持續(xù)發(fā)展的重要參考,對(duì)這些檔案數(shù)據(jù)進(jìn)行價(jià)值挖掘,促使人工智能系統(tǒng)構(gòu)建數(shù)據(jù)預(yù)測(cè)模型。
3.3.2文本挖掘。文本挖掘可以對(duì)市政工程技術(shù)檔案中施工、管理、設(shè)計(jì)、養(yǎng)護(hù)等文字、音視頻、圖像、高頻詞等無序內(nèi)容進(jìn)行結(jié)構(gòu)化處理,從而實(shí)現(xiàn)對(duì)檔案數(shù)據(jù)庫資料的全方位掌握。
3.3.3智慧化編研系統(tǒng)。市政工程技術(shù)檔案編研以文獻(xiàn)為研究對(duì)象,以挖掘的檔案信息為內(nèi)容,對(duì)檔案信息進(jìn)行再加工、再篩選、再整理,轉(zhuǎn)化為不同形式的編研成果。在系統(tǒng)設(shè)置上,根據(jù)檔案特點(diǎn),建立專題策劃、數(shù)據(jù)模型、知識(shí)分析、編研類型、內(nèi)容分析等功能模塊,通過智能圖譜技術(shù),融合人工需求,如大事記、資政參考、技術(shù)匯編分析等,系統(tǒng)可直接生成編研內(nèi)容。
3.4 運(yùn)用好數(shù)字展陳新成果
數(shù)字展陳是以多媒體和數(shù)字化技術(shù)作為展示技術(shù),使用最新的影視動(dòng)畫技術(shù),結(jié)合獨(dú)到的圖形數(shù)字和人工智能技術(shù),以各類新穎的技術(shù)吸引參觀者,實(shí)現(xiàn)人機(jī)交互方式的展廳形式。數(shù)字展陳主要應(yīng)用三維建模和渲染、虛擬現(xiàn)實(shí)和增強(qiáng)現(xiàn)實(shí)等元宇宙技術(shù),能夠帶給觀眾身臨其境、虛擬相生的極致體驗(yàn)。市政工程技術(shù)檔案中涵蓋豐富的城市記憶、文化基因,是進(jìn)行精神文明建設(shè)的重要素材。數(shù)字展陳方式可以突破傳統(tǒng)開發(fā)方式的局限性,人工智能技術(shù)融入展覽布置中,為受眾提供更便捷、高效的參觀體驗(yàn),滿足受眾個(gè)性化的服務(wù)要求。市政部門利用人工智能技術(shù)手段打造現(xiàn)代化市政工程技術(shù)展示空間,通過虛擬現(xiàn)實(shí)、三維模型等技術(shù),采用多媒體展示手段,如視頻、音頻、圖片等形式在公眾號(hào)、網(wǎng)站呈現(xiàn),使受眾更加深入地了解建設(shè)過程中的各種細(xì)節(jié),從而更好地理解市政工程的復(fù)雜性和難度。
3.5 釋放好人工智能新動(dòng)能
3.5.1持續(xù)深化數(shù)據(jù)要素供給。數(shù)據(jù)是人工智能的教材,決定智能的范圍,高質(zhì)量數(shù)據(jù)要素供給是人工智能高質(zhì)量發(fā)展的重要保障。市政部門要搭建檔案數(shù)據(jù)共享平臺(tái),建立多模態(tài)數(shù)據(jù)集合,利用隱私計(jì)算、數(shù)據(jù)安全流通等技術(shù),將各工程的數(shù)據(jù)融通使用,適應(yīng)開發(fā)利用的新需求。
3.5.2持續(xù)深化制度要素供給。要提高思想認(rèn)識(shí),將人工智能技術(shù)作為檔案開發(fā)利用的助推器,找準(zhǔn)工作結(jié)合點(diǎn)和切入點(diǎn),把握發(fā)展規(guī)律,爭(zhēng)取資金支持。要堅(jiān)持以人為本理念,人工智能在內(nèi)的任何技術(shù)在市政工程領(lǐng)域應(yīng)用,出發(fā)點(diǎn)都要放在增強(qiáng)民眾的獲得感和滿足感上。要把安全制度建設(shè)放在突出位置,系統(tǒng)分析風(fēng)險(xiǎn)防控措施是否具有針對(duì)性和有效性,加強(qiáng)檔案數(shù)據(jù)分類分級(jí)管理,強(qiáng)化重要數(shù)據(jù)和敏感信息保護(hù),防范化解在開發(fā)利用中的安全風(fēng)險(xiǎn)。
3.5.3持續(xù)加強(qiáng)人才要素供給。市政部門要圍繞檔案事業(yè)發(fā)展需要和人才需求,研究和探索人工智能人才的發(fā)展目標(biāo)和路徑。要在引才增智上下功夫,營造人工智能人才發(fā)展的良好生態(tài)環(huán)境,激發(fā)人才創(chuàng)新創(chuàng)業(yè)活力,為開發(fā)利用工作提供堅(jiān)強(qiáng)的人才保證和廣泛的智力支持。
推進(jìn)檔案開發(fā)利用是新《檔案法》《“十四五”全國檔案事業(yè)發(fā)展規(guī)劃》的內(nèi)在要求。人工智能技術(shù)極大提升了檔案開放審核的效率和準(zhǔn)確性,為市政工程檔案服務(wù)提供更強(qiáng)大的支持。市政部門要從數(shù)字政府建設(shè)要求出發(fā),發(fā)揮好人工智能在開發(fā)利用方面的驅(qū)動(dòng)力,構(gòu)建人工智能開發(fā)利用模型,制作檔案開放審核關(guān)鍵詞表,提升自主編研水平和效果,展示檔案的時(shí)代價(jià)值和特色,更好地為經(jīng)濟(jì)社會(huì)發(fā)展服務(wù)。
參考文獻(xiàn)
[1]談立.語義分析技術(shù)在滿意度測(cè)評(píng)領(lǐng)域應(yīng)用研究[N].《中國質(zhì)量與標(biāo)準(zhǔn)導(dǎo)報(bào)》,2019(02):14-15.
[2]劉思含.人工智能與檔案開發(fā)利用:應(yīng)用、愿景與進(jìn)路 鄭慧;[J].《山西檔案》,2023(05):11—12.
[3]丁德勝.新時(shí)代新征程檔案工作呼喚智慧檔案戰(zhàn)略——智慧檔案館室數(shù)字技術(shù)創(chuàng)新應(yīng)用20個(gè)典型場(chǎng)景展望[N].《中國檔案報(bào)》,2023(07):20.
作者簡(jiǎn)介:徐瑩 (1989—) ,大學(xué)學(xué)歷 ,西安市市政設(shè)施管理中心助理館員,研究方向:市政工程技術(shù)檔案。