文/中國(guó)人民解放軍海軍工程大學(xué) 黃金輝 范慧麗 曾欣平
隨著GPU性能的大幅提升和制造成本下降,帶動(dòng)人工智能算力瓶頸突破。同時(shí),政府機(jī)構(gòu)為了鼓勵(lì)和支持創(chuàng)新,發(fā)布了人工智能相關(guān)的政策及規(guī)劃,人工智能技術(shù)開始在市場(chǎng)中得到大規(guī)模應(yīng)用。然而,高校教學(xué)檔案管理依然沿襲傳統(tǒng)的工作方式,導(dǎo)致檔案收集難、整理效率低、服務(wù)利用差、管理任務(wù)重和信息系統(tǒng)安全等問題。在這種背景下,學(xué)術(shù)界提出人工智能技術(shù)在檔案管理工作中的應(yīng)用理念,如何將人工智能技術(shù)應(yīng)用到高校教學(xué)檔案管理工作中,以解決當(dāng)前存在的問題,值得我們進(jìn)行深入研究和思考。
高校教學(xué)檔案是教學(xué)管理和教學(xué)實(shí)踐活動(dòng)中直接形成的對(duì)學(xué)生、學(xué)校和社會(huì)具有保存價(jià)值的各種文字、圖表、聲像等不同形式、載體的歷史記錄,主要包括招生材料、學(xué)籍材料、畢業(yè)生材料等,這些是為用戶提供利用服務(wù)的基礎(chǔ),也是反映高校教學(xué)、學(xué)生管理、課程改革、教師評(píng)估、學(xué)科發(fā)展等工作的全過程,是高校辦學(xué)特色和辦學(xué)宗旨的鮮明體現(xiàn),具有提高教學(xué)質(zhì)量和進(jìn)行教學(xué)改革的必備條件,是評(píng)價(jià)教學(xué)水平和成績(jī)的科學(xué)依據(jù)。因此,高校教學(xué)檔案的作用取決于高校教學(xué)檔案管理工作的好壞,但其存在以下問題:
(一)重視不足,檔案收集難。由于檔案管理人員缺乏正確的認(rèn)識(shí),文件材料收集不及時(shí)和不完整。從檔案管理人員角度看,檔案管理單位制訂和發(fā)布檔案管理工作細(xì)則等文件,組織業(yè)務(wù)培訓(xùn)工作,檔案產(chǎn)生單位既了解檔案管理內(nèi)容,也明確檔案移交的意義和重要性,但移交檔案的積極性不高;從檔案產(chǎn)生單位角度看,部分教師認(rèn)為檔案工作不是主要工作內(nèi)容,體現(xiàn)不出自己的工作成果。另外,檔案移交后查詢利用需要提交審批流程,手續(xù)繁雜,查詢結(jié)果反饋無(wú)明確時(shí)效,如果檔案留存在自己?jiǎn)挝?,無(wú)須審批流程可隨時(shí)查閱。由此可見,檔案收集難的原因在于檔案管理工作人員重視不足和檔案服務(wù)利用感知度差。
(二)專業(yè)人員不足,檔案整理效率低。部分高校檔案管理專業(yè)人員配置方面以教師兼職為主,由于檔案管理理論知識(shí)體系不健全和對(duì)工作內(nèi)容了解不足,檔案管理效率低下。外包服務(wù)雖然可以作為一種解決方案,卻因?yàn)橥獍藛T的非專業(yè)性,存在檔案分類質(zhì)量差、失泄密風(fēng)險(xiǎn)等問題。由于檔案價(jià)值鑒定工作專業(yè)化程度高,對(duì)檔案工作者提出了更高的工作要求。一方面,勝任該工作的人員數(shù)量有限;另一方面,要保障工作質(zhì)量必然導(dǎo)致整體效率低的問題。
(三)檔案管理工作者自身素質(zhì)不高,檔案管理任務(wù)重。部分高校教學(xué)檔案管理方式較為落后,檔案管理工作者缺乏先進(jìn)的學(xué)習(xí)能力和管理意識(shí),對(duì)教學(xué)檔案管理現(xiàn)存問題未做深入思考,也未自主學(xué)習(xí)新知識(shí)、新技能。檔案仍采用人工管理方式,隨著檔案實(shí)體數(shù)量的增加,容易造成檔案出入庫(kù)、查閱、借閱賬目不清;以紙質(zhì)記錄方式管理人員進(jìn)出庫(kù)房,管理極不嚴(yán)格;“八防”設(shè)備與智慧校園建設(shè)目標(biāo)脫節(jié),防火采用傳統(tǒng)滅火器,恒溫采用家用空調(diào),除濕采用除濕機(jī),各防護(hù)設(shè)備獨(dú)立運(yùn)行(門禁、溫濕度控制、消防),不具備遠(yuǎn)程控制和自動(dòng)預(yù)警功能,庫(kù)房管理效率低下;系統(tǒng)安全防護(hù)方面,現(xiàn)有檔案管理系統(tǒng)以局域網(wǎng)方式進(jìn)行訪問或采用單機(jī)方式運(yùn)行服務(wù),雖能有效防止病毒感染和黑客入侵,避免數(shù)據(jù)泄露和損毀,但使用不方便。
(四)重保管,輕利用。檔案管理工作除盡量延長(zhǎng)檔案的壽命外,檔案作為有價(jià)值的歷史記錄資料,只有充分發(fā)掘利用才能使其價(jià)值得到發(fā)揮。目前高校教學(xué)檔案管理主要集中在庫(kù)房建設(shè)和實(shí)體檔案管理方面,在如何利用方面以線下業(yè)務(wù)查詢和編研為主,未對(duì)教學(xué)檔案管理過程中生成的數(shù)據(jù)和檔案資源做進(jìn)一步挖掘,檔案利用方式單一。用戶查詢、借閱行為產(chǎn)生的登記數(shù)據(jù),僅作為日常記錄、催還和事后溯源保障檔案實(shí)體安全使用。學(xué)籍檔案作為學(xué)生在校期間基本情況的材料,也僅僅作為反映學(xué)生個(gè)人思想、生活和學(xué)習(xí)情況,提供給檔案查詢單位或出具學(xué)籍證明等相關(guān)業(yè)務(wù)。
(五)信息化與信息安全沖突。教學(xué)檔案高效查詢利用的及時(shí)性、準(zhǔn)確性和便利性對(duì)檔案信息化建設(shè)提出了迫切需求,卻與教學(xué)檔案信息化建設(shè)滯后、檔案涉密特性相矛盾。一方面,需要通過信息化手段,改變教學(xué)檔案落后的管理工作方式,創(chuàng)建便捷的檢索條件,提升服務(wù)利用效率;另一方面,信息化必然會(huì)增加檔案信息被黑客入侵竊取、病毒感染、數(shù)據(jù)泄露等風(fēng)險(xiǎn)。
目前,大部分高校教學(xué)檔案管理方式采用手工管理與計(jì)算機(jī)輔助相結(jié)合的手段,即教務(wù)部門從各教學(xué)檔案生成單位將紙質(zhì)檔案收集完成后,移交至檔案管理部門進(jìn)行系統(tǒng)著錄、掃描和掛接。當(dāng)有檔案查詢、借閱需求產(chǎn)生時(shí),需填寫紙質(zhì)審批單據(jù),檔案管理人員在檔案管理系統(tǒng)中輸入關(guān)鍵詞或檔案分類號(hào)進(jìn)行檢索,定位檔案所在具體庫(kù)房密集架位置,找出相應(yīng)的紙質(zhì)檔案進(jìn)行復(fù)印。從以上檔案查詢借閱流程可以看出,陳舊的管理方式是高校教學(xué)檔案管理工作問題產(chǎn)生的根本原因。人工智能技術(shù)已在眾多領(lǐng)域應(yīng)用,我們需要抓住新技術(shù)應(yīng)用的契機(jī),積極推進(jìn)人工智能在高校教學(xué)檔案管理應(yīng)用中的理論研究和探索。
(一)智能收集。檔案收集作為檔案管理工作的第一步,決定了后續(xù)環(huán)節(jié)是否能夠順利進(jìn)行,其重要程度不言而喻。高校教學(xué)檔案由紙質(zhì)檔案和與之對(duì)應(yīng)的電子檔案構(gòu)成。紙質(zhì)檔案由教務(wù)根據(jù)教學(xué)檔案管理工作細(xì)則進(jìn)行收集,人工智能可以根據(jù)規(guī)則設(shè)定到期收集提醒服務(wù);電子檔案收集包含結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)兩部分,結(jié)構(gòu)化數(shù)據(jù)利用智能Agent技術(shù)可以實(shí)現(xiàn)在網(wǎng)絡(luò)環(huán)境中智能抓取網(wǎng)頁(yè)信息,并生成用戶需求的數(shù)據(jù)格式來(lái)實(shí)現(xiàn)電子檔案的有效收集。智能Agent具有非常強(qiáng)的自主性和交互性,可以根據(jù)使用者制訂的收集規(guī)則主動(dòng)收集所需信息,并為使用者提供相應(yīng)的服務(wù)。對(duì)于非結(jié)構(gòu)化電子檔案數(shù)據(jù),需要采用圖像識(shí)別、語(yǔ)音識(shí)別進(jìn)行文本轉(zhuǎn)換,對(duì)于模糊不清的圖片采用圖片處理技術(shù)進(jìn)行降噪、補(bǔ)光、超分辨率重建處理,生成高清晰圖片。
(二)智能整理。教學(xué)檔案整理涉及鑒定和分類環(huán)節(jié)。檔案價(jià)值鑒定對(duì)專業(yè)性要求較高,直接影響檔案是否保存。檔案分類的合理性,決定檔案檢索利用的準(zhǔn)確性和完整性。首先,人工智能建立知識(shí)庫(kù),收集教學(xué)檔案管理領(lǐng)域?qū)<覚n案價(jià)值鑒定的知識(shí)和經(jīng)驗(yàn)映射成規(guī)則;其次,輸入訓(xùn)練用數(shù)據(jù)集并將輸出結(jié)果與專家判斷結(jié)果進(jìn)行對(duì)比,調(diào)整規(guī)則參數(shù),完善鑒定系統(tǒng)。檔案分類需要根據(jù)檔案介質(zhì)不同選擇對(duì)應(yīng)的人工智能技術(shù)。文本檔案采用自然語(yǔ)言處理技術(shù)根據(jù)教學(xué)檔案歸檔范圍,對(duì)文件名進(jìn)行識(shí)別,例如人才培養(yǎng)方案、教學(xué)計(jì)劃、教學(xué)工作制度等。并將分類信息標(biāo)注在文本上,例如分類名冊(cè)、保管期限等,并根據(jù)這些信息進(jìn)行分類。圖片檔案采用圖像識(shí)別技術(shù)對(duì)圖片中的物體進(jìn)行識(shí)別分類。音頻檔案采用語(yǔ)音識(shí)別技術(shù)進(jìn)行智能識(shí)別分類。
(三)智能管理。智能安全管理主要包含檔案庫(kù)房管理和信息安全防護(hù)兩部分。檔案庫(kù)房管理主要包括環(huán)境監(jiān)測(cè)、人員監(jiān)測(cè)、檔案排架功能。環(huán)境監(jiān)測(cè)主要通過對(duì)原始視頻圖像經(jīng)過背景建模、目標(biāo)檢測(cè)與識(shí)別、目標(biāo)跟蹤等一系列算法,分析其中的行為以及事件,實(shí)現(xiàn)溫濕度自動(dòng)調(diào)節(jié)、非法闖入報(bào)警等“八防”環(huán)境監(jiān)測(cè)。人員監(jiān)測(cè)采用人臉識(shí)別和指紋識(shí)別技術(shù)進(jìn)行身份校驗(yàn),對(duì)庫(kù)房出入人員行為實(shí)時(shí)監(jiān)控,若遇非法行為自動(dòng)報(bào)警,同時(shí)作為日志記錄,在意外情況發(fā)生時(shí)進(jìn)行追蹤溯源。檔案排架是通過RFID和智能機(jī)器人共同實(shí)現(xiàn),依據(jù)教學(xué)檔案的排架規(guī)則,收集錄入檔案信息,系統(tǒng)掃描識(shí)別自行判斷檔案所屬庫(kù)房和密集架位置并由機(jī)器人完成排架工作。信息安全防護(hù)主要包括病毒檢測(cè)、攔截入侵、日志監(jiān)測(cè)等技術(shù)實(shí)現(xiàn)對(duì)檔案數(shù)據(jù)的保護(hù)。
(四)智能服務(wù)利用。智能服務(wù)利用主要包括智能檢索和智能利用兩部分。智能檢索是通過自然語(yǔ)言處理、人機(jī)交互技術(shù)實(shí)現(xiàn)智能問答系統(tǒng),根據(jù)用戶的檢索行為,獲取用戶顯性和隱形檢索需求,引導(dǎo)用戶進(jìn)行高效檢索,同時(shí)簡(jiǎn)化審批手續(xù),實(shí)時(shí)在線自主查詢、借閱。教學(xué)檔案除了滿足如學(xué)籍證明、工作查考、編史修志、展覽宣傳等工作外,還可以在學(xué)籍管理、招生畢業(yè)、檔案編研等工作中產(chǎn)生價(jià)值。通過對(duì)學(xué)籍管理檔案進(jìn)行數(shù)據(jù)挖掘,根據(jù)歷屆高校各專業(yè)畢業(yè)生回校查詢的頻次,可以反映高校專業(yè)冷熱程度,優(yōu)化專業(yè)設(shè)置。查閱次數(shù)多,說明社會(huì)對(duì)該專業(yè)畢業(yè)生需求多,該專業(yè)比較熱門,是就業(yè)較好的專業(yè),查閱次數(shù)少,說明社會(huì)對(duì)該專業(yè)畢業(yè)生需求不多,該專業(yè)比較冷門,就業(yè)情況偏差。學(xué)校在專業(yè)課程設(shè)置上要與社會(huì)需求相適應(yīng),結(jié)合用人單位對(duì)于專業(yè)考核的方向,及時(shí)調(diào)整專業(yè)設(shè)置和科研方向,并將理論研究與實(shí)踐相結(jié)合,應(yīng)用到學(xué)生培養(yǎng)教學(xué)中。招生畢業(yè)檔案是學(xué)生從入學(xué)到畢業(yè)的生活和學(xué)習(xí)情況記錄,通過對(duì)報(bào)考學(xué)生歸屬地統(tǒng)計(jì)分析,可以觀察各區(qū)域報(bào)考本院校的人數(shù)規(guī)模和積極性,為各區(qū)域招生人數(shù)設(shè)定提供數(shù)據(jù)支持。另外,利用人工智能技術(shù)實(shí)現(xiàn)教學(xué)檔案編研,借助情感分析技術(shù)創(chuàng)新高校教學(xué)檔案編研實(shí)現(xiàn)輿情監(jiān)控。
近些年人工智能技術(shù)在市場(chǎng)應(yīng)用較為廣泛,在檔案管理領(lǐng)域不僅有相關(guān)的理論研究,同時(shí)也有一些實(shí)踐項(xiàng)目,如科大訊飛參與的檔案智能收集、國(guó)家電網(wǎng)四川省電力公司參與的檔案智能管理、太倉(cāng)市檔案館參與的檔案智能檢索、德國(guó)多特蒙德工業(yè)大學(xué)參與的檔案智能利用等項(xiàng)目。雖然國(guó)內(nèi)外人工智能在檔案管理領(lǐng)域應(yīng)用取得了一定成功,但人工智能在高校教學(xué)檔案領(lǐng)域主要集中在理論探討方面,市場(chǎng)應(yīng)用受到諸多限制。本文主要從技術(shù)、人才、資金三方面分析應(yīng)用受限原因。
(一)技術(shù)問題。安全存儲(chǔ)是檔案管理的首要任務(wù),也是開展其他工作的前提。隨著檔案數(shù)字化以及在數(shù)字化基礎(chǔ)上進(jìn)行的數(shù)據(jù)挖掘,檔案變成了存儲(chǔ)于服務(wù)器并通過網(wǎng)絡(luò)進(jìn)行訪問的數(shù)據(jù)。人工智能技術(shù)在教學(xué)檔案管理中應(yīng)用帶來(lái)便利性的同時(shí),也會(huì)產(chǎn)生用戶隱私保護(hù)、數(shù)據(jù)泄露、黑客攻擊等信息系統(tǒng)安全問題。人工智能技術(shù)的應(yīng)用建立在大量數(shù)據(jù)集基礎(chǔ)上,檔案工作人員通過對(duì)訓(xùn)練用檔案數(shù)據(jù)進(jìn)行人工標(biāo)注,針對(duì)不同類型的檔案數(shù)據(jù)選取訓(xùn)練用模型,為了提高模型的準(zhǔn)確性,需要對(duì)訓(xùn)練結(jié)果進(jìn)行評(píng)估調(diào)整參數(shù)設(shè)置,在使用檔案數(shù)據(jù)的過程中,用戶隱私如何得到安全性保障便成為難題。在線查閱檔案功能極大方便用戶使用,有利于增強(qiáng)用戶查檔服務(wù)體驗(yàn),但也為黑客攻擊提供了可能,如何提高技術(shù)防護(hù)能力,確保不發(fā)生數(shù)據(jù)泄露成為研究重點(diǎn)。因此,需要建立一套軟硬件相結(jié)合的綜合信息安全監(jiān)控體系,多維度、全方位保障檔案安全。
(二)人才問題。目前人工智能專業(yè)人才較為緊缺,雖然已有高等學(xué)府開設(shè)相關(guān)專業(yè),但數(shù)量只占美國(guó)的1/6左右。因此在人才培養(yǎng)方面,既需要高等院校培養(yǎng)和輸送專業(yè)性人員,同時(shí)針對(duì)檔案管理從業(yè)人員需要增加人工智能技術(shù)相關(guān)的課程培訓(xùn),做好檔案管理工作智能產(chǎn)品應(yīng)用的理論知識(shí)儲(chǔ)備和技能實(shí)操訓(xùn)練。另外,由于國(guó)外在人工智能領(lǐng)域發(fā)展較早,相關(guān)領(lǐng)域?qū)<液蛯W(xué)者具備豐富的項(xiàng)目經(jīng)驗(yàn)和技術(shù)水平,人才引進(jìn)也是解決人才不足問題的方式。
(三)資金問題。教學(xué)檔案管理全流程包含收集、整理、鑒定、保管、利用等諸多環(huán)節(jié),需要應(yīng)用到智能Agent、檔案價(jià)值鑒定專家系統(tǒng)、智能問答系統(tǒng)、智能防火墻、入侵檢測(cè)系統(tǒng)和智能機(jī)器人等人工智能產(chǎn)品,因此需要投入大量資金。高校教學(xué)檔案單位一般很難接受如此高昂的成本,若想完成整體系統(tǒng)升級(jí)改造任務(wù),則需要面對(duì)和解決其應(yīng)用成本問題。
人工智能在高校教學(xué)檔案管理工作中的應(yīng)用前景廣闊,既能使檔案管理工作不再枯燥乏味,讓檔案工作者將工作重心放在檔案編研工作上,充分挖掘檔案的價(jià)值,又能改善高校教學(xué)檔案管理工作效率和質(zhì)量,提升檔案服務(wù)利用體驗(yàn)。但新技術(shù)具體應(yīng)用過程中存在檔案管理安全、專業(yè)人才短缺以及使用成本高等問題,如何提高技術(shù)防護(hù)能力、培養(yǎng)專業(yè)人才、降低應(yīng)用成本成為當(dāng)前面臨的主要問題,也會(huì)成為后續(xù)研究的方向和熱點(diǎn)。因此,作為檔案從業(yè)者,我們要錨定主要問題并進(jìn)行深入探索和研究,使人工智能技術(shù)在高校教學(xué)檔案管理工作中得到實(shí)際應(yīng)用。