季夢佳(上海工程技術大學檔案館,上海,201620)
?
關于智慧檔案館中技術熱研究的思考
季夢佳
(上海工程技術大學檔案館,上海,201620)
[摘要]技術建設一直是智慧檔案館研究的重點與難點之一,存在一些誤解。文章首先概述智慧檔案館的理論研究與應用建設現(xiàn)狀,指出技術研究與建設是當前智慧檔案館的熱點。其次,分析對物聯(lián)網(wǎng)、大數(shù)據(jù)兩大技術的誤解之處,指出檔案實體物聯(lián)化與檔案信息化、檔案的保密性與物聯(lián)網(wǎng)信息共享的目標、檔案數(shù)據(jù)的滯后性與大數(shù)據(jù)時效性等都存在偏離。最后,剖析智慧檔案館的建設誤區(qū),強調(diào)智慧化不等于智能化、數(shù)據(jù)化,指出理性智能與情感智能相結(jié)合才是智慧檔案館的發(fā)展之路。
[關鍵詞]智慧檔案館技術理性智能情感智能大數(shù)據(jù)
1.1智慧檔案館的理論研究現(xiàn)狀學術界對智慧檔案館的研究隨時間的推移呈現(xiàn)出逐漸上升的趨勢。目前,學術界有關智慧檔案館的研究主要集中在智慧檔案館的概念、智慧檔案館與數(shù)字檔案館的關系、智慧檔案館的建設、智慧檔案館服務四個方面[1]。筆者以中國知網(wǎng)學術期刊網(wǎng)絡出版總庫為文獻來源檢索庫,以“智慧檔案館”為主題詞進行模糊檢索,檢索時間不限,通過二次篩選,共有62篇符合要求。其中43篇為純粹理論研究,7篇為混合理論研究,12篇為案例研究。在62篇研究文獻中,頻率最高的五個關鍵詞分別為智慧檔案館、智慧城市、物聯(lián)網(wǎng)、大數(shù)據(jù)、云計算。一方面,說明新一代信息技術在深入、全面應用后,給檔案館傳統(tǒng)運行模式帶來了巨大的沖擊,推動檔案館轉(zhuǎn)型升級,促進檔案館走向智慧化;另一方面,這也反映出學術界對物聯(lián)網(wǎng)、大數(shù)據(jù)等信息技術的研究興趣與關注熱度愈來愈高。
1.2智慧檔案館的應用實踐現(xiàn)狀
在應用實踐層面,青島、杭州、張家港、太倉等區(qū)域的智慧檔案館建設呈現(xiàn)一片欣欣向榮的景象。青島是國內(nèi)第一個建設智慧檔案館的城市,2012年完成智慧檔案館建設理念、基本功能、系統(tǒng)框架及具體功能需求的研究工作;2013年提出智慧檔案館建設項目建議書;2014年,青島市政府工作報告明確要求“建設智慧檔案館”,青島市發(fā)改委將青島市智慧檔案館項目一期工程列入市財力投資計劃,同年4月完成項目招標,11月,完成項目建設,系統(tǒng)進入試運行階段;2015 年5月26日,青島市智慧檔案館項目一期工程通過相關部門組織的功能驗收,正式投入試運行[2]。杭州以“杭州市電子文件中心”為基石,致力于打造智慧檔案館,將檔案工作構建于互聯(lián)網(wǎng),通過合理分析為老百姓提供個性化檔案服務,挖掘歷史寶藏。目前已完成三期建設,基本達到了全市統(tǒng)一的電子文件系統(tǒng)規(guī)范管理和長久保存兩大目標。即將啟動的四期項目,將以全市檔案信息資源為基礎,通過政務云平臺縱向連接各區(qū)縣(市)綜合檔案館,橫向連接各市級機關立檔單位和社會公眾,提供跨館查閱民生檔案和開放檔案等服務,逐步實現(xiàn)全市檔案信息資源的整合和共享利用,實現(xiàn)管理模式的新突破[3]。太倉市檔案局館以物聯(lián)網(wǎng)為基礎,致力于邁入智慧管理時代。例如自主研制了自動化檔案盤庫車,在不需要從密集架中取下實體檔案的前提下,通過盤庫車自動清點檔案數(shù)量,通過聯(lián)動數(shù)字檔案館比對檔案內(nèi)容,既免去了傳統(tǒng)盤庫一卷卷人工盤點的繁瑣,大大簡化了檔案盤庫清點工作的流程,也能實現(xiàn)諸如區(qū)域定位、遠程讀取檔案等一些特殊功能,從而使庫房管理工作變得更高效[4]。
目前,智慧檔案館的建設熱潮已經(jīng)興起,各個區(qū)域智慧檔案館的建設水平、建設重點又不盡相同。不得不承認,對智慧檔案館內(nèi)涵以及理論研究的模糊,致使一些區(qū)域的建設只涉及智慧檔案館的某一部分,就堂而皇之地冠以智慧檔案館的光環(huán),這種情況已經(jīng)嚴重脫離了智慧檔案館的建設宗旨,勢必對正在成長中的智慧檔案館建設造成影響。
2.1檔案的屬性與物聯(lián)網(wǎng)的本質(zhì)相悖
學術界對物聯(lián)網(wǎng)迄今為止都沒有一個公認的學術定義。研究型首倡者的缺失導致了很少有人去深入思考諸如“物聯(lián)網(wǎng)的本質(zhì)到底是什么”之類的理論問題(確切地說,是沒有人提出引起爭論的話題)[5]。在目前人們對物聯(lián)網(wǎng)幾乎一致的理解中,絕大部分學者僅從漢譯的角度,將物聯(lián)網(wǎng)解釋成物物相連的網(wǎng)絡。它將互聯(lián)網(wǎng)技術的終端由傳統(tǒng)的信息技術設備延伸和擴展到了任意物體,并使任意物體之間進行通訊[6]。這就容易引導人們走入對物聯(lián)網(wǎng)的認識誤區(qū)。第一,物聯(lián)網(wǎng)就是物被連接的網(wǎng);第二,物聯(lián)網(wǎng)是一種新型的獨立網(wǎng)絡,和互聯(lián)網(wǎng)是兩種不同的網(wǎng),兩者彼此獨立,但相互依賴。
首先,物聯(lián)網(wǎng)是Internet of Thing的漢譯,是誰在什么情況下將此翻譯成“物聯(lián)網(wǎng)”,現(xiàn)已無從考證。但如果從詞語的語法結(jié)構及原本語義解釋,Internet of Thing應該解釋為“產(chǎn)品信息互聯(lián)網(wǎng)”[7]更為貼切。因此,物聯(lián)網(wǎng)中的“物”并不是指客觀存在的物體或東西,而是產(chǎn)品信息。對產(chǎn)品信息的獲取,主要是利用電子標簽。電子標簽其本身僅記錄著產(chǎn)品的基本信息(確切地說是靜態(tài)的索引性信息),可由其觸發(fā)訪問的“物聯(lián)網(wǎng)信息服務器(IO T-Information Server)”動態(tài)地存儲與該產(chǎn)品相關的全部信息[8]?,F(xiàn)階段,一些地區(qū)的檔案館在推廣物聯(lián)網(wǎng)技術運用的過程中,將檔案實體物聯(lián)化是最常見的做法。具體做法是在每份檔案上加入RFID標簽,賦予其特定的數(shù)字信號,通過自動化設備就可實時讀取檔案的信息,定位檔案實體的位置。表面上看,這樣不僅能降低庫房檔案管理的人力成本,更能極大地提高調(diào)檔的效率,但也很容易出現(xiàn)問題。首先,將每份檔案都黏上電子標簽的可行性不高。現(xiàn)在我國正極力推行數(shù)字化,檔案的利用也開始由實體向電子化轉(zhuǎn)移。在未來,數(shù)字化檔案、電子文件應該是檔案存在的常態(tài),所以將檔案實體物聯(lián)化的意義并不大。物聯(lián)網(wǎng)的目標就是產(chǎn)品信息的全球范圍共享,即每一位讀取主體(人或可實現(xiàn)信息智能處理的機器)都能“讀懂”其接收到的產(chǎn)品信息[9]。但就標準化情況而言,現(xiàn)狀并不樂觀。一詞多義、一義多詞的現(xiàn)象普遍存在,再加上術語標準的非強制性,導致各國、各區(qū)域的標準各不相同。這與物聯(lián)網(wǎng)所要達成的目標相去甚遠。
其次,物聯(lián)網(wǎng)并未重新構建網(wǎng)絡,而是完全依附于互聯(lián)網(wǎng),物聯(lián)網(wǎng)與互聯(lián)網(wǎng)本質(zhì)上屬于同一張網(wǎng),物聯(lián)網(wǎng)的運行離不開互聯(lián)網(wǎng),它是一種新型的互聯(lián)網(wǎng)應用,一種基于互聯(lián)網(wǎng)的產(chǎn)品信息共享方式[10]。既然是共享,那所有檔案信息就必須開放。但實際上,檔案具有機密性,人們的利用是有差異的,某些檔案有關某一方面的內(nèi)容,只能為某一層次、某一范圍的人們所利用,超出這一層次和范圍的任何知曉,可能會對其他人造成很大程度上的損害。因此,檔案的機密性要求某些檔案信息不能上網(wǎng),而且要分密級程度保存。這與物聯(lián)網(wǎng)的目標——產(chǎn)品信息的全球范圍共享是相悖的。
2.2檔案數(shù)據(jù)與大數(shù)據(jù)的本質(zhì)屬性偏離
與所有的IT概念類似,大數(shù)據(jù)的概念更像是一種特征描述,而不是技術領域的客觀定義。目前,較為一致的觀點是大數(shù)據(jù)具備“4V”特征,即Volume(大量)、Velocity(高速)、Variety(多樣)、Value(價值)。在檔案學術界,大數(shù)據(jù)4個“V”特征在研究論文中隨處可見。不得不承認,其中對某些部分的解讀確有合理之處,但難免存在不同程度的概念泛化、夸大與誤讀。
隨著檔案數(shù)字化建設的深入,電子文件以及數(shù)字化檔案的總體數(shù)據(jù)量在不斷變大,有學者就牽強附會地認為檔案大數(shù)據(jù)時代已經(jīng)來臨。但此“大”非Volume的“大”。從Volume的本義出發(fā),它一般指的是聚合在一起可供分析的數(shù)據(jù)量必須是極大的,并且這個“大”主要是指由機器自動生成的數(shù)據(jù)量增長巨大,比如“引擎中內(nèi)置的傳感器,即使沒有人觸摸或者下達指令,它也會自動地生成關于周圍環(huán)境的數(shù)據(jù)”[11]。對照這兩點仔細推敲一下數(shù)字檔案資源的特征。首先,檔案數(shù)字化后,目前的數(shù)字檔案資源主要分為兩種,一種是傳統(tǒng)檔案載體的數(shù)字副本,另一種是電子文件。就前者而言,其數(shù)據(jù)量是十分龐大的,僅像第一歷史檔案館這樣國家級別的檔案館,其館藏檔案數(shù)字副本就可達數(shù)千TB;與此同時,原生電子文件的增量也在不斷提高,十年前的中央機關的電子文件總量,就已突破TB。但這些海量的數(shù)字檔案資源,80%左右的新增數(shù)據(jù)是“冷數(shù)據(jù)”“休眠數(shù)據(jù)”,這類數(shù)據(jù)的特點是靜止的、固定的。因此這些非在線的冷數(shù)據(jù),其總量可能非常大,但是增長速度與實時采集、動態(tài)獲取的能力跟大數(shù)據(jù)所指向的相去甚遠[12]。
大數(shù)據(jù)是現(xiàn)象,但“大”和“數(shù)據(jù)”都不是大數(shù)據(jù)中最重要的,大數(shù)據(jù)的核心是要挖掘數(shù)據(jù)價值,進行數(shù)據(jù)分析。數(shù)據(jù)分析要求的數(shù)據(jù)是全數(shù)據(jù),檔案能提供的是經(jīng)過鑒定篩選后的數(shù)據(jù),這與大數(shù)據(jù)的要求又背道而馳。另外,現(xiàn)代社會追求最大化的信息價值,數(shù)據(jù)的時效性又直接影響了信息價值的最大化。從技術特征上講,大數(shù)據(jù)的突出優(yōu)勢就在于數(shù)據(jù)傳輸速度和接受速度是極快的、實時的,這就要求數(shù)據(jù)具有很高的時效性。檔案是歷史的真憑實據(jù),具有極高的憑證價值和情報價值。然而,檔案本身是歷史的記錄,是一種回溯性信息,再加上它有一個法定的封閉期,導致被人廣泛利用或發(fā)揮作用需要一定的時間,具有一定的滯后性,檔案信息的時效性自然相對較弱。
數(shù)字檔案信息的形式日漸多樣,從文本格式到圖形圖像格式,從圖形圖像格式再到多媒體格式等。但從目前的技術上看,數(shù)據(jù)分析僅僅在“爬蟲”技術方面有所突破,開啟了解讀非數(shù)據(jù)結(jié)構化數(shù)據(jù)內(nèi)容的一扇窗戶。圖像識別技術沒有實質(zhì)性突破,數(shù)據(jù)挖掘技術也停留在原來的水平,只是移植到云計算環(huán)境下而已,數(shù)據(jù)分析技術的突破與否決定著未來大數(shù)據(jù)在檔案管理中應用能力的高低。
3.1理性智能與情感智能
理性智能與情感智能都是人工智能的產(chǎn)物,理性智能是人工智能的初級階段,情感智能則是人工智能的高級階段。理性智能是指從信息資源中獲取知識,進行復雜的自然語言處理、學習、推理、規(guī)劃及模式識別;情感智能是指在機器理性智能的基礎上,通過對環(huán)境情景信息及人類情緒信息的感知、獲取、計算和分析,實現(xiàn)以情感、情景智能為主的高級開發(fā)與應用[13]。
隨著對智慧城市研究的深入,越來越多的研究者開始關注情感計算(情感智能)。其實,情感智能(情感計算)這個問題,在20世紀90年代初期就已被關注并開始研究。1997年,美國MIT媒體實驗室的R.Picard出版專著Affective Computing,在書中正式提出情感計算(Affective Computing)的概念。所謂的情感計算就是試圖賦予計算機像人一樣的觀察、理解和生成各種情感特征的能力。它試圖創(chuàng)建一種能感知、識別和理解人的情感,并能針對人的情感做出智能、靈敏、友好反應的計算系統(tǒng)[14]。
智慧檔案館是Smart Archives的漢譯。Smart的本義是聰明、敏捷、反應快,但并不包含智慧的意思。已經(jīng)難以弄清誰是中文“智慧檔案館”的首倡者及其翻譯依據(jù)。但“智慧”一詞,在中國文化中含有更為豐富的內(nèi)涵。智的特征是學習性,代表了人(物)的智商;慧的特征是創(chuàng)造性,代表了人(物)的情商。智慧檔案館包含“智”和“慧”兩部分,即智慧檔案館兼具“高智商”與“高情商”。從一定意義上說,智慧檔案館可以稱之為人工智能的產(chǎn)物。如果把“智”理解成理性智能,把“慧”理解成情感智能,那“智慧”就是指如何利用情感智能來更好地發(fā)揮理性智能。
3.2智能化不等于智慧化
檔案館引入物聯(lián)網(wǎng)、大數(shù)據(jù)等高科技,這是智慧檔案館開始擁有高智商的表現(xiàn)。物聯(lián)網(wǎng)為檔案館樓宇、人員等的智能化管理提供了基礎,大數(shù)據(jù)又為檔案個性化服務提供了分析前提。但這些最多只能稱得上智能,智能并不等同于智慧。首先,關注點不同。智能僅僅關注的是每個智能項目的建設,是獨立的,并且缺乏整體性的規(guī)劃設計;智慧則關注每個智能項目之間的固有聯(lián)系,有系統(tǒng)的規(guī)劃與頂層設計,有統(tǒng)一的規(guī)范標準,并能從整體出發(fā),嵌入式地搭建每個智能項目建設。其次,實質(zhì)不同。智能技術強調(diào)的是軟件資源,強調(diào)自動處理系統(tǒng)的貢獻,更多是從技術角度關注檔案館建設;智慧關注機器的理性智能,更關注如何利用情感智能發(fā)揮理性智能的優(yōu)勢。再次,目標不同,智能以電子化、信息化為建設目標;但智慧則是要為人類提供更加個性化的智慧服務。從觀念上講,智慧檔案館追求的實際上是效益與人文的統(tǒng)一,兼具技術與人文的統(tǒng)一。最后,智能的結(jié)果只是數(shù)據(jù)的積累與傳遞;智慧在強調(diào)信息的采集與傳遞的同時,更加注重信息的交換、共享與挖掘。
3.3數(shù)據(jù)化不等于智慧化
檔案的數(shù)字化是互聯(lián)網(wǎng)出現(xiàn)以來一項重大的突破,數(shù)字化讓檔案信息的收集、管理與利用變得前所未有地容易。但新的問題也隨之出現(xiàn),即數(shù)字化的檔案信息能否轉(zhuǎn)化為一種生產(chǎn)力?大數(shù)據(jù)的出現(xiàn)讓這一切成為可能,從數(shù)字化的檔案信息中挖掘更具價值的數(shù)據(jù)成了檔案工作的新方向。數(shù)據(jù)化主要包括數(shù)據(jù)的采集與數(shù)據(jù)的處理等工作,其實質(zhì)是人類在信息傳播、人際交往乃至日常生活的過程中,為了便于溝通、傳播與保存,將一切客觀存在均處理為數(shù)據(jù),進而使得整個人類社會成為了一個龐大的數(shù)據(jù)庫[15]。
數(shù)據(jù)化的最大特征就是以技術為中心,技術將不同國度、不同文化背景的人連接成一張巨大的網(wǎng)絡,使得每個人(物)都以“數(shù)據(jù)化”的形式存在。但智慧化的最大特征是以人為本,用技術去為人提供個性化的服務。雖然這是一個數(shù)據(jù)主宰一切的時代,數(shù)據(jù)化與智慧化相互聯(lián)系、互不分離,數(shù)據(jù)化為智慧化奠定了量的基礎,而智慧化則是數(shù)據(jù)化質(zhì)的飛躍,但數(shù)據(jù)化不等于智慧化。數(shù)據(jù)化使社會結(jié)構呈現(xiàn)出了以互聯(lián)網(wǎng)為框架的數(shù)據(jù)化形態(tài),而且使得傳統(tǒng)的人際關系、信息交流變成了即時、迅捷的數(shù)據(jù)交換[16],但弊端也顯而易見,就是容易使原本多元、立體的社會結(jié)構趨于單一、平面。況且一味地關注數(shù)據(jù),就容易以理性思維取代感性思維,導致天平失衡。
首先,必須堅持技術與人文的統(tǒng)一。技術使檔案工作不斷朝著信息化、數(shù)字化、智能化、智慧化方向發(fā)展,但技術是一把雙刃劍,正如技術哲學的研究者卡普所言:“所有技術當然也包括所有的未來技術,都只能被理解為人體的投影與延伸,是人體的外在化和客觀化?!奔夹g是智力的放大器,是人智力的投影儀,它讓物具有了人的屬性,可以說,技術本身體現(xiàn)著人的價值期望、價值追求,在技術設計、發(fā)明與應用的過程中,人的目的、價值觀念就內(nèi)化于其中。正因如此,技術要獲得正確的發(fā)展方向,必須借助人文科學,為其提供動力、確定目標、端正方向,深化技術與人文的交融,智慧檔案館的發(fā)展才會欣欣向榮。其次,必須堅持情感智能與理性智能的統(tǒng)一。智慧檔案館的建設離不開理性智能,理性智能是打開智慧之門的金鑰匙,為智慧檔案館的建設提供技術以及一切智力支持;情感智能則是智慧檔案館的發(fā)展方向,利用情感智能,正確協(xié)調(diào)與理性智能的關系,恰如其分地控制兩者發(fā)揮各自的作用??偠灾ㄔO智慧檔案館,我們要走的路還很長。
參考文獻
[1]巨珺.我國智慧檔案館研究述評[J].浙江檔案,2015(4):6-9.
[2]http://www.qingdao.gov.cn/n172/n24624151/n24631595/n24631609/n24631637/ 150605161439540514.html
[3]http://hzdaily.hangzhou.com.cn/hzrb/html/2014-09/26/content_1808847.htm
[4]http://www.da.yy.gov.cn/art/2014/2/24/art_38730_1377081.html
[5][7][8][9][10]黃映輝,李冠宇.物聯(lián)網(wǎng):語義、性質(zhì)與歸類[J].計算機科學,2011,38(1):31-33,65.
[6]陳海明,崔莉,謝開斌.物聯(lián)網(wǎng)體系結(jié)構與實現(xiàn)方法的比較研究[J].計算機學報,2013,36(1):168-188.
[11]Bill Franks.駕馭大數(shù)據(jù)[M].黃海,車皓陽,王悅譯.北京:人民郵電出版社,2003:6.
[12]于英香.檔案大數(shù)據(jù)研究熱的冷思考[J].檔案學通訊,2015(2):4-8.
[13]戴偉輝.情景感知與情感智能:通往智慧城市的智慧之門[J].上海城市管理,2012(4):29-32.
[14]解迎剛,王志良.遠程教育中感情計算技術[M].機械工業(yè)出版社,2011:16.
[15][16]韓晗.“數(shù)據(jù)化”的社會與“大數(shù)據(jù)”的未來[J].中國圖書評論,2014(5):26-32.
Reflection on the Research of Technology in the Smart Archives
Ji Mengjia (Archives of Shanghai University of Engineering Science,Shanghai,201620)
Abstract:Technical construction has been one of the key points and difficulties in the research of smart archives,but there are some misunderstandings.Firstly,the paper summarizes the theory research and application development of smart archives.Secondly,it analyzes the misreading of the internet of things and the big data.It is pointed out that the archives entity instrumented with archives informatization,confidentiality of archives with target of information sharing in internet of things,archival data lag and big data timeliness and so on.Finally,it analyzes the construction errors of the smart archives,emphasizing the smart is not equal to intelligence and datamation,pointing out that the rational intelligence with emotional intelligence is the development of the smart archives.
Keywords:Smart Archives;Technology;Rational Intelligence;Emotional Intlligence;Big Data
[分類號]G271
[作者簡介]
季夢佳,女,上海工程技術大學檔案館助理館員,主要研究方向為檔案數(shù)字化。