趙丹僖 雷鳳雪
摘? 要:以廣西生態(tài)工程職業(yè)技術(shù)學院圖書館為例介紹口述歷史數(shù)據(jù)庫的收藏范圍和途徑,分析了建設(shè)過程中面臨的資源存儲擴容不易、資源可信度不高和知識產(chǎn)權(quán)明晰困難等問題,利用區(qū)塊鏈技術(shù)的去中心化、不可篡改、安全可信等特性,提出融入?yún)^(qū)塊鏈技術(shù)的口述歷史資源庫模型,由數(shù)據(jù)采集分析、數(shù)據(jù)組織整理、數(shù)據(jù)儲存發(fā)布、數(shù)據(jù)共享使用四個功能模塊組成,實現(xiàn)了保障數(shù)據(jù)安全、提高資源存儲的功能。
關(guān)鍵詞:區(qū)塊鏈;口述歷史;資源建設(shè);數(shù)據(jù)庫模式
中圖分類號:TP391;G250? ? ? 文獻標識碼:A 文章編號:2096-4706(2020)09-0169-03
Research on the Construction of Oral History Resource Base Based on Blockchain
ZHAO Danxi,LEI Fengxue
(Guangxi Eco-engineering Vocational and Technical College,Liuzhou? 545004,China)
Abstract:Taking the library of Guangxi Eco-engineering Vocational and Technical College as an example,this paper introduces the collection scope and ways of oral history database,analyzes the problems faced in the process of construction,such as the difficulty in expanding the storage capacity of resources,the low credibility of resources and the difficulty in clarifying intellectual property rights,etc.,and puts forward the oral history integrated into the blockchain technology by using the characteristics of decentralization,non-tamperability,security and credibility of blockchain technology. An oral history resource base model integrated with blockchain technology is proposed,the resource base model is composed of four functional modules:data collection and analysis,data organization and arrangement,data storage and release,data sharing and use,which realizes the functions of ensuring data security and improving resource storage.
Keywords:block chain;oral history;resources construction;database schema
0? 引? 言
口述歷史研究主要是對無文字社會研究的敘述以及對老一代歷史親歷者的史料采集,因為沒有這些史料的收集將無法構(gòu)建社會的原貌,乃至無法傾聽底層社會的聲音,無法記錄見證者獨有的情感體驗和生命感悟[1]。在我國悠久的歷史長河中,口述資源十分豐富,但研究和利用卻不多。目前,許多公共圖書館越來越重視口述歷史的價值,投入大量人力和財力對口述資料進行保存,這對保存人類歷史記憶起到重要作用。然而目前我國口述歷史資源庫建設(shè)中面臨制度不合理、技術(shù)力量不夠等諸多問題。本文以廣西生態(tài)工程職業(yè)技術(shù)學院圖書館在建設(shè)口述歷史數(shù)據(jù)庫的過程中面臨諸多問題進行分析,探索區(qū)塊鏈技術(shù)下口述歷史資源庫的建設(shè)模型,為圖書館資源建設(shè)提供新的思路。
1? 建設(shè)口述歷史資源庫的范圍和途徑
廣西生態(tài)工程職業(yè)技術(shù)學院將口述歷史資源作為圖書館資源建設(shè)的重要組成部分,近些年投入大量的人力財力對口述歷史數(shù)據(jù)庫進行建設(shè),目前將口述歷史資源收藏范圍定位為反映抗戰(zhàn)時期沙塘鎮(zhèn)農(nóng)林業(yè)發(fā)展的各類型資料。
1.1? 明確收集資源的范圍
由于廣西生態(tài)工程職業(yè)技術(shù)學院所處的廣西柳州市沙塘鎮(zhèn),在抗戰(zhàn)時期是大后方,當時的沙塘鎮(zhèn)匯集了各地的農(nóng)業(yè)專家學者、名人教授,如馬保之、馮堂、孫仲逸、汪振儒等,他們對中國農(nóng)林業(yè)發(fā)展、對抗戰(zhàn)后方的生產(chǎn)建設(shè)具有重要意義。目前圖書館主要收集以下三種類型資源:一是抗戰(zhàn)時期沙塘鎮(zhèn)生產(chǎn)生活情況,二是著名農(nóng)業(yè)學家在沙塘鎮(zhèn)進行的教學生產(chǎn)情況,三是抗戰(zhàn)時期當?shù)乜谑鑫膶W作品。
1.2? 多方協(xié)作收集資源
為了廣泛收集、深入挖掘口述歷史資源,圖書館吸收借鑒了其他圖書館的成功經(jīng)驗,形成以廣西生態(tài)工程職業(yè)技術(shù)學院圖書館為主、學校其他部分為輔、聯(lián)合廣西農(nóng)科院桂中分院等相關(guān)單位通力合作的收集模式。首先,以歷史學、圖書館學、農(nóng)林業(yè)等相關(guān)專家的建議為基礎(chǔ),明確口述歷史資源的收集類目。其次,從各單位抽調(diào)人員,以收集內(nèi)容為導向確定訪談人員和訪談提綱,接著利用錄音錄像等設(shè)備記錄對相關(guān)人員的訪談,然后按照文獻編目規(guī)則與機讀目錄格式對采訪內(nèi)容進行組織、揭示,并存入口述歷史數(shù)據(jù)庫。
2? 圖書館建設(shè)口述歷史資源庫存在的困境
2.1? 資源存儲的問題
口述資源采集中,首先被采訪者要先填寫自身信息,再對自身經(jīng)歷進行敘述。采訪者一般采用錄音或者視頻等方式進行采集,采集后的資料就是原始素材,作為還原歷史的元數(shù)據(jù)進行保存存檔。然后加工人員對素材進行粗整理,刪除掉不含有效信息的視頻片段,根據(jù)主題進行分段剪輯,之后才是將口述資料整理成文字稿,然后再整理成元數(shù)據(jù)保存存檔。整理工作結(jié)束后,視頻資料以高清格式、圖片資料以高像素形式上傳,電子文檔和紙質(zhì)文檔進行掃描分類上傳服務(wù)器進行備份[2]。隨著各學科領(lǐng)域?qū)谑鰵v史的青睞,口述資源數(shù)量得以成倍數(shù)增長,如何對大量口述資源的原始資料和加工整理后的資料進行保管成為采集者要面對的問題。
2.2? 資源共享問題
口述歷史資源庫建設(shè)作為口述資源開發(fā)與利用的基礎(chǔ),目前已得到社會各界的重視。清華大學圖書館對周本初等知名學者進行訪談,以視頻的方式構(gòu)建了名人口述歷史資源庫;汕頭大學圖書館構(gòu)建了潮汕口述文獻數(shù)據(jù)庫;湖南圖書館構(gòu)建了紅色記錄口述資源庫;國家圖書館啟動的“中國記憶”就是依托口述文獻和影像文獻的數(shù)據(jù)庫。但調(diào)查顯示,很多圖書館口述文獻資源庫僅提供瀏覽訪問服務(wù),并不能下載使用資源。在信息時代,廣大用戶對口述資源需求增強,實現(xiàn)資源共享可以提高圖書館影響力和群眾的滿意度。
2.3? 版權(quán)保護問題
口述歷史資料是圖書館特色館藏建設(shè)的重要組成部分,可以以各種方式來進行復(fù)制,屬于版權(quán)保護的作品。2010年修訂的《中華人民共和國著作權(quán)法》第3條明確將口述作品列入著作權(quán)法保護范疇[3]。口述歷史一般由口述者敘述,采訪者進行記錄,采訪者為了保證敘述活動的順利進行,需要設(shè)計采訪問題、設(shè)定采訪框架、運用采訪技巧,巧妙地對口述者進行干預(yù)。一般來說,采訪者在口述資料生成的過程中也起到創(chuàng)造性作用,同樣具備知識產(chǎn)權(quán)。而區(qū)塊鏈數(shù)據(jù)結(jié)構(gòu)是一種以區(qū)塊為單位的鏈式結(jié)構(gòu),每一個區(qū)塊頭都包含上一個區(qū)塊信息的哈希值和時間戳,任何個人和節(jié)點都不能隨意更改信息,任何節(jié)點都可追蹤到有變動的節(jié)點。區(qū)塊鏈技術(shù)特有的去中心化、不可篡改、可追溯的特點可用于知識產(chǎn)權(quán)保護,可以提高知識產(chǎn)權(quán)的可靠性和安全性,降低版權(quán)認證費用,因為區(qū)塊中每一個參與者也是認證者,不需要專門認證機構(gòu)和認證費用。
3? 基于區(qū)塊鏈的口述歷史資源庫建設(shè)
3.1? 區(qū)塊鏈相關(guān)概念
區(qū)塊鏈技術(shù)是比特幣的底層技術(shù),2008年首次由日本學者中本聰(Satoshi Nakamoto)提出。區(qū)塊鏈技術(shù)是利用塊鏈式數(shù)據(jù)結(jié)構(gòu)驗證與存儲數(shù)據(jù)、利用分布式節(jié)點共識算法生成和更新數(shù)據(jù),利用密碼學的方式保證數(shù)據(jù)傳輸和訪問安全、利用自動化腳本代碼組成的智能合約編程和操作數(shù)據(jù)的一種全新分布式基礎(chǔ)架構(gòu)與計算范式[4]。從應(yīng)用角度來看,區(qū)塊鏈是一種分布式共享賬本數(shù)據(jù)庫,具有去中心化、不可篡改、公開透明、安全可信、可以追溯等特點。區(qū)塊鏈采用點對點傳輸模式,具有去中心化的特點,各節(jié)點之間直接進行信息處理,任何一個節(jié)點出現(xiàn)故障不會影響整個系統(tǒng)的運作。不可篡改意味著區(qū)塊鏈中每一個節(jié)點發(fā)出的信息都能被其他區(qū)塊收到,各區(qū)塊共同認證新發(fā)出的信息,除非能控制一半以上的節(jié)點,否則對區(qū)塊的修改都是無效的,這種點對點的傳輸方式?jīng)Q定了傳遞、驗證和共享的信息都是公開透明的,也決定了區(qū)塊鏈是安全可信的。區(qū)塊鏈使用了密碼學中的非對稱加密,使通信雙方無需事前傳遞密匙或進行約定就能完成保密通信,讓參與者更容易達成共識,既方便溯源,又能實現(xiàn)透明數(shù)據(jù)后的匿名性,保護個人隱私[5]。這些特點為區(qū)塊鏈奠定了信任基礎(chǔ)。
3.2? 區(qū)塊鏈在口述歷史中的優(yōu)勢
3.2.1? 擴充資源存儲容量
區(qū)塊鏈技術(shù)具有去中心化的特點,利用區(qū)塊鏈技術(shù)實現(xiàn)資源分布存儲,點對點傳輸成為可能,可以利用網(wǎng)絡(luò)中每一個節(jié)點的存儲空間來存儲其他節(jié)點的數(shù)字信息。每一個節(jié)點既可以作為存儲空間的提供者,也可以作為數(shù)據(jù)的需求者,這種云存儲真正實現(xiàn)了資源分布儲存,點對點傳輸,改變了圖書館資源存儲中心化的問題。在區(qū)塊鏈技術(shù)下,云儲存形態(tài)充分應(yīng)用了網(wǎng)絡(luò)閑散節(jié)點資源,整體運營成本大大降低。因此,圖書館可以擴充信息資源,在節(jié)約成本的條件下增加信息容量,可以讓更多的參與者加入資源建設(shè)行列,實現(xiàn)資源數(shù)量成倍增長。
3.2.2? 可靠的安全共享
區(qū)塊鏈技術(shù)能夠在大規(guī)模網(wǎng)絡(luò)環(huán)境中建立安全可信的數(shù)據(jù)存儲系統(tǒng)、通過智能合約機制,實現(xiàn)可信任狀態(tài)的分布式共識,實現(xiàn)了更加安全有效的數(shù)據(jù)共享平臺,保護數(shù)據(jù)共享。在現(xiàn)有的區(qū)塊鏈存儲系統(tǒng)中,文件元數(shù)據(jù)以單獨用于數(shù)據(jù)存儲的公鑰加密后存儲在鏈上,文件密文保存在鏈下各個節(jié)點中,用于解密所有數(shù)據(jù)的對應(yīng)私鑰掌握在用戶手中。區(qū)塊鏈上的元數(shù)據(jù)密文與鏈下節(jié)點持有的文件密文都被加密算法保護,只有私鑰持有者可以閱讀其中的內(nèi)容。區(qū)塊鏈云存儲工作在所有節(jié)點不受信任的環(huán)境下,其中數(shù)據(jù)分享的安全性完全由具體的算法保證,具有可證明的安全性。另一方面,在數(shù)據(jù)分享的服務(wù)中,不僅需要其過程具有安全性,還需要考慮該服務(wù)的可靠性。區(qū)塊鏈通過訪問控制、身份認證和隱蔽通信來實現(xiàn)數(shù)據(jù)交換過程安全可靠。在傳輸過程中先對數(shù)據(jù)進行封裝和簽名,在使用時采用可驗證計算,保證云計算結(jié)果的可信度。
3.2.3? 可追溯成果,強化版權(quán)保護
口述歷史從講述到傳播都經(jīng)過諸多處理,用戶難以判斷其可靠性和有效性。數(shù)據(jù)溯源可以解決這個問題。區(qū)塊鏈利用哈希算法和數(shù)字簽名在存儲數(shù)據(jù)或保存之前計算數(shù)據(jù)的哈希值,之后可以反復(fù)此過程,將驗證結(jié)果與之前存儲的數(shù)據(jù)進行比較來證明數(shù)據(jù)的完整性。如果兩個哈希值相同,數(shù)據(jù)真實有效。數(shù)字簽名是用非對稱加密算法對哈希值進行加密,簽名使得發(fā)送方能夠證明數(shù)據(jù)是自己發(fā)出,接收方也可以驗證簽名。區(qū)塊鏈的哈希算法和數(shù)字簽名出讓成果追溯成為可能,降低版權(quán)保護成本,實現(xiàn)版權(quán)保護。
3.3? 基于區(qū)塊鏈的口述歷史資源庫模型
基于區(qū)塊鏈的口述歷史資源庫是依托區(qū)塊鏈技術(shù)實現(xiàn)口述歷史收集整理發(fā)布的平臺,主要由數(shù)據(jù)采集分析、數(shù)據(jù)組織整理、數(shù)據(jù)存儲發(fā)布和數(shù)據(jù)共享使用四個功能模塊組成,如圖1所示。
3.3.1? 數(shù)據(jù)采集分析
數(shù)據(jù)采集模塊的主要任務(wù)是采集者身份認證,判斷采集格式的正確性,協(xié)助單位對采集資料的合規(guī)性、完備性、成熟性和價值型進行判斷,將符合要求的資料創(chuàng)建索引、歸檔和備份。整個系統(tǒng)擁有友好的用戶界面,支持所有經(jīng)認證的用戶登錄系統(tǒng),指引用戶按照要求收集信息,并規(guī)范提交、處理數(shù)據(jù)。
3.3.2? 數(shù)據(jù)組織整理
系統(tǒng)會根據(jù)數(shù)據(jù)的不同類型、作用以及完備程度對數(shù)據(jù)進行劃分,并匹配相應(yīng)的數(shù)據(jù)組織策略。對于不符合規(guī)范格式的數(shù)據(jù)格式,系統(tǒng)提供格式轉(zhuǎn)換處理,便于保存為規(guī)范的格式類型。對于上傳的數(shù)據(jù)進行標引和分類,根據(jù)不同的元數(shù)據(jù)規(guī)范生成元數(shù)據(jù)類型,最后根據(jù)數(shù)據(jù)內(nèi)容的主題領(lǐng)域?qū)?shù)據(jù)進行分類存儲,一般分為文字資源、圖片資源、視頻資源和虛擬現(xiàn)實資源四個部分,為了后續(xù)工作提供基礎(chǔ)。
3.3.3? 數(shù)據(jù)存儲發(fā)布
根據(jù)已經(jīng)組織好的資源數(shù)據(jù)類別設(shè)置不同的存儲方案,設(shè)定數(shù)據(jù)的保存期限和備份計劃。根據(jù)注冊用戶傳遞的數(shù)據(jù)進行分布式存儲,防止數(shù)據(jù)地址篡改和丟失。在這個模塊中,項目組各用戶可以根據(jù)權(quán)限新增、修改和存儲數(shù)據(jù),原始資源數(shù)據(jù)經(jīng)過非對稱加密后存儲在底層數(shù)據(jù)庫中。用戶在修改完成后,在區(qū)塊內(nèi)記錄新的地址,將數(shù)據(jù)的輸入時間戳、區(qū)塊長度和前一個區(qū)塊哈希值組成區(qū)塊頭,根據(jù)訪問控制樹將數(shù)據(jù)位置索引、明文形式的訪問控制策略和數(shù)據(jù)Merkle根加密后打包成塊,存儲至區(qū)塊體中,再上傳至區(qū)塊鏈。[6]。
3.3.4? 數(shù)據(jù)共享使用
數(shù)據(jù)共享使用模塊主要包含數(shù)據(jù)檢索、訪問和下載、數(shù)據(jù)共享三個模塊。網(wǎng)絡(luò)平臺可以提供多種檢索條件供用戶瀏覽和查詢信息,提供多途徑的數(shù)據(jù)訪問接口和訪問方式,對于在使用權(quán)限中的用戶提供共享和下載服務(wù)。系統(tǒng)依據(jù)訪問者的權(quán)限對應(yīng)訪問者的請求并查詢該數(shù)據(jù)的地址與對稱加密密鑰。若訪問者具有權(quán)限即可得到地址與密鑰,用戶可到底層數(shù)據(jù)庫中訪問數(shù)據(jù),完成訪問過程。區(qū)塊鏈技術(shù)在其中充當中樞作用,數(shù)據(jù)的訪問、下載和權(quán)限認證等環(huán)節(jié)都在區(qū)塊鏈中完成。
4? 結(jié)? 論
利用區(qū)塊鏈技術(shù)構(gòu)建口述歷史資源庫,構(gòu)建了數(shù)據(jù)采集分析、數(shù)據(jù)組織整理、數(shù)據(jù)存儲發(fā)布、數(shù)據(jù)共享使用四大功能模塊,解決了資源存儲擴容不便、安全共享程度不高、版權(quán)保護不利等問題,實現(xiàn)了口述資源管理的整個流程。但本研究只從區(qū)塊鏈技術(shù)特征入手設(shè)計了口述歷史資源庫理論模型,并未對模型的應(yīng)用和開發(fā)展開系統(tǒng)研究,在以后的研究中可以進一步開發(fā)模型進行驗證和評價。
參考文獻:
[1] 劉洋,張一帆,韓超.體育非物質(zhì)文化遺產(chǎn)口述歷史問題探析 [C]//中國體育科學學會.第十一屆全國體育科學大會論文摘要匯編.中國體育科學學會:中國體育科學學會,2019:1521-1522.
[2] 宋蓉.人微言不輕——安徽省圖書館《抗戰(zhàn)老兵口述歷史》項目案例分析 [J].山東圖書館學刊,2019(3):71-74.
[3] 王小平.圖書館口述歷史數(shù)據(jù)庫建設(shè)中的版權(quán)問題研究 [J].湖北理工學院學報(人文社會科學版),2014,31(3):44-46.
[4] 中國區(qū)塊鏈技術(shù)和產(chǎn)業(yè)發(fā)展論壇.中國區(qū)塊鏈技術(shù)和應(yīng)用發(fā)展白皮書(2016) [R/OL].(2016-10-18).http://www.cbdforum.cn/bcweb/index/article/rsr-6.html.
[5] 孔繁超.基于區(qū)塊鏈的開放獲取資源建設(shè)與管理 [J].情報理論與實踐,2019,42(5):153-158.
[6] 王秀利,江曉舟,李洋.應(yīng)用區(qū)塊鏈的數(shù)據(jù)訪問控制與共享模型 [J].軟件學報,2019,30(6):1661-1669.
作者簡介:趙丹僖(1984—),女,漢族,廣西柳州人,就職于圖書館,采編部主任,館員,研究生,碩士,研究方向:圖書館資源建設(shè)與服務(wù)。