魯曉明 張澍雅
(鄭州大學(xué)信息管理學(xué)院,河南 鄭州 450001)
“中華老字號”本體檔案資源庫的構(gòu)建研究
魯曉明張澍雅
(鄭州大學(xué)信息管理學(xué)院,河南鄭州450001)
[摘要]為了更好發(fā)揮老字號檔案的價值,本文分析了當(dāng)前“中華老字號”數(shù)字化檔案展覽現(xiàn)狀,提出創(chuàng)建老字號本體資源庫,構(gòu)建老字號檔案間的語義互聯(lián)關(guān)系。通過對老字號檔案數(shù)字化展品的語義組織,深入挖掘潛在信息資源,為用戶提供智能化、個性化、便捷化的用戶體驗。
[關(guān)鍵詞]檔案;“中華老字號”;語義組織;本體
中華老字號是指具有長遠(yuǎn)發(fā)展歷史、擁有世代相傳的技藝、服務(wù)或產(chǎn)品,它擁有鮮明的中華民族傳統(tǒng)文化背景、深厚的文化底蘊,并在此基礎(chǔ)上取得了社會的廣泛認(rèn)同,形成良好信譽的品牌[1]。無論是在過去還是現(xiàn)在,中華老字號對中華文化都起著深遠(yuǎn)影響。檔案記錄著社會歷史發(fā)展的重要信息,能完整、準(zhǔn)確的展現(xiàn)歷史發(fā)展面貌,具有重要的憑證和參考價值。檔案通過對中華老字號從創(chuàng)建到發(fā)展過程中形成的各種信息的記載,充分展現(xiàn)了老字號的傳統(tǒng)特色和悠久的歷史文化價值,這對老字號的進(jìn)一步繼承、創(chuàng)新、發(fā)展具有重要現(xiàn)實意義。
新中國成立前創(chuàng)建的老字號企業(yè)隨著時代背景的變遷一路發(fā)展到如今的互聯(lián)網(wǎng)、大數(shù)據(jù)、云計算時代,順應(yīng)歷史的腳步,將老字號企業(yè)檔案數(shù)字化、網(wǎng)絡(luò)化、語義化不但是記錄的需要,也是深度開發(fā)利用這些珍貴檔案的需要,更是老字號借助先進(jìn)信息技術(shù)發(fā)展推廣企業(yè)文化、創(chuàng)新經(jīng)營模式的需要。
目前,已有部分檔案館網(wǎng)站設(shè)置老字號檔案展覽版塊,如上海檔案信息網(wǎng)、青島檔案信息網(wǎng)、北京市檔案信息網(wǎng)等,展出了部分中華老字號發(fā)展歷程中的珍貴圖片,但截至目前,檔案館對老字號檔案的數(shù)字化只是簡單地把實體檔案進(jìn)行掃描、拍照,并將圖片通過靜態(tài)網(wǎng)頁孤立的展示出來,加之簡單的文字描述,并沒有提供和圖片相關(guān)的實體檢索鏈接,這表明老字號檔案資源領(lǐng)域缺乏有效的語義組織,和圖片相關(guān)的各種實體對象之間的聯(lián)系尚未建立起來,因此無法為用戶提供多角度、多入口的檢索途徑。而對于當(dāng)前成熟的網(wǎng)絡(luò)用戶而言,基于資源語義組織的檢索是一個資源服務(wù)單位必備的基本服務(wù)項目之一,因此創(chuàng)建中華老字號本體檔案資源庫尤為重要。通過建立老字號數(shù)字檔案之間的語義互聯(lián)關(guān)系,形成老字號本體資源庫,從而在老字號檔案資源生態(tài)系統(tǒng)的基礎(chǔ)上創(chuàng)新服務(wù)模式。
2.1以數(shù)字化形式展現(xiàn)
數(shù)字化檔案是指將紙質(zhì)檔案、照片、膠片等傳統(tǒng)檔案利用數(shù)據(jù)庫技術(shù)、數(shù)據(jù)壓縮技術(shù)、高速掃描技術(shù)等技術(shù)手段轉(zhuǎn)化為數(shù)字化的信息[2]。通過查找老字號數(shù)字化檔案相關(guān)信息,了解檔案館網(wǎng)站老字號板塊發(fā)展現(xiàn)狀,發(fā)現(xiàn)上海檔案信息網(wǎng)、北京檔案信息網(wǎng)、青島檔案信息網(wǎng)是目前老字號檔案信息較豐富的網(wǎng)站。上海檔案信息網(wǎng)將老字號進(jìn)行分類,劃分為商業(yè)街區(qū)、四大百貨公司、餐飲醫(yī)藥、服裝、銀樓、雜貨、老字號新貌七個類別,每個類別附上若干張照片,并對照片進(jìn)行一句話說明;北京檔案信息網(wǎng)老字號信息則分布分散,只對部分老字號信息進(jìn)行簡單的語言描述;青島檔案信息網(wǎng)老字號信息則以散文的形式對老字號進(jìn)行描寫說明,多以第三人稱角度。在眾多老字號企業(yè)網(wǎng)站上,只有全聚德設(shè)置了網(wǎng)上展覽模塊,它分為五個板塊,分別為序廳、第一展廳、第二展廳、第三展廳、展館巡禮,通過圖文并茂的形式來展現(xiàn)企業(yè)文化和企業(yè)發(fā)展過程。目前,檔案數(shù)字化形式一般包括口頭檔案的數(shù)字音頻,經(jīng)過掃描、拍照后的照片檔案,但通過調(diào)查相關(guān)網(wǎng)站的老字號板塊,發(fā)現(xiàn)當(dāng)前老字號檔案數(shù)字化展覽并不充分,只是孤立、零散的將照片展現(xiàn)出來,需進(jìn)一步加強老字號檔案展覽的開發(fā)。
2.2數(shù)字化檔案的分類
根據(jù)老字號數(shù)字化檔案對象的不同,可將數(shù)字化檔案分為增量數(shù)字化檔案信息和存量數(shù)字化檔案信息兩種[3]。在檔案館接收信息的過程中,自身以數(shù)字信息方式存儲的數(shù)據(jù),如光盤、磁盤、硬盤等,且在歸檔時主要通過網(wǎng)絡(luò)、數(shù)據(jù)轉(zhuǎn)移、數(shù)據(jù)轉(zhuǎn)換、系統(tǒng)等方式進(jìn)行歸檔的電子檔案,這種檔案信息稱為增量數(shù)字化檔案信息。如老字號在形成過程中,直接形成的存儲在硬盤上的信息內(nèi)容。而存量數(shù)字化檔案信息則將檔案館館藏的紙質(zhì)、錄像帶、縮微膠片等載體存儲的檔案,進(jìn)行數(shù)字化掃描、轉(zhuǎn)化等加工處理,形成數(shù)字化形式的聲音、圖像、多媒體信息等。這種類型的檔案信息主要通過對現(xiàn)有館藏進(jìn)行數(shù)字化加工、處理得到。如上海檔案信息網(wǎng)上的圖片展覽,通過將照片掃描,以數(shù)字化的形式存儲在計算機上。通過組織增量數(shù)字化檔案信息和存量數(shù)字化檔案信息,以充分挖掘老字號信息資源。
根據(jù)老字號企業(yè)經(jīng)營范圍不同,還可以將老字號檔案相應(yīng)地分為以下幾類:餐飲業(yè)、工藝業(yè)、零售業(yè)、日化業(yè)、食品業(yè)、煙酒業(yè)、醫(yī)藥業(yè)七類。其中餐飲業(yè)包括當(dāng)?shù)靥厣〕浴埱f;工藝業(yè)包括飾品、古玩、文房工具、玉器、剪刀;零售業(yè)包括食品、服裝百貨;日化業(yè)主要包括金屬類、冶煉類、化學(xué)類、紡織類;食品業(yè)主要包括糧油加工、煙酒糖茶、干果、糕點;醫(yī)藥業(yè)包括西藥店、中藥店、制藥廠、中藥廠。
2.3檔案內(nèi)容的相關(guān)性
任何檔案都不可能孤立存在,總有與其內(nèi)容相關(guān)的檔案,因此同一企業(yè)的老字號檔案在內(nèi)容上必然存在縱向聯(lián)系、橫向聯(lián)系和相關(guān)聯(lián)系。在傳統(tǒng)檔案管理過程中,紙質(zhì)檔案的內(nèi)容僅僅單純的記錄在紙張上,雖然它與相關(guān)檔案在一定程度上存在聯(lián)系,但它們之間的聯(lián)系很難創(chuàng)建,沒有形成系統(tǒng)的體系。而數(shù)字化檔案展覽,則對檔案信息資源進(jìn)行再組織、再加工,建立它們橫向、縱向或相關(guān)聯(lián)系,為用戶提供智能化的檔案新服務(wù)。例如,老鳳祥企業(yè)1848年在上海創(chuàng)建第一座銀樓,到如今店鋪已遍及全國各地,這一過程正是老鳳祥企業(yè)不斷發(fā)展的歷程。建立老鳳祥企業(yè)縱向聯(lián)系,不僅能讓用戶從數(shù)字化檔案展覽中感受到企業(yè)的發(fā)展動態(tài),更有利于企業(yè)宣傳自身文化價值,實現(xiàn)更大的經(jīng)濟效益。
3.1語義組織過程
本體是共享概念模型的明確的形式化規(guī)范說明[4]。它包括四個層次的內(nèi)容:概念模型、形式化、共享、明確,本體是通過抽象出客觀世界中某些現(xiàn)象的相關(guān)概念而得到的模型,它能夠通過計算機進(jìn)行處理,并且所體現(xiàn)的內(nèi)容是相關(guān)領(lǐng)域共同認(rèn)可的知識。本體能夠為概念建立名稱、屬性和聯(lián)系,它通過捕獲相關(guān)領(lǐng)域的知識,包括該領(lǐng)域內(nèi)共同認(rèn)可的詞匯,來保證對知識理解運用的一致性、正確性、可重用性和共享性,同時提供語義推理算法已經(jīng)成為主流建模方法。因此,“中華老字號”數(shù)字化檔案資源的語義組織模型的構(gòu)建應(yīng)遵循可重用性和互操作性的原則。
“中華老字號”數(shù)字化檔案語義組織的通用模型表示為:THBO={C,P,Rc,Rp,E},其中C表示概念集,包含人物、事件、地點、口頭檔案,圖片檔案,對應(yīng)平臺所涉及的實體集合;P表示屬性,包含C中所有概念的各種屬性;Rc代表概念之間的聯(lián)系,例如口頭檔案所反映的事件、檔案中所包含的人物,檔案事件所發(fā)生的地點;Rp表示屬性之間的聯(lián)系;E表示概念集C中每個概念所對應(yīng)的實例集合。以下對THBO模型展開具體介紹。
①概念集C
“中華老字號”數(shù)字化檔案展覽平臺可形式化為:C= {person,event,place,oralArchive,imageArchive}
表1 人物基本信息
②屬性集P
由于每個概念所對應(yīng)的實體具有不同的屬性,以下分別討論。
表2 事件基本信息
表3 地點基本信息
表4 口頭檔案基本信息
表5 圖片檔案基本信息
“中華老字號”數(shù)字化檔案語義組織的通用模型如圖1。
圖1“中華老字號”數(shù)字化檔案語義組織的通用模型
其中,在事件event中,包含beforeEvent,afterEvent和relativeEvent三個屬性。beforeEvent和afterEvent存在時間上的先后關(guān)系,例如將老鳳祥銀樓建立初期和改革開放后的發(fā)展?fàn)顩r聯(lián)系起來,讓用戶系統(tǒng)的了解到老鳳祥銀樓的發(fā)展歷程。relativeEvent表示相關(guān)事件的聯(lián)系,如老鳳祥和老廟均為銀樓,他們在發(fā)展過程中并不存在交叉關(guān)系或時間關(guān)系,但他們銷售對象均為珠寶,如果創(chuàng)建老鳳祥和老廟兩者的聯(lián)系,用戶在查找老鳳祥銀樓的信息時,能通過創(chuàng)建的相關(guān)關(guān)系獲得老廟的信息,將為用戶帶來極大的便捷。
3.2數(shù)字化檔案個體描述
個體描述即在類中添加實例,就是將以上語義組織過程想象成某一具體老字號品牌數(shù)字化展覽建模過程,即把老字號檔案中的“人物”“采集者”“地點”“時間”等屬性值填入到對應(yīng)地方。例如,圖2老鳳祥銀樓圖片檔案由創(chuàng)建于1848年的老鳳祥銀樓、創(chuàng)建于1911年的新老鳳祥銀樓、當(dāng)代老鳳祥銀樓三幅圖組成。根據(jù)以上建立好的模型進(jìn)行填充,得到圖3上海老鳳祥的建模過程。特別是通過建立event屬性,將老鳳祥銀樓創(chuàng)模。
圖2 老鳳祥銀樓圖片檔案
老字號作為重要的歷史文化資源,受眾十分廣泛,包括社會全體成員,同時老字號作為企業(yè)的重要資源,也必須滿足企業(yè)的現(xiàn)實要求,增加企業(yè)的經(jīng)濟效益。這要求老字號信息資源的獲取更加便捷,面對海量的信息資源,用戶能方便、快捷的獲取到自己想要的信息資源。由于信息技術(shù)的進(jìn)步,信息量的迅速激增,大數(shù)據(jù)、云計算、“互聯(lián)網(wǎng)+”已成為不可逆轉(zhuǎn)的發(fā)展潮流,人們對信息的需求越來越迫切,呈現(xiàn)出多樣化、多層次的特點。傳統(tǒng)的老字號網(wǎng)上展覽只是將相關(guān)圖片發(fā)布在網(wǎng)上,或是對老字號企業(yè)進(jìn)行簡單介紹,信息分布尤為分散,不能系統(tǒng)的進(jìn)行查找和利用,這種方式已不能很好地滿足用戶需求,用戶更希望從龐大的信息資源中準(zhǔn)確快速地查找到想要的信息,從現(xiàn)有展品展示的信息中獲取到更多展品背后的信息,從被動的滿足用戶需要轉(zhuǎn)變?yōu)槟転橛脩糁鲃油茰y信息。
圖3 上海老鳳祥建模過程
通過建立“中華老字號”數(shù)字化檔案展覽語義組織,將老字號信息資源組成新的體系,挖掘不同內(nèi)容的檔案信息,實現(xiàn)在網(wǎng)絡(luò)環(huán)境中進(jìn)行整合和管理,更好地滿足用戶需求。信息服務(wù)的發(fā)展必須要滿足用戶需求,檔案作為信息服務(wù)的組成部分,其發(fā)展也應(yīng)適應(yīng)用戶需求,即用戶需求是信息服務(wù)的起點,用戶需求的滿足是信息服務(wù)的終點[5]。
用戶需求往往伴隨著一定的用戶行為,讓用戶獲取有效信息的行為更加便捷,則將促進(jìn)用戶需求。網(wǎng)上展覽作為老字號數(shù)字化檔案開發(fā)應(yīng)用的一種方式,通過分析用戶需求,了解用戶真正需要什么,以便更好地服務(wù)用戶。其中老字號網(wǎng)上展覽需求主要包括信息的利用對象是誰,用戶利用的內(nèi)容和方式是什么,其中包括潛在需求和現(xiàn)實需求,用戶希望通過哪些方式來獲取檔案信息等。
構(gòu)建語義組織的最終目的是為了實現(xiàn)更加智能化的應(yīng)用服務(wù)。目前我國老字號檔案信息資源分布較分散,多以紙質(zhì)形式散存于各類檔案館、圖書館、博物館和企業(yè)中,老字號檔案信息呈現(xiàn)“碎片化”的現(xiàn)象,集中管理的傳統(tǒng)方法很難適應(yīng)老字號檔案信息資源的整合和管理,這與用戶對老字號數(shù)字檔案信息資源的需求相矛盾。由于老字號檔案管理不到位,缺乏深度開發(fā),檔案價值還待挖掘。因此,充分發(fā)揮老字號檔案信息資源的歷史和現(xiàn)實價值,就必須充分利用網(wǎng)絡(luò)信息技術(shù),通過在線接收虛擬老字號信息資源,實現(xiàn)虛擬信息的整合,同時創(chuàng)建老字號數(shù)字檔案的語義互聯(lián)關(guān)系,將能實現(xiàn)更加智能的信息檢索。
開發(fā)檔案信息資源是為了利用檔案信息資源,建立老字號數(shù)字檔案的語義互聯(lián)關(guān)系以實現(xiàn)以下目的。一是獨具特色、歷史悠久的老字號企業(yè)無論是在經(jīng)濟層面還是歷史文化層面上都具有重要地位。充分挖掘老字號檔案的文化內(nèi)涵,創(chuàng)新企業(yè)管理新方式,將使老字號企業(yè)更有活力,形成獨特的經(jīng)營特色,增強企業(yè)競爭力,同時提升企業(yè)文化內(nèi)涵。二是將老字號檔案進(jìn)行語義整合,創(chuàng)建老字號開發(fā)平臺。由于老字號檔案存在“碎片化”的現(xiàn)象,整合檔案資源,將其匯集在一起,打破檔案資源分布的時間和空間界限,更好的服務(wù)于大眾。
傳統(tǒng)的檔案管理方式已不能較好的適應(yīng)當(dāng)今時代的發(fā)展,隨著數(shù)字化時代的到來,對老字號檔案的管理不僅局限于傳統(tǒng)檔案管理的方式,更重要的是將分散的老字號資源進(jìn)行分類、整理、語義分析,對老字號檔案照片及其相關(guān)資源進(jìn)行整合組織,構(gòu)建老字號檔案本體資源庫,同時借助數(shù)字化的工具和設(shè)備,提供老字號的數(shù)字化檔案展覽。之前對老字號檔案的管理較為松散,意識不足,沒有充分發(fā)揮檔案的歷史和現(xiàn)實價值。通過建立老字號檔案間的語義互聯(lián)關(guān)系,將過去和現(xiàn)在的信息系統(tǒng)聯(lián)系起來,為用戶提供個性化的檔案檢索服務(wù),以適應(yīng)時代發(fā)展的需求,讓老字號檔案重新展現(xiàn)出新的生機和活力,為老字號企業(yè)的建設(shè)和發(fā)展,老字號文化的繼承和弘揚提供不竭的力量之源。
參考文獻(xiàn):
[1]謝蘭玉.“老字號”檔案資源的開發(fā)與利用——以上海市靜安區(qū)檔案局(館)的做法為例[J].中國檔案,2014(2):52-53.
[2]李殿環(huán).基于.NET的數(shù)字化檔案館研究和開發(fā)[D].西安:西安建筑科技大學(xué),2009.
[3]薛四新,陳永生.數(shù)字化檔案新信息的真實性保障[J].檔案與建設(shè),2005(6):6-8.
[4]曹樹金,馬麗霞.論本體與本體語言及在其信息檢索領(lǐng)域的應(yīng)用[J].情報理論與實踐,2004(6):632-637.
[5]連志英.基于用戶需求的個性化數(shù)字檔案信息服務(wù)模式構(gòu)建[J].檔案學(xué)通訊,2013(5):49-53.
[中圖分類號]G250.74
[文獻(xiàn)標(biāo)識碼]A
文章編號:1671-0037(2016)05-78-4
收稿日期:2016-4-25
作者簡介:魯曉明(1976-),女,碩士,講師,研究方向:信息服務(wù)、信息組織;張澍雅(1994-),女,在讀本科,研究方向:檔案服務(wù)、檔案管理。
Research on the Construction of“China Time-Honored Brand”O(jiān)ntology Archival Repository
Lu Xiaoming Zhang Shuya
(School of Information Management,Zhengzhou University,Zhengzhou Henan 450001)
Abstract:In order to make better use of time-honored archives value,this paper analyzes the current situa?tion of digital archives exhibition of“China Time-Honored Brand”,proposed to create the time-honored ontolo?gy repository,construct the semantic interconnection relationship between the time-honored archives.Through the semantic organization of time-brand digital archives exhibition,we dig the potential information resources,to provide intelligent,personalized and convenient user experience for users.
Key word:Archival;“China Time-Honored Brand”;Semantic organization;Ontology