趙 巖(遼寧省交通高等??茖W校,沈陽 110122)
“WEB 2.0”概念是一個利用WEB平臺,由用戶主導而生成的內(nèi)容的互聯(lián)網(wǎng)產(chǎn)品模式,為了區(qū)別傳統(tǒng)由網(wǎng)站雇員主導生成的內(nèi)容而定義為第二代互聯(lián)網(wǎng).相對于WEB1.0技術,WEB2.0是一個全新的時代,主要包括博客(BLOG)、RSS、百科全書(WIKI)、網(wǎng)摘、社會網(wǎng)絡(SNS)、P2P、即時信息(IM)等,是信息技術發(fā)展引發(fā)網(wǎng)絡革命所帶來的面向未來、以人為本的創(chuàng)新2.0模式在互聯(lián)網(wǎng)領域的典型體現(xiàn),是由專業(yè)人員織網(wǎng)到所有用戶參與織網(wǎng)的創(chuàng)新民主化進程的生動注釋。WEB的誕生和發(fā)展,為檔案工作發(fā)展提供了新的契機和平臺,檔案工作要持續(xù)健康發(fā)展,必須突破傳統(tǒng)的建設和服務模式,綜合運用WEB2.0建設數(shù)字檔案館和檔案網(wǎng)站,推進檔案管理和服務水平地不斷提升。
1.1.1 萬維網(wǎng)的核心是WEB技術
目前,世界發(fā)展最快的網(wǎng)絡技術就是INTERNET上的萬維網(wǎng)(WORLD WIDE WEB)技術。萬維網(wǎng)技術是一種建立在INTERNET上的全球性的、交互的、動態(tài)、多平臺、分布式圖形信息系統(tǒng)。萬維網(wǎng)的核心是WEB技術。沒有萬維網(wǎng)技術之前的互聯(lián)網(wǎng),差不多只是一種改良了的電報技術?,F(xiàn)在萬維網(wǎng)技術的應用卻已經(jīng)遠遠超出了原設想,成為INTERNET上最受歡迎的應用之一,而且它的出現(xiàn)也極大的推動了INTERNET的推廣。萬維網(wǎng)的核心——WEB技術利用了一種稱為超文本(HYPERTEXT)的技術,即它使用了在文件中有著加重色的詞句或圖形去鏈接或指向其它文件、圖形、聲音等。
1.1.2 WEB技術是檔案網(wǎng)站建設的關鍵
隨著INTERNET在全球范圍內(nèi)的普及,其所應用的WEB技術也在不斷發(fā)展,從最初簡單超文本發(fā)展到互動類的動態(tài)網(wǎng)絡程序,又發(fā)展到超級數(shù)據(jù)庫的網(wǎng)絡信息聚合。目前越來越多的新興WEB技術層出不窮,如語義網(wǎng)格、描述邏輯等。目前,W3C(國際萬維網(wǎng)聯(lián)盟)還在不斷的推出WEB的新規(guī)范。檔案網(wǎng)站建設問題,同其他網(wǎng)站一樣,必須要用到WEB技術,因為檔案的網(wǎng)站也是需要在INTERNET上開放利用的,只不過檔案網(wǎng)站的建設有自己的特殊性,對WEB技術的需求也有自己的劃定標準。研究檔案網(wǎng)站的WEB技術應用有很重要的現(xiàn)實意義,只有采用適合本單位檔案業(yè)務的網(wǎng)絡技術開發(fā)網(wǎng)站才可以更好的對用戶提供檔案信息和數(shù)據(jù)的利用,這也可以說成是檔案網(wǎng)站開發(fā)建設的WEB技術需求問題。
1.2.1 檔案元數(shù)據(jù)是檔案數(shù)據(jù)庫建設的基礎
首先,從現(xiàn)有研究成果來看,元數(shù)據(jù)定義為:“元數(shù)據(jù)(DATA ABOUT DATA)是有關數(shù)據(jù)的數(shù)據(jù)”。這是具有最廣泛外延的一個定義,即元數(shù)據(jù)是一種有效的信息資源組織和管理的工具是一種編碼體系。它可以幫助人們檢索和確認所需要的資源,可以對數(shù)據(jù)單元進行詳細、全面的著錄描述,可以支持資源的存儲和使用管理,支持對資源進行長期保存。其次,建設檔案數(shù)據(jù)倉庫潛在檔案數(shù)據(jù)來源的信息、檔案數(shù)據(jù)模型的信息、檔案業(yè)務數(shù)據(jù)與檔案倉庫數(shù)據(jù)結構間的映射信息和檔案數(shù)據(jù)倉庫中信息使用情況的信息。開發(fā)以上檔案信息數(shù)據(jù),可以依據(jù)檔案元數(shù)據(jù)所支持的功能,分為描述性檔案元數(shù)據(jù)、管理性檔案元數(shù)據(jù)和結構性檔案元數(shù)據(jù)。
1.2.2 SQL SERVER 2000在檔案數(shù)據(jù)庫建設中的應用
首先,數(shù)據(jù)庫技術發(fā)展經(jīng)過了層次數(shù)據(jù)庫、網(wǎng)狀數(shù)據(jù)庫、關系數(shù)據(jù)庫和面向對象的數(shù)據(jù)庫,目前使用的最廣泛的是關系數(shù)據(jù)庫。關系數(shù)據(jù)庫使用行和列的方式來存儲數(shù)據(jù)。SQL SERVER 2000是新一代大型電子商務、數(shù)據(jù)倉庫和數(shù)據(jù)庫解決方案,其引擎集成了對XML的支持。它同時具有可擴展性(SCALABILITY)以及運行大型網(wǎng)站數(shù)據(jù)存儲組件時所需的安全性功能。SQL SERVER 2000程序開發(fā)模型與WINDOWS DNA架構的集成,可用來開發(fā)WEB應用程序。其次,從SQL SERVER 2000自身的特點來看,可以與ASP、JSP和PHP技術結合,通過WEB服務器把已經(jīng)建設成型的檔案信息數(shù)據(jù)庫對用戶開放。除了SQL SERVER 2000之外,還有很多數(shù)據(jù)庫系統(tǒng)都可以開發(fā)和建設檔案信息數(shù)據(jù)庫。如MYSQL數(shù)據(jù)庫、ACCESS和ORACLE等。
PHP技術是一種HTML內(nèi)嵌式語言(類似ASP)的技術,也是一門適合于建設各種規(guī)模檔案網(wǎng)站的技術,其根植于LINUX操作平臺。從安全機密角度來說,它比其他技術都適用于網(wǎng)絡檔案館、室的建設。PHP適合建設檔案網(wǎng)站的特性很多。如:開放性源代碼、基于服務器端運行、可以跨平臺架設、以簡單語言為基礎、圖像處理功能強大等。PHP擁有強大數(shù)據(jù)庫集成功能,用戶可以使用PHP存取ORACLE、SYBASE、MSSQL、ADABASED、MSQL、MYSQL、POSTTGRESQL、DBASE、FILEPRO、UNIX DBM、INFORMIX/ILLUSTRA等類型的數(shù)據(jù)庫以及任何支持ODBC標準的數(shù)據(jù)庫。PHP在數(shù)據(jù)庫方面的豐富支持,意味著它可以很好的支持基于不同情況而建設的不同類型的大規(guī)模檔案信息中心和檔案庫。
ASP.NET作為微軟最新推出的網(wǎng)絡技術,在建設檔案學和檔案信息數(shù)據(jù)庫網(wǎng)站方面有諸多優(yōu)點。首先,簡化開發(fā)操作。雖然ASP很容易使用,但是網(wǎng)頁程序過大時會顯得相當復雜。ASP.NET在代碼撰寫方面最大的特色是將頁面邏輯和業(yè)務邏輯分開,它分離程序代碼與顯示內(nèi)容,讓豐富多彩的網(wǎng)頁更容易撰寫,同時使程序代碼看起來更潔凈、更簡單。其次,語言獨立性。在ASP網(wǎng)頁中可以使用多種語言來撰寫程序代碼,不過只限于腳本語言。ASP.NET則允許使用編譯式的語言,提供較好的執(zhí)行效率和跨語言的兼容性,如VISUAL BASIC.NET、C#、C++ WITH MANAGED EXTENSION、JSCRIPT.NET等。再次,提高執(zhí)行效率。由于ASP.NET的程序代碼是編譯過的,執(zhí)行時會比ASP直譯的方式快很多。另外,ASP.NET也提供快取(CACHE)的能力,有效地縮短服務器的應答時間。最后,簡化部署與組態(tài)的操作。
ASP.NET是最新發(fā)展的新型技術,很多國家和地區(qū)進行檔案網(wǎng)站開發(fā)和技術升級,如國外的“德國國家檔案館”、“葡萄牙國家檔案館”、“美國國會圖書館”;國內(nèi)的“廣東省檔案信息網(wǎng)”、“山東檔案信息網(wǎng)”等。從技術含量上來說,采用.NET技術開發(fā)的網(wǎng)站比較先進,無論是在人性化設計、腳本簡捷性方面,還是在功能強度、瀏覽者易用性方面性能都比較高。以“山東檔案信息網(wǎng)”為例,因為技術比較先進,該站不僅支持查詢檔案文獻還支持對現(xiàn)行文件的查詢利用,在檔案文獻內(nèi)部還分為“革命歷史檔案”、“民國檔案”、“建國后檔案”和“山東政報”四類。這四類每一類都支持通過“文件編號”、“責任者”、“題名”、“時間”等高級檢索方式的檢索功能。
在WEB2.0時代,XML技術成為任何網(wǎng)站建設都不能離開的核心網(wǎng)絡技術?;赬ML技術誕生的互聯(lián)網(wǎng)內(nèi)容發(fā)布和集成技術應運而生,這就是使全球互聯(lián)網(wǎng)檔案信息的元數(shù)據(jù)聚合成為可能的RSS技術。RSS是一種描述檔案數(shù)據(jù)或其他WEB內(nèi)容的方式,通過“FEED(提要)”將檔案信息和數(shù)據(jù)從在線出版者傳遞到WEB用戶面前,通常用戶可以通過RSS來訂閱多個數(shù)字檔案館的相關信息。檔案網(wǎng)站建設開發(fā)應用了XML技術,它可以通過RSS提供檔案信息的資源共享,功能主要是發(fā)布檔案館新聞、檔案館檔案導讀。在檔案館領域RSS最實際的應用就是易于產(chǎn)生各種不同類型的檔案列表,用戶可以通過主題選擇來預定新到檔案列表的主題范圍,從而避免了無用信息過多。
檔案網(wǎng)站是檔案管理運行機構在互聯(lián)網(wǎng)上建立的站點,是發(fā)布各類檔案信息并提供服務利用的工具,是構成信息網(wǎng)絡的一個節(jié)點。從WEB技術應用方面來看,比較成功的檔案網(wǎng)站有“美國國家檔案館”、“英國國家檔案館”和“澳大利亞國家檔案館”網(wǎng)站,其各方面服務比較完善,數(shù)據(jù)庫功能強大,可以提供全文檢索功能,可以方便找到解密檔案原始文件,這些檔案網(wǎng)站都是采用了ASP、ASP.NET技術和XML技術相結合的方法,配合超大規(guī)模的檔案信息數(shù)據(jù)庫支持建設而成。我國檔案管理者和編研者在實際工作中應該積極借鑒、運用這些技術,推動我國數(shù)字檔案館建設,真正實現(xiàn)檔案信息資源共享。
[1]維克托·邁爾-舍恩伯格,肯尼斯·庫克耶.大數(shù)據(jù)時代———生活、工作與思維的大變革[M].杭州:浙江人民出版社,2013:1-26.
[2]WIKIPEDIA.WEB2.0[DB/OL].http://en.wikipedia.org/wiki/web_2.2014-05-26.
[3]張寧.2011 年我國省級檔案網(wǎng)站綜合測評與分析[J].檔案學研究,2011,(5):66-71.
[4]余厚洪.網(wǎng)絡環(huán)境下檔案信息資源整合探究[J].檔案管理,2012,(5):37-39.
[5]胡明浩.美國國家檔案與文件管理署利用社交媒體開展 檔 案 文化傳播工作的啟示[DB/OL].http://www.archives.sh.cn/dalt/wgdagz/201402/t20140211_40307.h-tml.2014-05-26.