劉麗梅
摘 要:第二次全國地名普查檔案是近三十年來全國地名工作的嶄新成果,具有資料新、數(shù)量大、現(xiàn)實(shí)性強(qiáng)的等特點(diǎn),在我國的新一輪數(shù)字化經(jīng)濟(jì)建設(shè)中有著不可替代的作用。建設(shè)能夠適合互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、云計(jì)算意義的應(yīng)用型數(shù)據(jù)庫,則是實(shí)現(xiàn)地名檔案全社會應(yīng)用的全新引擎。為了全面推進(jìn)地名檔案數(shù)據(jù)庫建設(shè),筆者從數(shù)據(jù)庫設(shè)計(jì)的基本要素出發(fā),對“二普”地名檔案數(shù)據(jù)庫建設(shè)中的界面設(shè)計(jì)和數(shù)據(jù)庫模塊設(shè)計(jì)進(jìn)行了粗淺的分析,意在為全國地名檔案工作提供借鑒。
關(guān)鍵詞:普查工作;地名檔案;數(shù)據(jù)庫
第二次全國地名普查工作于2018年底結(jié)束,形成了大量的地名檔案資料。根據(jù)《全國第二次地名普查檔案管理辦法》和《全國第二次地名普查成果轉(zhuǎn)化規(guī)劃(2015--2020)》關(guān)于“建設(shè)地名信息社會服務(wù)平臺,創(chuàng)新應(yīng)用電子地圖、遙感影像、三維仿真等技術(shù)手段,拓展利用云平臺、大數(shù)據(jù)、物聯(lián)網(wǎng)等技術(shù)方式,向社會提供權(quán)威、及時(shí)、準(zhǔn)確的地名信息服務(wù)”的系統(tǒng)要求,地名檔案數(shù)據(jù)庫建設(shè)則成為當(dāng)前工作的重點(diǎn)。但是,時(shí)間已經(jīng)進(jìn)入2020年,各地的地名檔案數(shù)據(jù)庫建設(shè)工作仍比較遲緩。為了加快“二普”地名檔案數(shù)據(jù)庫建設(shè),筆者從數(shù)據(jù)庫建設(shè)的基本原理出發(fā),對地名檔案數(shù)據(jù)庫建設(shè)的框架結(jié)構(gòu)進(jìn)行了粗淺的研究,提出了地名檔案數(shù)據(jù)庫界面和模塊設(shè)計(jì)的基本思路。
1 主要界面的設(shè)計(jì)
根據(jù)數(shù)據(jù)庫的界面工作原理,數(shù)據(jù)庫的界面設(shè)計(jì)主要分為應(yīng)用層、數(shù)據(jù)層和管理層。地名檔案數(shù)據(jù)庫的界面設(shè)計(jì)意在通過人、機(jī)交互,實(shí)現(xiàn)感知信號和實(shí)際地名信息的交互,通過指令——輸出命令——結(jié)果反饋——輸出結(jié)果等一系列的計(jì)算機(jī)運(yùn)算實(shí)現(xiàn)信息的提取與共享,進(jìn)而達(dá)到地名檔案數(shù)字化服務(wù)社會的目標(biāo)。地名檔案數(shù)據(jù)庫的界面則屬于軟件界面設(shè)計(jì)。軟件界面是系統(tǒng)功能的延伸,是指軟件中面向操作者而設(shè)計(jì)的用于操作使用及反饋信息的指令部分,包括系統(tǒng)啟動界面、系統(tǒng)整體架構(gòu)、菜單、圖標(biāo)、按鈕、滾動條等。在地名檔案數(shù)據(jù)庫的設(shè)計(jì)中,應(yīng)本著“簡約、通用、易行、大眾”的設(shè)計(jì)理念,積極開展設(shè)計(jì)工作。功能界面應(yīng)包括著錄、掃描、借閱、質(zhì)檢、統(tǒng)計(jì)、編輯著錄等。
1)著錄界面。著錄界面是整個(gè)系統(tǒng)的信息形成的核心界面之一,其功能是通過該界面的命令導(dǎo)引進(jìn)入工作界面,進(jìn)而開展著錄工作。該界面以Excel的形式展開,第一行為著錄項(xiàng)目,下方為表格填充項(xiàng)。其中著錄項(xiàng)目包括地名檔案的所有項(xiàng)目,而且在有新的需求時(shí)還可以拓展,進(jìn)而為地名檔案的著錄打開了廣闊空間。
2)掃描界面。掃描是全國第一次地名普查檔案數(shù)字化的重要內(nèi)容之一,是檔案真實(shí)性、原始性的集中反應(yīng),沒有掃描件作為參照,著錄的數(shù)據(jù)的真實(shí)性將遭到質(zhì)疑。為了確保掃描工作的完整性、檔案的原始性、數(shù)據(jù)比對的真實(shí)性,在軟件的設(shè)計(jì)中,我們采用點(diǎn)陣數(shù)據(jù)庫的形式,將掃描件存入圖形數(shù)據(jù)庫。在界面展示上則呈現(xiàn)出橫縱向排列的圖形界面,只顯示檔案的紙張形態(tài),和按照規(guī)則進(jìn)行排列的整體圖案。
3)查閱界面。檔案查詢借閱是對外服務(wù)功能的核心,檢索功能的強(qiáng)弱,調(diào)閱速度的快慢,檢全率的高低,直接考驗(yàn)軟件使用功能的成敗。查閱界面的圖標(biāo)以書頁的圖案表示,當(dāng)你點(diǎn)擊這個(gè)圖標(biāo)后,將顯示一個(gè)對話框,讀者可以根據(jù)自己的需求,按照專名、通名、區(qū)劃類別、地名類別進(jìn)行查閱。
4)質(zhì)檢界面。質(zhì)量檢查是核驗(yàn)著錄準(zhǔn)確率的重要環(huán)節(jié),是保證著錄內(nèi)容與掃描件完全一致的重要手段。沒有全面、系統(tǒng)、準(zhǔn)確的質(zhì)檢,檔案的真實(shí)性將大打折扣,也意味著檔案數(shù)字化工作的失敗。為了提高著錄工作的準(zhǔn)確率,在質(zhì)檢界面的設(shè)計(jì)中,著重體現(xiàn)了國家檔案局關(guān)于質(zhì)量標(biāo)準(zhǔn)的要求和規(guī)范,在界面表示上,數(shù)據(jù)庫內(nèi)的數(shù)據(jù)以電子表格的形式呈現(xiàn),以區(qū)縣為單位建立數(shù)據(jù)庫,實(shí)施分列,按排列順序和檔號加以區(qū)分。當(dāng)點(diǎn)擊要質(zhì)檢的條目時(shí),可同時(shí)打開檔案原件的掃描件,進(jìn)行對照。查驗(yàn)后,發(fā)現(xiàn)錯誤,可在機(jī)上立刻修改,完成質(zhì)檢。
5)統(tǒng)計(jì)界面。檔案統(tǒng)計(jì)是檔案工作的重要內(nèi)容,是制定檔案工作發(fā)展規(guī)劃、實(shí)施目標(biāo)任務(wù),指導(dǎo)檔案工作健康發(fā)展的重要環(huán)節(jié)。因此,在統(tǒng)計(jì)界面的設(shè)計(jì)上,要體現(xiàn)獨(dú)特的功能。為實(shí)現(xiàn)上述目標(biāo),在統(tǒng)計(jì)界面的設(shè)計(jì)上,應(yīng)本著“科學(xué)使用,項(xiàng)目齊全、功能完備”的原則,設(shè)計(jì)多功能的統(tǒng)計(jì)界面。通過總按鈕打開后,可以按照下拉式菜單的方式,分別鍵入通名、類別、專名、曾用名、行政區(qū)劃、全稱、簡稱等進(jìn)行統(tǒng)計(jì)。
6)編輯界面。這里提及的編輯功能并不是對掃描件、原著錄內(nèi)容的修改,并不是修改數(shù)據(jù)庫中的原件,而是可以將其中著錄原文下載,然后編輯利用。為了實(shí)現(xiàn)這一功能,在地名檔案數(shù)據(jù)庫軟件的設(shè)計(jì)中,應(yīng)突出下載功能,為用戶提供更加廣闊的利用空間,也可為檔案管理者修史編志提供極大便利。
2 數(shù)據(jù)庫的設(shè)計(jì)
“二普”地名檔案數(shù)據(jù)庫是以多個(gè)分支數(shù)據(jù)庫為支撐的系統(tǒng)數(shù)據(jù)源,其核心是通過融合多個(gè)數(shù)據(jù)庫的感知信號和實(shí)際地名信息的交互,完成輸出、輸入指令的信息系統(tǒng)。為了實(shí)現(xiàn)功能的互聯(lián)互通,在第二次全國地名普查檔案數(shù)據(jù)庫的設(shè)計(jì)中,至少應(yīng)建立以下基礎(chǔ)數(shù)據(jù)庫。
1)目錄數(shù)據(jù)庫。目錄數(shù)據(jù)庫就是對檔案目錄進(jìn)行存儲、處理和維護(hù)的軟件系統(tǒng)。對現(xiàn)存目錄的電子化,是其中的核心要素。地名檔案目錄的電子化主要包括以下內(nèi)容:一是對檢索目錄項(xiàng)的設(shè)置,要體現(xiàn)長遠(yuǎn)性、統(tǒng)一性和實(shí)用性;二是要保證電子目錄字段的多樣性和全面性。為了確保關(guān)鍵字查詢的有效性,其字段應(yīng)包括以下內(nèi)容:全宗號、檔案號、保管期限、責(zé)任者、文號、題名、日期、頁數(shù)、備注9個(gè)字段。三是設(shè)置電子目錄中檢索項(xiàng)題名項(xiàng)中任意關(guān)鍵詞進(jìn)行自動標(biāo)引和檢索,形成友好、方便、使用的檢索界面。
2)圖形掃描數(shù)據(jù)庫。圖形數(shù)據(jù)庫,是地名檔案數(shù)據(jù)庫的重要數(shù)據(jù)庫之一,它的意義在于實(shí)現(xiàn)著錄檔案內(nèi)容與實(shí)體檔案內(nèi)容的比對,是確保檔案真實(shí)性的重要環(huán)節(jié)。從內(nèi)容來看,主要包括圖形文件和文書文件兩部分,它們在總數(shù)據(jù)庫下又分為多個(gè)分支區(qū)塊。二者的數(shù)據(jù)庫建設(shè)的標(biāo)引和著錄體系均體現(xiàn)了地名的核心要素,其中包括名稱、漢語拼音、曾用名、地名由來、地理概況、區(qū)劃屬性、隸屬關(guān)系、類別等。
3)全文著錄數(shù)據(jù)庫。全文著錄數(shù)據(jù)庫,是二普地名檔案數(shù)據(jù)庫的根數(shù)據(jù),是數(shù)據(jù)庫建設(shè)的核心,其巨大的容量、海量的數(shù)據(jù)構(gòu)成了數(shù)據(jù)庫的有力支撐。在全文著錄的系統(tǒng)設(shè)計(jì)過程中,應(yīng)著重考慮全國第二次地名普查檔案進(jìn)館后的容量空間和詞條新的變化情況,一是留足了空間,二是為新增的地名標(biāo)志、地名成果圖、名稱審定、地名標(biāo)準(zhǔn)化處理、少數(shù)民族地名譯寫、行政區(qū)域界線標(biāo)繪做好了先期設(shè)計(jì)等。
4)照片數(shù)據(jù)庫。在這次地名普查中形成了大量的照片檔案,是地名檔案中的寶貴資料。為了實(shí)現(xiàn)二普照片檔案數(shù)據(jù)庫開發(fā)的專屬性,既要完善其數(shù)量體系,又要實(shí)現(xiàn)檢索和存儲路徑的互通。在檢索系統(tǒng)設(shè)計(jì)上,要依據(jù)二普檔案——圖片——屬地——名稱——內(nèi)容說明,等標(biāo)引項(xiàng),展開設(shè)計(jì)。在路徑設(shè)計(jì)上,盡量與圖形掃描數(shù)據(jù)庫區(qū)別開來,防止二者混淆。數(shù)據(jù)庫中的每一張圖片均與其相應(yīng)的地名檔案相對應(yīng),并與地名著錄數(shù)據(jù)庫相關(guān)聯(lián)。當(dāng)用戶查閱某一條地名時(shí),該照片也同步實(shí)現(xiàn)相應(yīng)的組合展示,使地名檔案的圖形實(shí)感效應(yīng)立現(xiàn)。
5)圖書資料數(shù)據(jù)庫。圖書資料是地名檔案的重要內(nèi)容之一,是地名普查工作的真實(shí)記錄,是地名普查成果轉(zhuǎn)化的具體表現(xiàn),其主要包括地名志、地名錄、地名詞典、地名圖和地名工作的其他資料。為了提高利用率,在軟件開發(fā)中應(yīng)開辟專門的地名圖書資料數(shù)據(jù)庫。數(shù)據(jù)庫的主要按圖書的類型設(shè)立文件夾,夾內(nèi)再進(jìn)行細(xì)分到每本圖書,并建立單獨(dú)目錄和檢索工具,便于檢索利用。