宋鴻運(yùn)
(國(guó)家基礎(chǔ)地理信息中心,北京 100048)
歷史地圖(Historical Map),是反映人類歷史時(shí)期自然和政治、經(jīng)濟(jì)、軍事、文化狀況及其變化的地圖,是顯示有史以來(lái)一切與人類活動(dòng)有關(guān)的具有空間分布和地域差異現(xiàn)象的地圖。歷史地圖檔案資料(Historical Map Archive References),一般是指在歷史上形成的反映各個(gè)時(shí)期社會(huì)經(jīng)濟(jì)地理狀況的地圖,在一個(gè)關(guān)鍵的時(shí)間節(jié)點(diǎn)上某一張地圖可能會(huì)成為見(jiàn)證一件重大事件的歷史憑證,地圖上的每一個(gè)地名、每一條界線都會(huì)反映出當(dāng)時(shí)一個(gè)地區(qū)的歸屬和制圖人所代表的觀點(diǎn)。
“中國(guó)東海、南海及周邊國(guó)家歷史地圖資料整編”是國(guó)家科技基礎(chǔ)性需求工作項(xiàng)目,項(xiàng)目的主要任務(wù)是通過(guò)搜集、整理,分析保管在國(guó)家測(cè)繪檔案資料系統(tǒng)及相關(guān)部門(mén)的大量古今中外有關(guān)東海、南海領(lǐng)域及周邊國(guó)家的歷史地圖資料、現(xiàn)代地圖資料及不同國(guó)家的歷史地圖資料,為今后的政治外交及軍事活動(dòng)、科學(xué)研究提供有查考價(jià)值的參考資料與測(cè)繪技術(shù)保障。
項(xiàng)目設(shè)計(jì)了四個(gè)課題,其中課題一《中國(guó)東海、南海及周邊國(guó)家地圖資料的搜集、整理》和課題四《中國(guó)東海、南海及周邊歷史地圖數(shù)據(jù)庫(kù)建設(shè)》都涉及地圖檔案資料元數(shù)據(jù)的分析、利用和再設(shè)計(jì)等工作。課題一是要利用歷史地圖資料的元數(shù)據(jù),來(lái)搜集和整理符合要求的各類地圖資料,而課題四是要求將收集來(lái)的各類地圖資料按照新的要求制定元數(shù)據(jù)規(guī)則,進(jìn)行相關(guān)信息的錄入和管理。
那么如何能做到收集到的是有用的,管理起來(lái)最科學(xué),使用起來(lái)最有效?從分析各類地圖檔案資料的元數(shù)據(jù)入手,找到快速搜索相關(guān)地圖資料的元數(shù)據(jù)項(xiàng),在分析已有的各種地圖檔案資料的元數(shù)據(jù)和相關(guān)標(biāo)準(zhǔn)的基礎(chǔ)上,再進(jìn)行新的針對(duì)本項(xiàng)目的元數(shù)據(jù)設(shè)計(jì)工作,或者進(jìn)行符合專題需求的元數(shù)據(jù)的設(shè)計(jì),建立起針對(duì)專題歷史地圖資料的元數(shù)據(jù),為后續(xù)的數(shù)據(jù)建庫(kù)管理和提供服務(wù)奠定基礎(chǔ)。這些都是本文解決的問(wèn)題。
本項(xiàng)目選擇歷史地圖資料的來(lái)源主要分為:
主要包括國(guó)家測(cè)繪檔案資料館、中國(guó)地圖出版社、海軍出版社等國(guó)家級(jí)地圖檔案資料收集、管理機(jī)構(gòu)多年積累形成的地圖資源,主要包括:各種比例尺的地形圖、海圖、教學(xué)用圖、用于編制地圖作品的比較經(jīng)典的各種國(guó)內(nèi)外地圖集等,這些地圖資源的優(yōu)點(diǎn)在于,地圖資料比較成系列,地圖資料的編制單位都正規(guī),地圖資料的品質(zhì)比較有保證。更重要的一點(diǎn)是,不同單位對(duì)地圖檔案資料都有一定的管理模式,平時(shí)為了利于管理和提供服務(wù),已經(jīng)記錄了一些地圖資料的相關(guān)的元數(shù)據(jù)信息,對(duì)這些元數(shù)據(jù)的定義和充分的分析,提高選取符合要求地圖資料的效率,而且其中一些元數(shù)據(jù)信息經(jīng)過(guò)一定的選取處理是可以直接應(yīng)用的。下面以中國(guó)地圖出版社和國(guó)家測(cè)繪檔案資料館館藏地圖資料的管理元數(shù)據(jù)分析為例進(jìn)行說(shuō)明。
地圖出版社的相關(guān)工作人員基于一定的項(xiàng)目工作內(nèi)容,對(duì)自己館藏的地圖資源進(jìn)行了逐一的記錄核查。其元數(shù)據(jù)信息是比較詳盡的。其著錄的信息主要分為3大類,24小項(xiàng)的數(shù)據(jù)信息描述。
出版物信息,包括:出版物名稱、出版國(guó)、出版者、出版日期、版次印次、收藏機(jī)構(gòu)、書(shū)號(hào)、封底掃描、版權(quán)信息掃描;
地圖基本信息,包括:地圖名稱、地圖類型、文種、原圖尺寸(橫寬×縱高,單位:cm)、比例尺、成圖日期、編繪者、資料類型、地圖掃描;
涉南海表示信息,包括:所涉區(qū)域范圍、斷續(xù)線情況、島礁名情況、島礁歸屬情況、有利情況、備注描述。
由上述信息可以看出地圖出版社所著錄的歷史地圖資料的元數(shù)據(jù)信息偏重于地圖資料的描述信息的記錄,比較方便于資料的使用。
國(guó)家測(cè)繪檔案資料館管理著大量的測(cè)繪地理信息檔案資料,不同類型檔案資料的元數(shù)據(jù)信息采集的模式是不同的,其中地形圖類元數(shù)據(jù)有分為國(guó)內(nèi)和國(guó)外兩種模式,其中國(guó)內(nèi)出版地形圖類資料的元數(shù)據(jù)項(xiàng)共有39項(xiàng)數(shù)據(jù)內(nèi)容,其中涉及檔案管理的有12項(xiàng),占元數(shù)據(jù)項(xiàng)的30%,而與地圖檔案資料地圖屬性相關(guān)的有27項(xiàng),占元數(shù)據(jù)項(xiàng)條目的70%,而其中真正與選取地圖資料相關(guān)的數(shù)據(jù)項(xiàng)只有4項(xiàng),那就是地形圖檔案資料的左邊經(jīng)度、右邊經(jīng)度、上邊緯度、下邊緯度,僅占元數(shù)據(jù)項(xiàng)的10%。
國(guó)外出版的地形圖資料的元數(shù)據(jù)共有37項(xiàng)內(nèi)容,其在快速搜索的元數(shù)據(jù)項(xiàng)的使用率也和上述情況相似。
可以看出,國(guó)家測(cè)繪檔案資料館藏資料的元數(shù)據(jù)信息偏重于檔案資料管理的內(nèi)容,更注重于管理內(nèi)容的錄入。而項(xiàng)目的目的是要在館藏30多萬(wàn)條元數(shù)據(jù)記錄信息中快速地找到與項(xiàng)目相關(guān)的地圖資料信息,最快捷的辦法就是利用元數(shù)據(jù)中位置信息的記錄內(nèi)容,確定地形圖資料所表達(dá)的范圍,從而確定所需資料的范圍。
根據(jù)地形圖類檔案資料記錄的元數(shù)據(jù)項(xiàng)的左邊經(jīng)度、右邊經(jīng)度、上邊緯度、下邊緯度的信息,項(xiàng)目組利用目前空間數(shù)據(jù)轉(zhuǎn)換方面比較領(lǐng)先的FME(Feature Manipulate Engine)軟件,實(shí)現(xiàn)了將原來(lái)記錄的每幅圖所記錄的坐標(biāo)元數(shù)據(jù)項(xiàng),轉(zhuǎn)換成空間地理信息數(shù)據(jù),在ArcMap中對(duì)坐標(biāo)進(jìn)行空間定位,大大提高了選取符合條件的地圖檔案資料的速度和準(zhǔn)確度。利用生成地形圖類檔案資料的空間地理信息數(shù)據(jù),再借助地理信息軟件平臺(tái),可以比較方便地選出與專題研究相關(guān)區(qū)域的館藏的國(guó)內(nèi)出版和國(guó)外出版的符合區(qū)域條件的地圖檔案資料,繪出資料分布區(qū)域的圖形,再根據(jù)資料具體覆蓋區(qū)域的范圍和其他相關(guān)地形圖檔案資料元數(shù)據(jù)的內(nèi)容進(jìn)行精選。
而對(duì)于館藏的專題類和地圖集類的資料,也可以通過(guò)元數(shù)據(jù)項(xiàng)所屬地區(qū)挑選出相關(guān)的檔案資料進(jìn)行詳細(xì)的判讀,以國(guó)外地圖集為例,目前已有的元數(shù)據(jù)有29項(xiàng)內(nèi)容,根據(jù)選取資料的要求,進(jìn)行資料與項(xiàng)目研究?jī)?nèi)容相關(guān)性的判定,如根據(jù)項(xiàng)目課題一,資料搜集指標(biāo)之一的國(guó)外較著名的出版商出版的世界地圖冊(cè)或相關(guān)國(guó)家出版的地圖冊(cè)等指標(biāo),可以選出國(guó)家測(cè)繪檔案資料館目前館藏的國(guó)外地圖集的檔號(hào)和相關(guān)數(shù)據(jù)項(xiàng)信息,具體見(jiàn)表1。
表1 國(guó)家測(cè)繪檔案資料館所藏國(guó)外圖集的部分元數(shù)據(jù)Tab.1 The selected metadata from foreign atlas in National Surveying and Mapping Archive of China
在挑出了這些地圖集后再對(duì)項(xiàng)目相關(guān)區(qū)域的圖幅進(jìn)行仔細(xì)的判讀甄別,選取其中適合的圖幅。
以上這些方法說(shuō)明通過(guò)已有的歷史地圖資料的元數(shù)據(jù)信息來(lái)選取符合條件的地圖資料是比較高效的辦法。
但是通過(guò)這種方法選擇的地圖檔案資料還不能滿足專題的需求,如在時(shí)間跨度、出版國(guó)的廣度等方面都不能滿足項(xiàng)目的需求,資料的搜集范圍必須要進(jìn)行擴(kuò)展,因此需要進(jìn)行目標(biāo)收集。
目標(biāo)收集中又分為采購(gòu)和網(wǎng)絡(luò)獲取等兩種方式。采購(gòu),一般是從地圖資料供應(yīng)商處有目標(biāo)地購(gòu)買(mǎi)項(xiàng)目所需的特定資料,如某國(guó)在某個(gè)時(shí)期所出版的海域地形圖。采購(gòu)獲取的地圖資料一般在品質(zhì)方面比較有保證,但在元數(shù)據(jù)獲取方面,通過(guò)人工采集,需要錄入的信息比較多,既需要核實(shí)的元數(shù)據(jù)信息比較多。對(duì)于網(wǎng)絡(luò)獲取方式,一般是使用網(wǎng)絡(luò)爬蟲(chóng)軟件進(jìn)行數(shù)據(jù)抓取,需要針對(duì)不同的網(wǎng)址設(shè)置主題管理、下載時(shí)間、文件類型等限制條件,盡可能縮小篩選的范圍,通過(guò)關(guān)鍵字在相關(guān)網(wǎng)站上獲取,這種獲取方式獲得的地圖資料的相關(guān)性不一定能夠得到保證,但有些網(wǎng)站提供的地圖資料的質(zhì)量比較好,如世界數(shù)字圖書(shū)館,美國(guó)國(guó)會(huì)圖書(shū)館等。這些大型圖書(shū)館所提供的地圖資料,甚至還能提供一些元數(shù)據(jù)信息,但是如何將這些元數(shù)據(jù)信息順利地獲取到,也不是簡(jiǎn)單的事。有些地圖圖片元數(shù)據(jù)信息可以通過(guò)一些圖片解碼器將元數(shù)據(jù)信息讀取出來(lái),但又存在信息不全的問(wèn)題,需要逐一補(bǔ)充。有些圖書(shū)館還提供相關(guān)的軟件,來(lái)幫助用戶在下載地圖圖片的同時(shí),進(jìn)行元數(shù)據(jù)的封裝下載。但是通過(guò)這種方式獲取的元數(shù)據(jù)都需要通過(guò)特別編程來(lái)讀出其元數(shù)據(jù)信息,然后與設(shè)計(jì)好的特定的元數(shù)據(jù)項(xiàng)進(jìn)行匹配,其中的試驗(yàn)過(guò)程也許會(huì)反復(fù)多次。許多與項(xiàng)目相關(guān)的元數(shù)據(jù)信息需要逐一地核實(shí)錄入,工作效率不一定高。
無(wú)論哪種方式獲得的歷史地圖資料對(duì)項(xiàng)目的支持沒(méi)有區(qū)別,所以在歷史地圖元數(shù)據(jù)的設(shè)計(jì)方面需要考慮的原則是統(tǒng)一的,即需要核實(shí)的元數(shù)據(jù)信息比較多。對(duì)于網(wǎng)絡(luò)獲取方式,一般是使用網(wǎng)絡(luò)爬蟲(chóng)軟件進(jìn)行數(shù)據(jù)抓取,需要針對(duì)不同的網(wǎng)址設(shè)置主題管理、下載時(shí)間、文件類型等限制條件,盡可能縮小篩選的范圍,通過(guò)關(guān)鍵字在相關(guān)網(wǎng)站上獲取,這種獲取方式獲得的地圖資料的相關(guān)性不一定能夠得到保證,但有些網(wǎng)站提供的地圖資料的質(zhì)量比較好,比如:世界數(shù)字圖書(shū)館,美國(guó)國(guó)會(huì)圖書(shū)館等。這些大型圖書(shū)館所提供的地圖資料,甚至還能提供一些元數(shù)據(jù)信息,但是如何將這些元數(shù)據(jù)信息順利的獲取到,卻也不是簡(jiǎn)單的事。有些地圖圖片元數(shù)據(jù)信息可以通過(guò)一些圖片解碼器將元數(shù)據(jù)信息讀取出來(lái),但又存在信息不全的問(wèn)題,需要逐一補(bǔ)充。有些圖書(shū)館還提供相關(guān)的軟件,來(lái)幫助用戶在下載地圖圖片的同時(shí),進(jìn)行元數(shù)據(jù)的封裝下載。但是通過(guò)這種方式的獲取的元數(shù)據(jù)都需要通過(guò)特別編程來(lái)讀出其元數(shù)據(jù)信息,然后與設(shè)計(jì)好的特定的元數(shù)據(jù)項(xiàng)進(jìn)行匹配,其中的試驗(yàn)過(guò)程也許會(huì)反復(fù)多次。許多與項(xiàng)目相關(guān)的元數(shù)據(jù)信息需要逐一的核實(shí)錄入,工作效率不一定高。
目前的國(guó)內(nèi)外標(biāo)準(zhǔn)化組織制定的空間元數(shù)據(jù)標(biāo)準(zhǔn)和其他個(gè)人或組織制定的空間元數(shù)據(jù)標(biāo)準(zhǔn)的主要目標(biāo)是數(shù)據(jù)共享,而要達(dá)到共享的目的,就要求在設(shè)計(jì)時(shí),盡量滿足主要用戶的需求。在本項(xiàng)目設(shè)計(jì)立項(xiàng)時(shí),項(xiàng)目成果的用戶被確定主要為對(duì)東海、南海海域相關(guān)問(wèn)題感興趣的專家學(xué)者,需盡量全面地提供各類信息資源,以滿足用戶的需求。在本項(xiàng)目中除了地圖資料,還涉及了影像照片、文章、專著、視頻等類型的資料,并設(shè)計(jì)了相應(yīng)的元數(shù)據(jù)信息。專家們對(duì)歷史地圖資料所表示的內(nèi)容,以及歷史地圖資料所反映的時(shí)間、地圖資料的數(shù)學(xué)基礎(chǔ)、制作單位、地圖資料的語(yǔ)種、資料的受控程度等都應(yīng)該是比較關(guān)心的內(nèi)容,所以這些數(shù)據(jù)項(xiàng)的設(shè)定是必須的。
通過(guò)符合元數(shù)據(jù)標(biāo)準(zhǔn)而達(dá)到“空間元數(shù)據(jù)互操作”是效率最高、最易實(shí)施的互操作,因此遵循現(xiàn)有標(biāo)準(zhǔn)對(duì)于實(shí)現(xiàn)互操作至關(guān)重要。在本項(xiàng)目中對(duì)于能夠采用相關(guān)標(biāo)準(zhǔn)的數(shù)據(jù)項(xiàng)都應(yīng)用了相關(guān)的標(biāo)準(zhǔn),如地圖關(guān)注熱點(diǎn)區(qū)域坐標(biāo)信息的格式確定和提供單位坐標(biāo)的數(shù)據(jù)格式都是采用目前通用的地圖坐標(biāo)數(shù)據(jù)格式,有利于在天地圖等網(wǎng)絡(luò)地圖上進(jìn)行標(biāo)注或獲取相應(yīng)的坐標(biāo)點(diǎn)位信息。而對(duì)于時(shí)間數(shù)據(jù)項(xiàng),都要求統(tǒng)一到公元紀(jì)年。
檢索資源往往側(cè)重于適用性,而門(mén)戶應(yīng)用則多強(qiáng)調(diào)簡(jiǎn)單性。目前主要的國(guó)內(nèi)外標(biāo)準(zhǔn)化組織制定的空間元數(shù)據(jù)標(biāo)準(zhǔn)所包含的元數(shù)據(jù)項(xiàng)都非常詳細(xì),比較復(fù)雜。而本項(xiàng)目制定元數(shù)據(jù)既能達(dá)到門(mén)戶應(yīng)用的簡(jiǎn)單性,又能滿足檢索資源的適用性。如地圖資料對(duì)于項(xiàng)目主題相關(guān)性描述數(shù)據(jù)項(xiàng)和關(guān)鍵詞數(shù)據(jù)項(xiàng)的設(shè)置,就是為了方便利用關(guān)鍵詞,在本項(xiàng)目中關(guān)于中國(guó)南海、東海、釣魚(yú)島等關(guān)鍵詞的設(shè)置,就是為了讓用戶能夠快速了解地圖資料的相關(guān)信息,并快速檢索到相關(guān)區(qū)域的地圖資料。
元數(shù)據(jù)制定方案的通用性原則要求考察是否有更一般的概念能夠滿足描述要求,而專指性原則是指滿足特殊領(lǐng)域資源描述所提出的特殊要求。目前主要的國(guó)內(nèi)外標(biāo)準(zhǔn)化組織制定的空間元數(shù)據(jù)標(biāo)準(zhǔn)一般來(lái)講,滿足用戶一般的數(shù)據(jù)共享需求,通用性較明顯,而在本項(xiàng)目的設(shè)計(jì)中更多地考慮了項(xiàng)目專題對(duì)歷史地圖資料的滿足空間檢索和時(shí)間序列以及資料出版方和提供方等信息獲取的要求,所以專指性更為明顯。另外在歷史地圖命名方面也做了具體的要求,原來(lái)各單位管理的歷史地圖數(shù)據(jù),有的用檔號(hào)來(lái)命名,有的用圖名來(lái)命名,有的直接是用簡(jiǎn)單胡序列號(hào)來(lái)用名,為了便于管理,針對(duì)項(xiàng)目需求,制定了地圖文件的命名規(guī)則是國(guó)別+時(shí)間+圖名的方式。
對(duì)于本項(xiàng)目的資料收集,除了常規(guī)的利用館藏、有目的的購(gòu)買(mǎi)、交換等方式,通過(guò)互聯(lián)網(wǎng)在網(wǎng)上搜集也是一個(gè)比較大的搜集來(lái)源,必須確定相關(guān)資料所在的位置和它所能表述的信息,反映的立場(chǎng)。所以不能沿用傳統(tǒng)的資料檔案目錄管理的模式來(lái)進(jìn)行元數(shù)據(jù)項(xiàng)和數(shù)據(jù)內(nèi)容的設(shè)計(jì),要更多地考慮描述信息,通過(guò)元數(shù)據(jù)更多地反映歷史地圖資料的內(nèi)容特質(zhì)。另外還要考慮歷史地圖資料知識(shí)產(chǎn)權(quán)的有關(guān)問(wèn)題,應(yīng)該反映出資料所屬個(gè)人和機(jī)構(gòu)的名稱。由于資料表達(dá)立場(chǎng)的敏感性問(wèn)題,還要考慮資料的受控度問(wèn)題,在參考了世界數(shù)字圖書(shū)館數(shù)字藏品描述元數(shù)據(jù)技術(shù)標(biāo)準(zhǔn)(http://project.wdl.org/standards/metadata.html,WDL Descriptive Metadata Element Set)、文書(shū)類電子文件元數(shù)據(jù)方案DA/T 46—2009中華人民共和國(guó)檔案行業(yè)標(biāo)準(zhǔn)、測(cè)繪地理信息成果目錄服務(wù)系統(tǒng)元數(shù)據(jù)規(guī)定、美國(guó)國(guó)會(huì)圖書(shū)館網(wǎng)站(http://www.loc.gov)、美國(guó)威斯康星大學(xué)圖書(shū)館網(wǎng)站(http://www.library.wisc.edu,University of Wisconsin Digital Collections)等一些元數(shù)據(jù)的設(shè)計(jì)模型之后,確定了項(xiàng)目的歷史地圖(含地圖集)資料元數(shù)據(jù)的數(shù)據(jù)項(xiàng),具體見(jiàn)表2。
為更好地錄入和管理歷史地圖數(shù)據(jù)的元數(shù)據(jù),開(kāi)發(fā)了歷史地圖數(shù)據(jù)元數(shù)據(jù)的錄入系統(tǒng),其界面如圖1所示,可以進(jìn)行數(shù)據(jù)批量導(dǎo)入,逐個(gè)檢查核實(shí)修改,以保證數(shù)據(jù)的質(zhì)量。對(duì)于必填項(xiàng)都有特殊的提示標(biāo)識(shí),數(shù)據(jù)的圖形也有縮略圖,可直接檢查歷史地圖數(shù)據(jù)胡圖面情況是否正常。
圖1 歷史地圖元數(shù)據(jù)錄入界面圖Fig.1 The historic map metadata entry interface
表2 項(xiàng)目歷史地圖元數(shù)據(jù)表Tab.2 The project historic map metadata
專項(xiàng)歷史地圖數(shù)據(jù)庫(kù)的元數(shù)據(jù)不同于一般數(shù)據(jù)庫(kù)的元數(shù)據(jù),因?yàn)槠鋽?shù)據(jù)源元數(shù)據(jù)的情況相對(duì)復(fù)雜。為了更好地提高歷史地圖資料的使用效率,設(shè)計(jì)歷史地圖描述信息數(shù)據(jù)項(xiàng)可以讓資料的使用者快速了解地圖的背景信息,不需要其從分散的數(shù)據(jù)項(xiàng)信息中提取和綜合。為了歷史地圖資料查詢和使用方便,設(shè)計(jì)了歷史地圖空間定位的元數(shù)據(jù)項(xiàng),這樣大大提高了歷史地圖的使用效率,并將拓寬歷史地圖資料應(yīng)用領(lǐng)域。