陳愛明,樊旭東,趙逸君
(湖北省地質(zhì)調(diào)查院,湖北武漢 430034)
PDF格式地形地質(zhì)圖到MAPGIS格式轉(zhuǎn)換方法探討
陳愛明,樊旭東,趙逸君
(湖北省地質(zhì)調(diào)查院,湖北武漢 430034)
通過討論P(yáng)DF文件特性,提出了PDF格式地形地質(zhì)圖到MAPGIS格式轉(zhuǎn)換途徑,介紹了三種不同PDF矢量圖形轉(zhuǎn)換軟件,簡(jiǎn)述了其選項(xiàng)設(shè)置及轉(zhuǎn)換流程。通過對(duì)兩個(gè)不同形式的PDF格式地形地質(zhì)圖進(jìn)行轉(zhuǎn)換實(shí)踐,對(duì)比研究了轉(zhuǎn)換的實(shí)際效果。筆者認(rèn)為,先將PDF矢量圖形轉(zhuǎn)換為DXF格式,再將DXF導(dǎo)入到MAPGIS軟件中進(jìn)行必要的編輯處理,是比較可行的PDF文件利用方案,對(duì)實(shí)際工作具有一定的現(xiàn)實(shí)意義。
地質(zhì)圖;PDF;MAPGIS;格式;轉(zhuǎn)換
隨著PDF格式在地質(zhì)行業(yè)歸檔中的不斷應(yīng)用推廣,地質(zhì)專業(yè)技術(shù)人員使用的地質(zhì)圖件電子數(shù)據(jù)將越來越多地碰到PDF格式。如何有效地利用這些PDF圖件電子數(shù)據(jù),使之轉(zhuǎn)換成我們習(xí)慣的MAPGIS格式進(jìn)行編輯處理,而不需要耗費(fèi)大量時(shí)間和金錢重新矢量化,將是我們面臨的技術(shù)難題。從文獻(xiàn)檢索的情況來看,大多討論的是如何將現(xiàn)有文檔轉(zhuǎn)換為PDF格式,從PDF格式轉(zhuǎn)換為可編輯處理的矢量圖件則鮮有文獻(xiàn)涉及。由于工作需要,要求將收集到的PDF文檔中等高線、水系、地層界線、斷層、文字等轉(zhuǎn)換為MAPGIS矢量數(shù)據(jù)作為編圖底圖。筆者對(duì)PDF格式地形地質(zhì)圖到MAPGIS格式轉(zhuǎn)換方法進(jìn)行一些探討,算是拋磚引玉。
PDF作為一種開放的電子文件格式,具有跨平臺(tái)、高壓縮、描述的真實(shí)性和完整性、安全性、開放性、多語種性、通用性、易轉(zhuǎn)換性、前瞻性、兼容性、適合屏幕閱覽及網(wǎng)絡(luò)傳輸、電子批閱、打印輸出質(zhì)量高等優(yōu)點(diǎn)[1-2]。PDF文件支持 Type1,Truetype,Opentype等多種字體,支持表單技術(shù)和遞增更新,支持Javascript可編程腳本及多種事件類型和控制、多種標(biāo)注,尤為重要的是可以內(nèi)嵌光柵圖像、聲音、視頻、動(dòng)畫、3D對(duì)象等多媒體對(duì)象,矢量圖形采用基于Postscript描述型語言的二維矢量透明模型,支持圖層劃分等[3]。使用ADOBE公司出品的acrobat軟件還能對(duì)PDF文檔中的相關(guān)內(nèi)容進(jìn)行編輯處理,Illustrator還能打開PDF的矢量圖進(jìn)行編輯處理。但是,如果轉(zhuǎn)換為PDF前這些內(nèi)容已經(jīng)是柵格格式,那么我們是無法在以上軟件里進(jìn)行編輯處理的。
從這些特性看來,PDF格式文檔尤其是該格式的地形地質(zhì)圖中包含中大量可編輯的矢量信息,這是轉(zhuǎn)換處理的基礎(chǔ)。MAPGIS數(shù)據(jù)輸入接口包括MAPGIS的明碼格式數(shù)據(jù)接口、DXF格式接口、DLG接口、STDF格式、瑞得全站儀格式、MAPINFO格式接口及ARC/INFO接口,不能直接接受PDF格式的文件轉(zhuǎn)換,需要找到一個(gè)中間格式。AutoCAD的DXF格式被很多軟件廣為使用,DXF格式輸入接口可以將其轉(zhuǎn)換為MAPGIS的標(biāo)準(zhǔn)數(shù)據(jù)格式,達(dá)到數(shù)據(jù)共享的目的。因此我們只需要將PDF格式轉(zhuǎn)換為DXF格式即可實(shí)現(xiàn)PDF到MAPGIS格式轉(zhuǎn)換的目的。
DXF是Autodesk開發(fā)的圖形交換格式,以方便AutoCAD不同版本間及其它CAD/CAM/CNC系統(tǒng)之間的CAD圖形交換。由于它是最先推出的圖形交換格式,逐漸成為了行業(yè)的通用標(biāo)準(zhǔn),大多數(shù)GIS軟件程序都能讀取DXF文件。有許多DXF格式轉(zhuǎn)換研究的相關(guān)文獻(xiàn),在網(wǎng)絡(luò)上也可找到一些轉(zhuǎn)換軟件,利用它們可以實(shí)現(xiàn)PDF格式到DXF格式的轉(zhuǎn)換,但由于地形地質(zhì)圖的特殊性,哪一種軟件才更適合于這種圖件的轉(zhuǎn)換?轉(zhuǎn)換中及轉(zhuǎn)換后存在哪些問題?還需要做哪些工作?筆者選擇了較為流行的三款軟件,對(duì)現(xiàn)有PDF格式的某國外地形地質(zhì)圖及某礦區(qū)規(guī)劃圖進(jìn)行轉(zhuǎn)換研究,下面分別介紹。
Adobe Illustrator作為全球最著名的矢量圖形軟件,以其強(qiáng)大的功能和體貼用戶的界面,已經(jīng)占據(jù)了全球矢量編輯軟件中的大部分份額。據(jù)不完全統(tǒng)計(jì)全球有37%的設(shè)計(jì)師在使用Adobe Illustrator進(jìn)行藝術(shù)設(shè)計(jì)[4]。尤其基于Adobe公司專利的PostScript技術(shù)的運(yùn)用,其強(qiáng)大的功能和簡(jiǎn)潔的界面設(shè)計(jì)風(fēng)格都是其他同類軟件所無法比擬的,目前 Adobe Illustrator己發(fā)展到了CS6版本。由于其與PDF格式均為同一公司產(chǎn)品,因而在進(jìn)行矢量轉(zhuǎn)換時(shí)會(huì)首先想到它。
Illustrator矢量圖形軟件提供繪制各種圖形所需的工具,可以使我們獲得專業(yè)性的圖形質(zhì)量效果,它的優(yōu)勢(shì)在于處理矢量圖形方面,能夠非常精確地控制矢量圖形的位置、大小,是工業(yè)界標(biāo)準(zhǔn)的繪圖軟件。具有豐富的圖表類型和強(qiáng)大的圖表功能,增強(qiáng)的畫筆效果,增強(qiáng)的混合工具,通過鏈接調(diào)板,可以識(shí)別、選擇、監(jiān)視和更新Illustrator畫板中的鏈接到外部文件的圖像以及識(shí)別被嵌入到Illustrator文件的圖像。動(dòng)作調(diào)板可以使任務(wù)自動(dòng)化,類型取樣功能,智能參考線等幾大特點(diǎn)。
Illustrator打開需要轉(zhuǎn)換的軟件后,在“文件”菜單中選擇“導(dǎo)出”,在保存類型中選擇AutoCAD交換文件,設(shè)定相應(yīng)的保存位置和文件名稱,點(diǎn)擊“保存”,在彈出的選項(xiàng)頁面中設(shè)置AutoCAD版本,圖稿縮放比例,使用的顏色數(shù)目,柵格文件格式,以及是否保留最大可編輯性等,按“確定”即開始轉(zhuǎn)換。
pdf2cad是由荷蘭的一家名為Visual Integrity公司開發(fā)的一款專門用于轉(zhuǎn)換PDF文件到DXF格式的工具,轉(zhuǎn)換后的DXF可以用于常規(guī)的CAD工具中,比如AutoCAD 和Microstation。
pdf2cad界面簡(jiǎn)單,功能單一,采用向?qū)讲僮?,每次只能轉(zhuǎn)換一個(gè)PDF文檔。軟件安裝后運(yùn)行,只需添加要轉(zhuǎn)換的PDF文檔即可。轉(zhuǎn)換前可以選擇是否將文本轉(zhuǎn)換為字符串或是曲線;是否忽略內(nèi)嵌的光柵圖像以減小文件大小;是否忽略文字而只輸出矢量圖形;是否仿真PDF進(jìn)行圖形疊加裁剪;是否忽略路徑以在輸出結(jié)果中刪除矢量圖形。用戶還可選擇輸出結(jié)果的旋轉(zhuǎn)角度;輸出頁邊的寬度;也可定義只輸出指定的矩形框內(nèi)的圖形。也可以選擇字庫映射表;定義輸出的頁面大小;設(shè)置DXF文件的最小線寬;設(shè)定填充對(duì)象的處理方法(保留,刪除,輪廓線);是否打斷虛線和點(diǎn)線線型。設(shè)置完成后,點(diǎn)擊“next”,確定輸出文件的位置與名稱,點(diǎn)擊“convert”即開始轉(zhuǎn)換為 DXF格式文件。
PDF2DXF是由德國CAD-KAS Kassler計(jì)算機(jī)軟件公司開發(fā)的一款用于轉(zhuǎn)換PDF文件到DXF格式的工具。該軟件公司自1996年以來,向市場(chǎng)上推出了多款共享軟件。PDF2DXF軟件推出后相繼被多家國外網(wǎng)站評(píng)為“編輯選擇獎(jiǎng)”,“五星”級(jí)軟件。
PDF2DXF界面相對(duì)復(fù)雜,有多種語言界面可以選擇,但簡(jiǎn)體中文界面翻譯不完全,漢字顯示也不全,繁體中文界面稍強(qiáng)但也有許多菜單沒有翻譯。軟件功能更加強(qiáng)大,能夠?qū)DF文檔進(jìn)行各種常見的編輯、選擇、查找、移動(dòng)、鏡像、變形、旋轉(zhuǎn)、操作、色彩等等。也提供了更多的用戶定義選項(xiàng),能夠根據(jù)PDF文檔的實(shí)際情況最大化地定義適合自己需要的文檔。打開PDF文檔后即彈出顯示與輸出窗口,能夠顯示文檔內(nèi)容,可以設(shè)定輸出頁面,設(shè)置字體,文本轉(zhuǎn)換為對(duì)象或矢量,使用毫米或英寸單位,是否生成弧段。其3.0版還可以檢測(cè)圖像中的線條并自動(dòng)識(shí)別為矢量圖形,但識(shí)別效果與原柵格圖像的內(nèi)容有關(guān)。設(shè)置完成后點(diǎn)擊“DXF Export”,選擇輸出路徑及文件名,點(diǎn)擊保存即可完成轉(zhuǎn)換。
現(xiàn)有PDF格式的某國外地形地質(zhì)圖(以下稱樣本一)及某礦區(qū)規(guī)劃圖(以下稱樣本二),進(jìn)行轉(zhuǎn)換對(duì)比研究,下面分別介紹。
樣本一是典型的地形地質(zhì)圖,文件大小約12.68 Mb,頁面大小為110.4 cm ×67.1 cm,包含有地形等高線、高程點(diǎn)、水系等基本地理要素,地質(zhì)界線、斷層、產(chǎn)狀、地質(zhì)代號(hào)、巖性花紋等地質(zhì)要素,還包含有圖框、圖例說明、角圖、地質(zhì)年代表、比例尺、方位角等整飾要素(圖1)。
樣本二文件大小約 2.31 Mb,頁面大小為27.7 cm ×41.3 cm,居民地、等高線、高程點(diǎn)、公路、水系等基本地理要素較齊全,其它規(guī)劃要素則相對(duì)簡(jiǎn)單,另外包含責(zé)任簽、規(guī)劃表、圖框等整飾要素,且整體圖形順時(shí)鐘旋轉(zhuǎn)了90°(圖2)。
圖1 某國外地形地質(zhì)圖(樣本一),左為PDF,右為DXFFig.1 Foreign terrain and geologic map
圖2 某礦區(qū)規(guī)劃圖(樣本二),左為PDF,右為DXFFig.2 Plan map of a mining area
使用前述的三種軟件分別對(duì)兩個(gè)樣本進(jìn)行了DXF文件格式轉(zhuǎn)換,轉(zhuǎn)換時(shí)間均少于2 min,速度較快,轉(zhuǎn)換前后圖面顯示變化較小(圖1,圖2),對(duì)于輸出、顯示等均無多大影響,但部分文字在DXF中為多段線,難以編輯修改。轉(zhuǎn)換后的DXF文件特性列表如表1。
從轉(zhuǎn)換結(jié)果來看,等高線、水系、地層界線、斷層、文字等基本都能夠轉(zhuǎn)換出來,總體轉(zhuǎn)換效果令人滿意。但轉(zhuǎn)換結(jié)果受原始文檔的影響較大,特別是PDF中嵌入的光柵圖像,無法轉(zhuǎn)換為矢量。為了驗(yàn)證轉(zhuǎn)換后矢量線坐標(biāo)的準(zhǔn)確性,我們選擇了樣本一中某條封閉等高線,對(duì)三種軟件轉(zhuǎn)換的DXF分別查看坐標(biāo)點(diǎn)數(shù),均為853個(gè)點(diǎn),說明轉(zhuǎn)換結(jié)果均未丟失坐標(biāo)信息。
綜合分析DXF轉(zhuǎn)換結(jié)果,筆者認(rèn)為使用pdf2cad軟件進(jìn)行轉(zhuǎn)換是理想的選擇,不僅轉(zhuǎn)換結(jié)果數(shù)據(jù)量小,且能夠保證文字的字符串特性,最大限度地保證后期的可編輯修改性。當(dāng)然,轉(zhuǎn)換結(jié)果中包含了其它不需要的內(nèi)容,需要在后面的編輯處理中刪除。
表1 轉(zhuǎn)換后DXF文件特征Table 1 Characteristics of DXF file after conversion
DXF文件到MAPGIS格式的轉(zhuǎn)換比較簡(jiǎn)單,在文件轉(zhuǎn)換系統(tǒng)中進(jìn)行。步驟為“輸入”—“裝入DXF”—選擇需轉(zhuǎn)換的DXF文件—選擇不轉(zhuǎn)出的圖層—復(fù)位窗口即可看到轉(zhuǎn)換后的結(jié)果文件—另存文件,用MAPGIS文件格式保存—在編輯子系統(tǒng)打開轉(zhuǎn)換后的文件可看到是否轉(zhuǎn)換滿意。如果確定了子圖的對(duì)應(yīng),在轉(zhuǎn)換DXF文件前不要對(duì)原圖的塊作爆破處理;轉(zhuǎn)換前對(duì)原圖中的樣條曲線,要作爆破或轉(zhuǎn)換為多段線處理;對(duì)含有圓弧的多段線,也應(yīng)作爆破處理,否則轉(zhuǎn)換后會(huì)與原始數(shù)據(jù)結(jié)果有偏差。DXF中的塊、形、圖層、顏色,也可與MAPGIS的子圖、線型、圖層、顏色對(duì)應(yīng)。由于此方面的文章較多,在此不再贅述。
需要強(qiáng)調(diào)的是,由于轉(zhuǎn)換后頁面大小與原始文檔有差異,我們最終需要在MAPGIS中生成標(biāo)準(zhǔn)圖框,利用原文檔中的圖框進(jìn)行比例縮放并校正,才能保證最終成圖的精度。
通過三種不同軟件的轉(zhuǎn)換效果對(duì)比實(shí)踐,以DXF格式為橋梁,將PDF格式地形地質(zhì)圖轉(zhuǎn)換為MAPGIS格式,用于地質(zhì)技術(shù)人員日常編圖工作中,能夠大大節(jié)約矢量化等高線的時(shí)間,是一種行之有效的方法。需要說明的是,這種轉(zhuǎn)換并不完全可行,尤其是當(dāng)PDF文件內(nèi)嵌的等高線內(nèi)容為柵格圖像時(shí)。目前有一些光柵矢量化軟件,可以直接將圖片轉(zhuǎn)換成DXF,但轉(zhuǎn)換質(zhì)量取決于原圖質(zhì)量和計(jì)算機(jī)能力,但轉(zhuǎn)換效果一般都不是很好。隨著科學(xué)技術(shù)的發(fā)展,相信有朝一日,人們能夠象如今文字掃描識(shí)別一樣,能夠自動(dòng)識(shí)別掃描地形地質(zhì)圖。
[1] 田學(xué)軍.PDF文件格式及其轉(zhuǎn)化方法探討[J].荊門職業(yè)技術(shù)學(xué)院學(xué)報(bào),2005,20(3):30 -32.
[2] 田海月.PDF文件格式研究[J].中國高新技術(shù)企業(yè),2009(6):27-28.
[3] 熊雨前,徐紅輪.PDF技術(shù)及應(yīng)用[J].數(shù)字與縮微影像,2011(1):37-40.
[4] 王小敏.如何使用Illustrator軟件中的鋼筆工具[J].電腦知識(shí)與技術(shù),2012,8(7):1557 -1559.
(責(zé)任編輯:陳文寶)
Discussion on Transformation PDF Format of Terrain and Geological Map into MAPGIS Format
CHEN Aiming,F(xiàn)AN Xudong,ZHAO Yijun
(Hubei Geological Survey,Wuhan,Hubei430034)
By discussing the PDF file properties,the authors propose transformation approach from PDF format to MAPGIS format,introduce three different PDF conversion software of vector graphics,briefly outline option setting and conversion process.The authors believe transformation of PDF vector graphs into DXF format,and then introduction DXF into MAPGIS are feasible utilization plan of PDF file.It is of certain significance to actual work.
geological map;PDF;MAPGIS;format;conversion
P285.1;P208
B
1671-1211(2013)06-0821-04
2012-10-16;改回日期:2012-11-23
陳愛明 (1971-),男,高級(jí)工程師,碩士,地質(zhì)學(xué)專業(yè),從事信息化與遙感地質(zhì)工作。E-mail:mailcam@163.com