付永華 白占俊 張旭陽
摘? 要:將工程電子文件有序有據(jù)處理是工程電子文件閱讀設(shè)備提供有效閱讀的基礎(chǔ)。論文通過現(xiàn)場調(diào)查,充分考慮野外施工現(xiàn)場的工程電子文件的來源、格式與內(nèi)容,針對工程電子文件多源異構(gòu)的特點,了解國內(nèi)外主流技術(shù),結(jié)合惡劣施工環(huán)境的實際情況,設(shè)計并實現(xiàn)一種新的工程電子文件獲取模式和處理技術(shù),獲取模式包括批量導(dǎo)入按需讀取、臨時協(xié)作按需共享和實時更新按需收集3種模式,處理技術(shù)包括識別技術(shù)、兼容技術(shù)、轉(zhuǎn)換技術(shù),從而有效加強(qiáng)工程電子文件的實用性。
關(guān)鍵詞:工程電子文件;多源異構(gòu);獲取模式;處理技術(shù)
Abstract: The orderly handling of engineering electronic documents is the basis for effective reading of engineering electronic document reading devices. The source, format and content of the field construction project of electronic documents is fully considered through field investigation. A new acquisition mode and processing technology of engineering electronic document is designed and implemented according to the characteristics of engineering electronic documents of multi-source heterogeneous, knowledge of domestic and international mainstream technology together with the actual situation of poor construction environment. The acquisition mode includes? batch acquisition mode introduction according to need read, temporary collaboration on-demand storage and real-time updates of on-demand while processing technology contains identification technology, compatible technology and conversion technology, which can effectively strengthen the practical usage of engineering electronic documents.
Keywords: Engineering Electronic Document; Multi-source Heterogeneous; Acquisition Mode; Processing Technology
工程電子文件閱讀設(shè)備主要面向惡劣的野外施工環(huán)境,比如野外勘探、鐵路公路構(gòu)建、災(zāi)害救援等,其直接解決的問題是惡劣環(huán)境下的閱讀問題。但是,工程電子文件閱讀設(shè)備的內(nèi)容質(zhì)量,也就是各種工程電子文件的質(zhì)量,也直接影響著閱讀的效果,而且,工程電子文件的來源比較多[1],內(nèi)容和格式也存在很多差異,因此,如何有效地獲取這些多源異構(gòu)的工程電子文件,并有序有據(jù)地對其進(jìn)行處理加工,使之適合野外施工環(huán)境需要,容易閱讀,成為提高閱讀質(zhì)量的關(guān)鍵。
在工程電子文件閱讀設(shè)備樣機(jī)設(shè)計并實現(xiàn)后,通過對中建二局第二建筑工程有限公司負(fù)責(zé)的惠濟(jì)萬達(dá)廣場項目、鄭州市農(nóng)業(yè)路快速通道工程京廣高架互通項目實證調(diào)研,分析研究面向工程電子文件閱讀設(shè)備的工程電子文件的現(xiàn)狀與特點。
1.1工程電子文件多源成因。(1)過程天然多源:經(jīng)了解,工程電子文件的來源存在多個單位,比如,一般的項目工程包括建設(shè)、勘察、設(shè)計、施工、監(jiān)理、檢測、檢驗等流程,在這些不同的流程中,必然存在著多家單位的工作,導(dǎo)致工程電子文件天然產(chǎn)生著多個源頭。
(2)同節(jié)協(xié)作多源:即使同一個工作環(huán)節(jié),或者同一個工作單位,也會有多源的現(xiàn)象,比如施工現(xiàn)場,因為某項需求,有幾個協(xié)作部門,對工程資料如施工圖紙等,進(jìn)行現(xiàn)場調(diào)研、臨時變更,導(dǎo)致工程文件實時產(chǎn)生,難以預(yù)測。
(3)同文修改多源:在同一份文件上,也有可能是先由設(shè)計人員完成,然后其他人員因為需要直接在工程資料上進(jìn)行修改,甚至更多的是同樣的設(shè)計人員自己不斷地修改,導(dǎo)致同文修改多源。
1.2工程電子文件異構(gòu)成因與構(gòu)成。導(dǎo)致工程電子文件異構(gòu)的原因主要是文件的多源,不同的階段采用的工程電子文件描述工具不同;同樣的任務(wù),不同的單位又可能采用不同的軟件;工程電子文件本身的描述需要,比如有的地方需要文字描述,有的可能是圖片,也導(dǎo)致工程電子文件的異構(gòu);工程電子文件描述技術(shù)的飛速發(fā)展,為工程電子文件的描述提供了便利,但是也導(dǎo)致了新的描述格式的出現(xiàn),比如虛擬技術(shù)、3D技術(shù)等。
經(jīng)調(diào)研,工程電子文件的構(gòu)成主要包括各類設(shè)計圖紙、施工圖紙,各種文件規(guī)定、施工記錄、驗收記錄和報告等,各種原材料、成品、半成品、構(gòu)配件、設(shè)備的描述性文件等,施工過程中的各種描述等。具體構(gòu)成的格式、來源等信息如表1所示,其中,獲取難度和處理難度采用五分法描述,獲取難度的1代表可以直接獲取,5代表基本不能獲取,或經(jīng)較為復(fù)雜的技術(shù)方式才能獲取;處理難度的1代表不需要處理,可以直接使用,5代表需要經(jīng)過論文設(shè)計的所有處理技術(shù)才能處理完成。
2.1 研究現(xiàn)狀。關(guān)于電子文件格式,向來不是學(xué)者們研究的重點,一般側(cè)重的是存儲或歸檔方式。比如劉家真教授在2000年根據(jù)澳大利亞電子文件管理策略,研究了電子文件的保存、鑒定與存取問題[2]。李澤鋒教授則較為全面地研究電子文件整個生命周期的變化,并在2004年,就較早地關(guān)注了檔案數(shù)字化的電子格式問題,他認(rèn)為XML、RTF、TXT等并不完全適用于檔案的數(shù)據(jù)格式,他討論了文件保存格式的選擇原則,并在對比幾種電子格式的基礎(chǔ)上,提出CEB是一種比較適合數(shù)字化檔案的保存、整理、利用與遷移的格式[3]。
各位學(xué)者也意識到了,不同的存儲格式對電子檔案使用的影響,也在考慮如何進(jìn)行融匯和兼容,1998年,劉詩德和郭黎探討了電子出版系統(tǒng)的文件交流,并從質(zhì)量、靈敏性、效率和支持性等方面,考慮了出版系統(tǒng)不同格式之間的轉(zhuǎn)換和兼容問題,最后給出了一種支持2種格式轉(zhuǎn)換的平臺的設(shè)計思路[4]。此方面的研究,一直延續(xù)到今天,2017年,梁凱研究了檔案部門應(yīng)用OFD格式的問題,分析了OFD格式的優(yōu)勢與存在的“短板”,同時也簡單講述了OFD格式與PDF格式的競爭[5]。
關(guān)于工程電子檔案或工程電子文件的研究,幾近千篇,但縱觀這些研究,主要還是數(shù)字化的技術(shù)、數(shù)字化的過程方面,或者是以某實際工程為例的數(shù)字化,也有少部分的研究考慮了安全問題和如何更好地使用,比如有的研究設(shè)計了在線瀏覽的模式等,但是基本沒有考慮多種格式存在的主要原因和一定時間內(nèi)無法改變這種現(xiàn)狀的事實。
2.2 應(yīng)用現(xiàn)狀。在國外,美國電子文件檔案館項目系統(tǒng)工程主管Dyung Le就將工作重點放到多種格式文件的存儲和利用上,使其盡量不受電子文件產(chǎn)生的軟件或硬件的影響。李澤鋒教授也提出了一種注冊庫技術(shù),他在理解文件格式與分析格式管理原因的基礎(chǔ)上,對格式管理的功能進(jìn)行分析,認(rèn)為應(yīng)該構(gòu)建格式注冊庫,存儲格式的表示信息,進(jìn)一步分析格式注冊庫的構(gòu)成,從而便于識別和兼容不同的格式[6]。
在具體應(yīng)用上,很多公司過去采用獨立技術(shù),一方面為了保密,另外也為了彰顯個性獨立,但在兼容和共享的發(fā)展方向上,也在慢慢地改變,比如2006年,日本Sony Corporation的數(shù)據(jù)壓縮技術(shù)就與競爭對手的格式兼容,包括Apple Inc.的AAC技術(shù)。
在數(shù)字存檔方面,也有很多技術(shù)在推進(jìn),比如2010年提出的XAM(eXtensible Access Method,可擴(kuò)展訪問方法),這一標(biāo)準(zhǔn)將原始數(shù)據(jù)和應(yīng)用分開,從而實現(xiàn)應(yīng)用時按需的操作。雖然此方面的研究在2012年便不再繼續(xù),但也是一種嘗試。也有的技術(shù)考慮到數(shù)字化制作者本身的實際情況,研究有限兼容支持的自治信息保存格式,在一種允許的框架范圍內(nèi),自由地進(jìn)行檔案數(shù)字化,不用考慮將來使用者的情況。CDMI(Cloud Data Management Interface,云數(shù)據(jù)管理接口)標(biāo)準(zhǔn)是近些年流行的新技術(shù),提供了訪問云存儲和管理云存儲數(shù)據(jù)的方式,能夠讓大多數(shù)舊的非云存儲產(chǎn)品訪問方式演進(jìn)成云存儲訪問。
在政策和行業(yè)規(guī)定方面,2016年10月14日,“電子文件存儲與交換格式版式文檔”標(biāo)準(zhǔn)發(fā)布,這是我國自主研發(fā)的版式格式標(biāo)準(zhǔn),是國家電子文件標(biāo)準(zhǔn)體系的重要組成部分,該標(biāo)準(zhǔn)規(guī)定國家版式文檔格式規(guī)范,簡稱OFD(Open Fixed-Layout Document),在多個行業(yè)進(jìn)行驗證,獲得市場和用戶的廣泛認(rèn)可[7]。
縱觀上述研究現(xiàn)狀、應(yīng)用現(xiàn)狀或技術(shù)現(xiàn)狀,首先,工程電子文件的復(fù)雜程度得到了認(rèn)可,但在數(shù)字化過程中,并沒有考慮工程電子文件的來源和構(gòu)成,只是按照普通的數(shù)字化方法去管理,最多考慮了工程圖紙的大幅面、改動多的特點。其次,認(rèn)識到了數(shù)字存儲格式對閱讀效果的影響,已經(jīng)采用規(guī)范和技術(shù),去盡量地消除格式的不統(tǒng)一帶來的影響,有的從源頭考慮,有的從使用端考慮,但基本沒有意識到,這些規(guī)范或技術(shù),在惡劣的施工環(huán)境下,能否適用,這個施工環(huán)境還包括硬件和操作者,同時,也沒有考慮這種改變,是否對操作者產(chǎn)生了新的影響,增加了原有操作的工作量和復(fù)雜度。
3.1 符合工程的實際需要。(1)充分考慮施工環(huán)境。工程電子文件和其他的電子文件不同,工程施工現(xiàn)場,有可能盛夏酷暑、烈日炎炎,也可能寒風(fēng)凜冽、冰天雪地,也可能風(fēng)雨交加,也可能塵土飛揚,這不管對電子檔案還是紙質(zhì)檔案,都存在著很大的使用壓力;有的工程現(xiàn)場可能存在著電磁干擾等,這些對工程電子文件的獲取和使用都產(chǎn)生了很大的影響[1]。
(2)充分考慮電子文件的實時性和綜合性。在施工過程中,一直需要工程資料的支持,也很有可能因某項新需求,對工程資料如施工圖紙等,進(jìn)行現(xiàn)場調(diào)研、臨時變更,工程電子文件實時產(chǎn)生,難以預(yù)測。而且,有時候需要將整個工程施工前后相關(guān)的所有資料綜合在一起,進(jìn)行比對,工程電子文件需求量比較大。
3.2 符合電子文件的固有規(guī)律與未來發(fā)展。(1)在保證使用的情況下,盡量少變化:工程電子文件閱讀設(shè)備固然要以施工的實際需要為工作核心,但是,在能夠保證文件的讀取速度、清晰度、閱讀效果和使用效果的情況下,盡量不做變動,少做變動,尤其盡量做到只改變工程電子文件的存儲格式,而文件的邏輯結(jié)構(gòu)、內(nèi)容關(guān)系保持不變。
(2)便于移植:一般工程都包括建設(shè)、勘察、設(shè)計、施工、監(jiān)理、檢測、檢驗等幾個流程,雖然工程電子文件閱讀設(shè)備主要應(yīng)用于施工階段,但其內(nèi)容在施工階段也需要不斷地修改和共享,因此,不管是在不同的單位之間流動,還是在同單位的不同部門,抑或是同一個工作點的幾個終端之間,都要充分考慮其移植性。
(3)便于瀏覽器處理:目前,大多數(shù)工程檔案管理系統(tǒng),都支持局域網(wǎng)結(jié)構(gòu),但是因為內(nèi)容原因,支持B/S結(jié)構(gòu)的工程檔案管理系統(tǒng)還不多,即使有,對在線瀏覽的內(nèi)容和格式也有很大的限制,更多的是對內(nèi)容的文本提取。但隨著硬件和網(wǎng)絡(luò)技術(shù)的發(fā)展,較為復(fù)雜的工程電子文件支持瀏覽器閱讀必將是一種趨勢,因此,有必要從現(xiàn)在就考慮對瀏覽器的支持。
(4)便于讀取和識別:通過封裝技術(shù)或其他方法,將工程電子文件處理,雖然有利于保密和保證文件的一致性,但卻妨礙了工程電子文件的再處理,而這種再處理,在施工階段是經(jīng)常的,因此,工程電子文件格式應(yīng)該支持?jǐn)?shù)據(jù)較為容易地被讀取和識別。
3.3 加強(qiáng)協(xié)作間的基礎(chǔ)溝通。工程電子文件是很多個環(huán)節(jié)、很多個單位和很多部門與人員的共同產(chǎn)物,也就是文章第一節(jié)里提到的多源,不管是出于工作習(xí)慣也好,還是保密也好,都應(yīng)該在項目開始之前,盡量地規(guī)范在同一個工程中的電子文件的格式,探討不同軟件之間的兼容,在保證完成工作的基礎(chǔ)之上,選擇兼容性較強(qiáng)的電子文件格式;對相同的軟件平臺,也通過升級或其他方式,確保版本一致或盡量接近。
4.1 工程電子文件獲取模式。根據(jù)工程施工的實際需要,在工程電子文件的獲取方面,設(shè)計了三種獲取模式:批量導(dǎo)入按需讀取、臨時協(xié)作按需共享和實時更新按需收集,如圖1所示。
(1)批量導(dǎo)入,按需讀?。哼@種模式主要針對來源于外單位的工程電子文件,比如工程單位的要求、設(shè)計單位的圖紙,也包括各種原材料、成品、半成品、構(gòu)配件、設(shè)備的描述性文件等,在具體的某個施工點,不需要上述的全部材料,只需要直接相關(guān)的即可,因此,采用存儲在項目的總服務(wù)的形式,獲取時,一方面,可以預(yù)先導(dǎo)入到工程現(xiàn)場的服務(wù)器或者主機(jī)上,根據(jù)需要,采用無線技術(shù)讀取,也可以根據(jù)實際需要,向工程現(xiàn)場服務(wù)器(主機(jī))提出請求,然后由工程現(xiàn)場服務(wù)器(主機(jī))向項目總服務(wù)器轉(zhuǎn)交請求。在處理上,也由項目總服務(wù)器根據(jù)請求,直接處理完成,便于工程電子文件閱讀設(shè)備讀取。
(2)臨時協(xié)作,按需共享:臨時協(xié)作模式考慮的是同一個工程現(xiàn)場不同施工點的工程電子文件閱讀設(shè)備之間的交互,因為同一個工程現(xiàn)場的不同施工點,工作性質(zhì)大致相同,需要的工程電子文件的內(nèi)容也基本相同,區(qū)別可能是具體施工的細(xì)微要求,比如高架橋不同路段高低的區(qū)別,這些工程電子文件,要求銜接更兼容,失誤更少,速度更快,因此,采用臨時協(xié)作,按需共享模式,這樣工程電子文件同源更新,減少出錯。
(3)實時更新,按需收集:這種模式是最底端的工作現(xiàn)場,也是工程電子文件直接應(yīng)用的終端,同時也是工程電子文件改動較多的地方,為了符合施工習(xí)慣,也可以在工程小幅圖紙上直接修改,然后通過手機(jī)更改,在不考慮成本的情況下,也可以由工程電子文件閱讀設(shè)備直接拍照收集數(shù)據(jù)。
4.2 工程電子文件處理技術(shù)。論文設(shè)計的工程電子文件閱讀設(shè)備的處理技術(shù)包括兼容技術(shù)、識別技術(shù)和類型轉(zhuǎn)換技術(shù)、局部成像技術(shù)、分層對比技術(shù)、圖紙追溯技術(shù)和增強(qiáng)現(xiàn)實技術(shù)。本文只考慮工程電子文件的獲取需要,因此只給出前三種技術(shù)的設(shè)計方案。如圖2所示。整個核心部件就是內(nèi)容處理模塊,內(nèi)容處理模塊向布局引擎提供獲取工程電子文件內(nèi)容和屬性統(tǒng)一接口,對具體的每種工程電子文件,只需要注冊一個格式的解析器,注冊標(biāo)準(zhǔn)內(nèi)容獲取接口即可被解析和顯示。這樣既保證操作接口的統(tǒng)一性,又保證對各種工程電子文件支持的拓展性[8]。
(1)兼容技術(shù):論文設(shè)計的工程電子文件閱讀設(shè)備,在兼容技術(shù)上,主要通過分析現(xiàn)有的工程電子文件的格式,將其納入格式兼容庫中,當(dāng)有文件讀入時,如果是已經(jīng)有的格式,則根據(jù)原有方案直接處理,如果是新的工程電子文件格式,系統(tǒng)則提醒對新文件進(jìn)行處理,如果新格式處理難度較大,也可以提交服務(wù)器,由服務(wù)器進(jìn)行處理,并更新格式兼容庫。
(2)識別技術(shù):識別技術(shù)主要針對的是工程電子文件的內(nèi)容,其工作有兩方面,一個是識別工程電子文件的各種屬性,比如時間、大小、授權(quán)單位、保密級別、是否可修改等,另外一方面是識別里面的內(nèi)容,比如字符串、圖形,甚至包括內(nèi)容的顏色,字體大小,格式等。在識別技術(shù)方面,主要采用的是施工特征識別,面向的主要是工程圖紙的識別,難度在于工程圖紙的符號識別。不少工程圖紙為更好地顯示,采用了彩色顯示,這也增加了識別的復(fù)雜性,論文采取背景顏色自動獲取的同色塊檢測法、顏色自動獲取的游程長度分析法[9],解決此方面的難題。
(3)轉(zhuǎn)換技術(shù):轉(zhuǎn)換包括同類型轉(zhuǎn)換技術(shù)和異類型轉(zhuǎn)換技術(shù)。同類型轉(zhuǎn)換技術(shù)指的是同類型的文件的轉(zhuǎn)換,比如,有的圖片文檔是JPEG格式,有的是BMP格式,通過同類型轉(zhuǎn)換技術(shù),轉(zhuǎn)成相同的格式,從而提高閱讀效果,減少因為類型差異導(dǎo)致的偏差,也便于比對。異類型轉(zhuǎn)換更多時候是為了提高閱讀的效果,比如局部成像技術(shù),將部分圖紙轉(zhuǎn)化成預(yù)測的圖像,從而辨別圖紙設(shè)計的效果;另外,平面3D技術(shù)可以讓工程電子文件的閱讀效果更好。
隨著“一帶一路”的全球響應(yīng),中國基礎(chǔ)建設(shè)已經(jīng)開始走出國門,雅萬高鐵、中老鐵路以及比雷埃夫斯港等一大批互聯(lián)互通項目開始啟動,這些項目中的工程電子文件的數(shù)量將更大,負(fù)責(zé)程度將更高。認(rèn)真分析工程電子文件的來源和特點,融合成熟的計算機(jī)技術(shù),研究工程電子文件的獲取模式與處理技術(shù),將促進(jìn)工程電子文件閱讀設(shè)備的實效,提高施工效率,減少失誤。
[1]付永華.基于電子紙的工程電子文件閱讀設(shè)備研究與設(shè)計[J].檔案管理,2014(05):33-35.
[2]劉家真.電子文件的保存、鑒定與存取——澳大利亞電子文件管理策略[J].浙江檔案,2000(03):28-29.
[3]李澤鋒.檔案數(shù)字化的電子格式研究[J].檔案學(xué)研究,2004(05):51-55.
[4]劉詩德,郭黎.電子出版系統(tǒng)的文件交流[J].今日印刷,1998(05):121-123.
[5]梁凱.檔案部門應(yīng)用OFD格式的若干思考[J].浙江檔案,2017(01):64.
[6]李澤鋒.基于OAIS的數(shù)字信息格式管理[J].河南科技學(xué)院學(xué)報,2011(09):13-16.
[7]電子文件存儲與交換格式版式文檔(GB/T33190-2016)[S],http://www.sac.gov.cn/
[8]付永華,江源,胡星波.一種面向數(shù)字版權(quán)保護(hù)的EPD電子教材的設(shè)計與實現(xiàn).[J].江西科學(xué),2013(1):117-122.
[9]李洋,張曉冬,鮑遠(yuǎn)律.基于特征模板匹配識別地圖中特殊圖標(biāo)的方法[J].電子測量與儀器學(xué)報,2012(07):605-609.