唐修益,羅 竟,黃 偉
(1.廣西紅河高速公路有限公司,廣西 南寧 530022;2.廣西交通職業(yè)技術(shù)學(xué)院,廣西 南寧 530023)
公路數(shù)字化檔案唯一性標(biāo)識(shí)編碼研究
唐修益1,羅 竟2,黃 偉1
(1.廣西紅河高速公路有限公司,廣西 南寧 530022;2.廣西交通職業(yè)技術(shù)學(xué)院,廣西 南寧 530023)
唯一性標(biāo)識(shí)編碼是公路數(shù)字化檔案信息資源管理和應(yīng)用的最基本單元。文章通過對(duì)公路工程檔案資料的分析、整理、歸類,借鑒國內(nèi)外期刊文獻(xiàn)數(shù)字對(duì)象唯一標(biāo)識(shí)符方法,創(chuàng)立適用于公路數(shù)字化檔案管理的“項(xiàng)目代號(hào)+屬性+類別+流水號(hào)”四段位方式的編碼規(guī)則,并將編碼規(guī)則應(yīng)用到計(jì)算機(jī)管理軟件,實(shí)現(xiàn)了計(jì)算機(jī)對(duì)公路數(shù)字檔案材料的自動(dòng)編碼,為計(jì)算機(jī)檢索、管理提供了便捷途徑。
公路數(shù)字化檔案;唯一性;編碼段位;樹形結(jié)構(gòu);概率
高速公路紙質(zhì)載體工程檔案平均每公里約100案卷,二級(jí)及其他等級(jí)公路檔案每公里案卷達(dá)50~80案卷。這些工程檔案全天候占用大量的庫房,花費(fèi)巨大的人力、物力。將數(shù)量龐大的工程檔案信息化處理后,利用云存儲(chǔ)技術(shù),網(wǎng)絡(luò)平臺(tái),將傳統(tǒng)的實(shí)體紙質(zhì)檔案建設(shè)成為數(shù)字化網(wǎng)絡(luò)檔案,是我國公路工程檔案信息化建設(shè)的方向。其關(guān)鍵核心技術(shù)之一是項(xiàng)目文件材料的標(biāo)識(shí)編碼。而我國至今還沒有成熟、通用的,專用于公路工程檔案唯一性標(biāo)識(shí)編碼的規(guī)則和方法。因此,需要立項(xiàng)研究公路工程檔案唯一性標(biāo)識(shí)編碼[1]。
1.1 唯一性標(biāo)識(shí)編碼現(xiàn)狀
唯一性標(biāo)識(shí)編碼,國際上通常稱之為數(shù)字對(duì)象標(biāo)識(shí)符。其研究和重視始于20世紀(jì)90年代國際互聯(lián)網(wǎng)聯(lián)盟(World Wide Web Consortium,W3C)和Internet工程任務(wù)組(Internet Engineering Task Force,IETF),規(guī)定了統(tǒng)一資源標(biāo)識(shí)符(簡稱URI)、統(tǒng)一資源名稱(簡稱URN)標(biāo)識(shí)框架。其研究任務(wù)就是把經(jīng)過信息化處理后的數(shù)字對(duì)象用唯一的標(biāo)識(shí)符將其識(shí)別,以方便計(jì)算機(jī)對(duì)這些數(shù)字化的信息進(jìn)行管理和利用。我國的居民身份證號(hào)碼就是典型的唯一標(biāo)識(shí)編碼,唯一地標(biāo)識(shí)每個(gè)中國公民。
我國部分行業(yè)對(duì)唯一性標(biāo)識(shí)編碼已開展研究。有影響力的如中國標(biāo)準(zhǔn)書號(hào)[2],國家藥品編碼方法[3],國外的期刊及文獻(xiàn)內(nèi)容標(biāo)識(shí)符(SICI)、數(shù)字對(duì)象標(biāo)識(shí)符(DOI)、出版物標(biāo)識(shí)符(PII)等編碼方案。公路工程項(xiàng)目文件種類繁多,組成復(fù)雜,編碼需要表達(dá)某一具體文件的頁碼,散裝材料需要單獨(dú)進(jìn)行處理。交通運(yùn)輸部頒發(fā)的《公路試驗(yàn)檢測數(shù)據(jù)報(bào)告編制導(dǎo)則》(JT/T 828-2012)[4],基于試驗(yàn)報(bào)告數(shù)據(jù)可追溯性為出發(fā)點(diǎn),發(fā)揮試驗(yàn)檢測數(shù)據(jù)對(duì)工程質(zhì)量控制的基礎(chǔ)作用,僅制定了試驗(yàn)表格的系列編碼規(guī)則,如8位數(shù)的試驗(yàn)檢測報(bào)告唯一性標(biāo)識(shí)編碼,7位數(shù)的試驗(yàn)檢測記錄表的唯一性標(biāo)識(shí)編碼。但其編碼規(guī)則不適合用于工程檔案[4]。我國至今尚未建立與工程相關(guān)性有著良好關(guān)系的公路工程檔案標(biāo)識(shí)編碼規(guī)則、方法[5]。
1.2 公路工程檔案的特征
公路行業(yè)普遍采用格式化表格來記錄工程質(zhì)量數(shù)據(jù)、原始施工信息。公路文件表格具有表格類型差異化、格式多樣化、內(nèi)容專業(yè)化、種類復(fù)雜化等特點(diǎn)。國內(nèi)已有的編碼規(guī)則,多從實(shí)施過程中強(qiáng)調(diào)某一功能而編碼,并不適合計(jì)算機(jī)管理公路工程數(shù)字化檔案的需要。同時(shí),各種非表格類材料,如各類紅頭文件、施工方案、聲像、已經(jīng)成卷成冊(cè)的研究報(bào)告、設(shè)計(jì)圖等等,數(shù)量龐大。這些因素,很難實(shí)現(xiàn)等長編碼,或者全部數(shù)字編碼。
由于公路建設(shè)投資主體的多元化和行業(yè)習(xí)慣的差異性,同一地區(qū)內(nèi)不同業(yè)主所使用的表格也大相徑庭。實(shí)施過程中,承包人、監(jiān)理或業(yè)主可根據(jù)各自的理解,隨意修改、增刪表格。
對(duì)公路工程檔案進(jìn)行信息化建設(shè),采用云技術(shù)將傳統(tǒng)的紙質(zhì)載體的實(shí)體檔案遷徙為網(wǎng)絡(luò)檔案,面臨的問題就是實(shí)現(xiàn)所有數(shù)字化檔案“一頁一碼”,搭建樹枝狀目錄,并建立編碼標(biāo)識(shí)與歸檔材料類別、信息化處理文件的錄入與上傳、組卷方式、檢索查詢之間的相關(guān)關(guān)系。
2.1 收集、立卷、歸檔的依據(jù)
交通運(yùn)輸部2010年頒發(fā)的《公路工程竣(交)工驗(yàn)收辦法實(shí)施細(xì)則》(交公路發(fā)〔2010〕65號(hào))[6]、《公路建設(shè)項(xiàng)目文件材料立卷歸檔管理辦法》(交辦發(fā)〔2010〕382號(hào))[7]及國家檔案局頒發(fā)的相關(guān)規(guī)范、文件、標(biāo)準(zhǔn),均作為標(biāo)識(shí)編碼研究的依據(jù)。
項(xiàng)目建設(shè)過程中,還涉及文獻(xiàn)[6]規(guī)定收集范圍之外的臨時(shí)材料的編碼。
2.2 歸檔材料的分類
通過對(duì)工程檔案歸檔材料的甄別,任何一份歸檔文件,均可歸入以下六大類[8]的其中一類。
(1)單位分部分項(xiàng)工序類。監(jiān)理、施工單位所收集的各工序成品驗(yàn)收,監(jiān)理旁站記錄,施工原始記錄,單位分部分項(xiàng)工序工程質(zhì)量檢驗(yàn)評(píng)定,中間交工證書等,這類材料,其明顯特征是任何一張表格或文檔,脫離不了其所依附的單位分部分項(xiàng)工序。
(2)年度+批次類。項(xiàng)目業(yè)主、監(jiān)理、承包人、各實(shí)驗(yàn)室等參建單位所形成的標(biāo)準(zhǔn)試驗(yàn),材料試驗(yàn),工程變更,工地會(huì)議紀(jì)要,監(jiān)理工作指令及反饋,土地征用,分期計(jì)量,工程管理文件,工程交(竣)工文件,施工日志,監(jiān)理日志,巡視記錄,天氣、溫度及自然災(zāi)害等,這些材料,均與年度、批次有關(guān)。
(3)散裝類。項(xiàng)目建議書,工程可行性研究報(bào)告,招投標(biāo)文件,審計(jì)報(bào)告,財(cái)務(wù)結(jié)算文件,工程決算文件,監(jiān)理規(guī)劃,(建設(shè)、施工、監(jiān)理、監(jiān)督、設(shè)計(jì))工作總結(jié)等,這些材料,基本獨(dú)立成冊(cè),且各立卷歸檔單位以“件”為單元進(jìn)行整理、歸檔。
(4)圖紙類。初步設(shè)計(jì)、施工圖設(shè)計(jì)、工程變更圖紙、竣工圖等,這些已經(jīng)裝訂成冊(cè)的圖紙,其本身每一頁已經(jīng)有圖號(hào)或頁碼,每一冊(cè)已有獨(dú)立目錄。
(5)聲像類。聲像類屬于特殊載體的檔案,目前多為數(shù)碼相機(jī)拍照的照片。
(6)其他。有些材料,無法歸入上述范圍,則采取靈活方式。如通道兩端連接引道的涵洞、土方,屬于線外工程,以及一些為當(dāng)?shù)乩习傩赵旄5囊恍╉?xiàng)目等。
2.3 標(biāo)識(shí)編碼考慮因素
需要編碼的工程檔案包括案卷卷皮的檔號(hào),卷內(nèi)目錄的每個(gè)文件號(hào),歸檔內(nèi)容的每頁(件)及備考表。為確保編碼的唯一性,并與工程性質(zhì)相關(guān)性建立關(guān)系,檔案標(biāo)識(shí)編碼需要考慮以下因素。
(1)路線代號(hào)。國家高速公路網(wǎng)、各省高速公路網(wǎng)及地方高速公路網(wǎng)均對(duì)規(guī)劃中的每條高速公路規(guī)定了路線代號(hào),如廣州至昆明高速公路代號(hào)為G80,省高速公路網(wǎng)的廣西武宣至平果高速公路代號(hào)為S52。列入政府批準(zhǔn)規(guī)劃的非高速公路的國道、省道、縣道也規(guī)定了路線代號(hào)。
(2)立卷單位。一個(gè)公路項(xiàng)目的工程檔案立卷單位,通常有項(xiàng)目業(yè)主、監(jiān)理、承包商、科研、營運(yùn)公司。前期項(xiàng)目文件通常由項(xiàng)目業(yè)主整理歸檔。中心實(shí)驗(yàn)室列入監(jiān)理范圍。材料供應(yīng)商列入承包人范圍。
(3)材料類別。材料立卷歸檔,在文獻(xiàn)[6]每部分第一層次劃分的前提下,還要按照單位分部分項(xiàng)、年度批次、散裝、圖紙、聲像及其他因素進(jìn)一步細(xì)分。
(4)流水號(hào)。案卷的順序號(hào)、卷內(nèi)目錄的文件順序號(hào)及歸檔材料的頁號(hào)均歸結(jié)為流水號(hào)。
3.1 “四段位”的構(gòu)架
課題組經(jīng)過多次反復(fù)論證,首創(chuàng)了國內(nèi)“項(xiàng)目代號(hào)+屬性+類別+流水號(hào)”的“四段位”公路工程數(shù)字化檔案唯一性標(biāo)識(shí)編碼,將公路工程立卷歸檔材料全部賦予“一頁(件)一碼”,并與工程相關(guān)性建立良好關(guān)系,實(shí)現(xiàn)了計(jì)算機(jī)一對(duì)多、多對(duì)一、一對(duì)一的檔案管理。
實(shí)行計(jì)算機(jī)管理的數(shù)字化檔案唯一性標(biāo)識(shí)編碼的核心問題是要找到每一案卷、每一個(gè)文件、每一頁的干支拓?fù)潢P(guān)系。
圖1為四段位編碼構(gòu)架示例。
圖1 項(xiàng)目標(biāo)識(shí)符編碼范例圖
圖1的編碼含義為:省高速公路網(wǎng)(S52),廣西壯族自治區(qū)(GX),來賓至馬山段(LM),項(xiàng)目業(yè)主歸檔的綜合文件(100),建設(shè)依據(jù)類(2),第1件(1),第65案卷(065),第1個(gè)文件(001)。
3.2 “四段位”編碼分析
《公路數(shù)字化檔案唯一性標(biāo)識(shí)編碼詞典》[8]詳細(xì)介紹了公路工程檔案的編碼。
(1)項(xiàng)目代號(hào)。項(xiàng)目代號(hào)分3級(jí),即第1級(jí)為路線代號(hào),如S52、G80。第2級(jí)為省、自治區(qū)、直轄市、特別行政區(qū)的字母碼,由中華人民共和國國家標(biāo)準(zhǔn)《中華人民共和國行政區(qū)劃代碼》(GB/T 2260-2007)[9]規(guī)定,如廣西為GX,山西為SX,陜西為SN,湖南為HN,海南為HI,河南為HA。第3級(jí)為建設(shè)項(xiàng)目具體段落代號(hào),采用路段起訖位置地名的第一個(gè)拼音字母碼組合。各省市劃分有縣、鄉(xiāng)級(jí)的字母碼,如LM標(biāo)識(shí)來賓至馬山段。規(guī)劃中的一條高速公路內(nèi),若一個(gè)省內(nèi)有兩個(gè)建設(shè)路段的起訖地名首字拼音碼組合相同時(shí),可以采用訖、起地名首字拼音組合。再有重名,則取起或訖地名第二個(gè)拼音字母碼,依次類推。課題選取全國29個(gè)省、直轄市、自治區(qū)的2 315個(gè)地名和途徑以上地區(qū)的592條高速公路的數(shù)據(jù)進(jìn)行實(shí)驗(yàn)分析,第一種情況的重復(fù)率最大為4.8×10-3%;取起或訖地名第二拼音字母組合的重復(fù)率都為0。所以在實(shí)際的應(yīng)用中,采用路段起訖位置地名的第一個(gè)字母碼與起點(diǎn)或終點(diǎn)的第二個(gè)字母碼組合的方式可以消除重復(fù)現(xiàn)象,使得唯一性得到了保障。
(2)屬性。屬性劃分為兩級(jí),第1級(jí)代碼為對(duì)應(yīng)文獻(xiàn)[6]附件二的5個(gè)部分,再增加通車后營運(yùn)公司,共6個(gè)部分的數(shù)字代號(hào)。第2級(jí)代碼為立卷單位,同時(shí)也表征案卷所在的段落屬性。參建單位劃分為項(xiàng)目業(yè)主,各總監(jiān)辦、各標(biāo)段或分部(工區(qū))。經(jīng)過調(diào)查,任何一個(gè)建設(shè)項(xiàng)目,其標(biāo)段劃分,不會(huì)超過99個(gè)標(biāo)段。故立卷單位的代號(hào)按路線前進(jìn)方向劃分段落,采用兩位流水號(hào)。整個(gè)屬性代號(hào)由兩級(jí)累計(jì)3位數(shù)代號(hào),如第三總監(jiān)辦的資料屬性代號(hào)為303,土建一標(biāo)代號(hào)為401。
(3)類別。類別劃分為兩個(gè)級(jí)別代碼。第1級(jí)類別代碼為文獻(xiàn)[6]中的各部分第1層次的綱。第2級(jí)類別代碼為前面所屬的六大類材料。
(4)流水號(hào)。記錄每一卷、每一件乃至每一頁的流水順序號(hào)。案卷封面的檔號(hào),其流水號(hào)為本案卷在總案卷的排列序號(hào);卷內(nèi)目錄的流水號(hào),則為序號(hào)的流水號(hào);每頁(件)的流水號(hào),則為該類別材料的頁數(shù)流水號(hào)。為統(tǒng)一,流水號(hào)統(tǒng)一定義為3位數(shù),不足時(shí),用0補(bǔ)足位數(shù)。
綜合上面的4個(gè)段位,為了確保編碼的延續(xù)性、清晰性、不等長性,方便計(jì)算機(jī)定位,依次將各段位串起來,之間插入“—”或“·”,將各段位分隔,以示區(qū)分段位,并利于計(jì)算機(jī)查詢。
軟件自動(dòng)生成各類表格標(biāo)題欄及基本信息區(qū)、表格二維碼,減輕了人工錄入工作量和出錯(cuò)率,提高了信息化處理后的上傳速度。系統(tǒng)對(duì)編碼的字母不分大小寫,方便了用戶使用。圖2為某表的截圖[10]。
圖2 自動(dòng)生成標(biāo)題欄和基本信息區(qū)截圖
促進(jìn)云計(jì)算創(chuàng)新發(fā)展,培育壯大新業(yè)態(tài)、新產(chǎn)業(yè)是國務(wù)院鼓勵(lì)發(fā)展的新興產(chǎn)業(yè),是信息化發(fā)展的重大變革和必然趨勢[11]。
S52廣西武宣至平果高速公路來賓至馬山段、馬山至平果段是廣西區(qū)內(nèi)首次全面推行數(shù)字化檔案建設(shè)的高速公路項(xiàng)目。廣西紅河高速公路有限公司、廣西正和高速公路有限公司和廣西寶祥工程咨詢有限公司從2012年開始,聯(lián)合開發(fā)的公路數(shù)字化檔案管理系統(tǒng),采用云存儲(chǔ),借助互聯(lián)網(wǎng)平臺(tái),有望將工程檔案全部實(shí)現(xiàn)網(wǎng)絡(luò)化。
注:本文編碼方法已獲自治區(qū)版權(quán)局頒發(fā)的版權(quán)證(桂作登記-20-2014-A-000299),版權(quán)所有
[1]國家檔案局.2014年度國家檔案局科技項(xiàng)目計(jì)劃(檔函〔2014〕114號(hào))[Z].北京:國家檔案局,2014.
[2]GB/T 5795-2006,中國標(biāo)準(zhǔn)書號(hào)[S].
[3]GB18937,國家藥品編碼本位碼編制規(guī)則[S].
[4]JT/T 828-2012,公路試驗(yàn)檢測數(shù)據(jù)報(bào)告編制導(dǎo)則[S].
[5]黃汝維,等.高速公路數(shù)字化檔案標(biāo)識(shí)編碼的唯一性論證報(bào)告[R].廣西大學(xué),2014.
[6]交通運(yùn)輸部.公路工程竣(交)工驗(yàn)收辦法實(shí)施細(xì)則(交公路發(fā)〔2010〕65號(hào))[Z].北京:交通運(yùn)輸部,2010.
[7]交通運(yùn)輸部.公路建設(shè)項(xiàng)目文件材料立卷歸檔管理辦法(交辦發(fā)〔2010〕382號(hào))[Z].北京:交通運(yùn)輸部,2010.
[8]唐修益,等.公路數(shù)字化檔案唯一性標(biāo)識(shí)編碼詞典[R].廣西紅河高速公路有限公司,2014.
[9]GB/T 2260-2007,中華人民共和國行政區(qū)劃代碼[S].
[10]唐修益,等.《高速公路工程檔案數(shù)字化建設(shè)》管理系統(tǒng)軟件使用手冊(cè)[Z].南寧:廣西紅河高速公路有限公司,2014.
[11]關(guān)于促進(jìn)云計(jì)算創(chuàng)新發(fā)展培育信息產(chǎn)業(yè)新業(yè)態(tài)的意見.(國務(wù)院“國發(fā)〔2015〕5號(hào))[Z].2015.
Research on Unique Identification Coding of Highway Digitized Archives
TANG Xiu-yi1,LUO Jing2,HUANG Wei1
(1.Guangxi Honghe Expressway Co.,Ltd.,Nanning,Guangxi,530022;2.Guangxi Vocational and Technical College of Communications,Nanning,Guangxi,530023)
The unique identification coding is the basic unit for the management and application of high-way digitized archival information resources.Through the analysis,sorting,classification of highway en-gineering archives,and by referring to the unique digital object identifier method in domestic and for-eign periodicals,this article established the four-section encoding rules of“project code + property + category + serial number”suitable for the highway digitized archives management,and used such en-coding rules in computer management software,which enables the computer to automatically encode the highway digitized archives,thereby providing a convenient way for computer retrieval and manage-ment.
Highway digitized archives;Uniqueness;Coding section;Tree structure;Probability
唐修益(1970—),高級(jí)工程師,從事公路工程建設(shè)管理工作;羅 竟(1964—),高級(jí)講師,從事公路教學(xué)、科研工作;黃 偉(1970—),高級(jí)工程師,從事路橋工程施工、建設(shè)管理工作。
國家檔案局科技項(xiàng)目“基于唯一性標(biāo)識(shí)編碼與公路數(shù)字化檔案相關(guān)性的應(yīng)用研究”(編號(hào):2014-X-57)
U
A
10.13282/j.cnki.wccst.2015.07.020
1673-4874(2015)07-0090-04
2015-06-05