王昱元,趙懷鑫,張紹陽,宋文麗(.長安大學(xué)信息工程學(xué)院,陜西西安70064;.陜西省交通運(yùn)輸廳綜合規(guī)劃處,陜西西安700;.西安興網(wǎng)通信科技有限公司,陜西西安70075)
交通運(yùn)輸信息系統(tǒng)數(shù)據(jù)庫字段命名及屬性定義規(guī)范化研究
王昱元1,趙懷鑫2,張紹陽1,宋文麗3
(1.長安大學(xué)信息工程學(xué)院,陜西西安710064;2.陜西省交通運(yùn)輸廳綜合規(guī)劃處,陜西西安710021;3.西安興網(wǎng)通信科技有限公司,陜西西安710075)
為促進(jìn)交通運(yùn)輸行業(yè)數(shù)據(jù)的共享交換,加強(qiáng)共享交換信息的可理解性和信息系統(tǒng)的可維護(hù)性,結(jié)合交通運(yùn)輸行業(yè)信息化發(fā)展現(xiàn)狀,提出統(tǒng)一交通運(yùn)輸信息系統(tǒng)數(shù)據(jù)庫字段命名方法以及屬性定義。在字段命名方面,考慮字段名的業(yè)務(wù)屬性、標(biāo)準(zhǔn)性及可理解性,給出了包括基本業(yè)務(wù)領(lǐng)域標(biāo)識(shí)、引用標(biāo)準(zhǔn)類別標(biāo)識(shí)和字段名縮寫等部分的字段命名規(guī)則,其中字段名縮寫采用中文名稱拼音縮寫和英文名稱縮寫兩種方法。在屬性定義方面,根據(jù)《交通信息基礎(chǔ)數(shù)據(jù)元》(JT/T 697—2013)中的數(shù)據(jù)屬性定義方法,對常見的5類數(shù)據(jù)庫管理系統(tǒng)的字段類型、格式及備注等屬性定義作了推薦。相關(guān)交通運(yùn)輸信息化項(xiàng)目應(yīng)用表明,通過對字段名和屬性定義的規(guī)范,保證了數(shù)據(jù)交換和共享雙方的相互識(shí)別,提高了在標(biāo)準(zhǔn)符合性檢測方面的準(zhǔn)確率。
交通運(yùn)輸行業(yè);字段命名方法;字段屬性;數(shù)據(jù)共享交換;名稱縮寫
“十二五”期間,交通運(yùn)輸信息化的主要目標(biāo)是實(shí)現(xiàn)“從效率到效能、從分散到集約、從封閉到開放”的三個(gè)轉(zhuǎn)變,因此共享交換在避免重復(fù)建設(shè)、落實(shí)協(xié)同機(jī)制、實(shí)現(xiàn)資源共享等方面具有深遠(yuǎn)的意義。從數(shù)據(jù)的交換和共享角度,規(guī)范的數(shù)據(jù)庫字段名在數(shù)據(jù)交換中是保證雙方相互識(shí)別的主要標(biāo)識(shí),同時(shí),字段屬性在同一數(shù)據(jù)庫的統(tǒng)一定義也會(huì)給交換和共享帶來便利。
《交通信息基礎(chǔ)數(shù)據(jù)元》(JT/T 697—2013)[1]是交通運(yùn)輸行業(yè)重要的數(shù)據(jù)標(biāo)準(zhǔn),遵守ISO/IEC 11179—1的規(guī)定,在數(shù)據(jù)元的屬性中,給出了分類編號。該編號采用“字母+數(shù)字”分類序號的方式,但沒有字段名屬性。在字段名稱設(shè)計(jì)中,使用該數(shù)據(jù)元標(biāo)準(zhǔn)的中文名稱或分類編號存在很多弊端,不符合軟件開發(fā)習(xí)慣,通常開發(fā)人員傾向于使用自定義的字段名,這樣造成了數(shù)據(jù)字段和標(biāo)準(zhǔn)不對應(yīng)的問題;在屬性規(guī)定方面,《交通信息基礎(chǔ)數(shù)據(jù)元》出于統(tǒng)一數(shù)據(jù)屬性的目的對數(shù)據(jù)的類型、格式等屬性進(jìn)行了規(guī)定,但為了避免特定數(shù)據(jù)庫管理系統(tǒng)的限制,規(guī)定的類型和格式使用通用的方法描述。然而在實(shí)際編程中參照標(biāo)準(zhǔn)進(jìn)行數(shù)據(jù)庫字段設(shè)計(jì)時(shí),由于數(shù)據(jù)庫系統(tǒng)不同、表達(dá)方式不同、編程階段不同等,開發(fā)人員存在理解差異,造成數(shù)據(jù)字段的屬性定義不統(tǒng)一,影響了標(biāo)準(zhǔn)的執(zhí)行效果。
目前,其他一些行業(yè)已不同程度地開展了數(shù)據(jù)庫字段命名及屬性定義方法的研究工作。如劉麗等[2]針對國土資源數(shù)據(jù)庫命名缺乏整體協(xié)調(diào)統(tǒng)一的問題,結(jié)合國土資源數(shù)據(jù)具有多業(yè)務(wù)、多時(shí)相、多領(lǐng)域、海量性等重要特征推薦了兩類命名規(guī)則:以行政區(qū)為基礎(chǔ)的命名規(guī)則和以標(biāo)準(zhǔn)圖幅為基礎(chǔ)的命名規(guī)則。這兩類規(guī)則皆采用三十位數(shù)字的編碼方法,使不同時(shí)間、不同業(yè)務(wù)、不同空間上的數(shù)據(jù)命名達(dá)到標(biāo)準(zhǔn)上的統(tǒng)一。張永波等[3]制訂了《中國地下水資源空間數(shù)據(jù)庫標(biāo)準(zhǔn)》,其中采用了“八位數(shù)字+字母”的圖元編碼方法對相關(guān)地下水資源數(shù)據(jù)進(jìn)行統(tǒng)一規(guī)范,提高了全國地下水資源評價(jià)的效率與準(zhǔn)確率。王霞等[4]提出了衛(wèi)生信息編碼標(biāo)準(zhǔn)代碼體系,對衛(wèi)生信息進(jìn)行分類并加以編碼,該信息編碼標(biāo)準(zhǔn)遵循國際標(biāo)準(zhǔn)、國家標(biāo)準(zhǔn)和行業(yè)標(biāo)準(zhǔn)的原則,建立和制訂了適合、滿足行業(yè)需要的信息編碼體系和標(biāo)準(zhǔn)。
另外,一些通用的字段命名方法在各種數(shù)據(jù)庫管理系統(tǒng)以及編程語言中都得到了廣泛的應(yīng)用,如駝峰命名法、Pascal命名法、匈牙利命名法。Ora?cle推薦了字段名命名方法,其中規(guī)定英文單詞可以采用縮寫命名,單詞之間用下劃線連接,對于存儲(chǔ)特殊內(nèi)容的字段可以將具有特殊含義的單詞加在結(jié)尾;MYSQL也推薦了字段命名規(guī)則,規(guī)定表別名加單詞的方法,首字母小寫,后面單詞的首字母大寫。
現(xiàn)有數(shù)據(jù)庫字段命名方法及其混合方法雖然在眾多數(shù)據(jù)庫中可滿足編程人員的要求和習(xí)慣,但由于交通運(yùn)輸行業(yè)的行業(yè)特點(diǎn),并不能滿足或符合行業(yè)內(nèi)的數(shù)據(jù)共享與交換要求。而事實(shí)上當(dāng)前交通運(yùn)輸行業(yè)數(shù)據(jù)庫字段命名方法的不統(tǒng)一的確給數(shù)據(jù)共享和交換帶來諸多不便,為此本文將參考其他行業(yè)在字段名統(tǒng)一方面的成果,提出對交通類數(shù)據(jù)庫字段命名和數(shù)據(jù)屬性定義進(jìn)行統(tǒng)一規(guī)定,并對主流數(shù)據(jù)庫中不同存儲(chǔ)對象的字段類型、格式和備注等屬性信息進(jìn)行推薦,以期推動(dòng)業(yè)界數(shù)據(jù)的共享與交換工作。
1.1 數(shù)據(jù)組織粒度
數(shù)據(jù)的產(chǎn)生可以分為以下兩種情況。第一種情況:產(chǎn)生自客觀事物信息的數(shù)據(jù)化??陀^事物信息的數(shù)據(jù)化過程就是將現(xiàn)實(shí)世界中的信息轉(zhuǎn)化為計(jì)算機(jī)中存儲(chǔ)數(shù)據(jù)的過程。第二種情況:從其他系統(tǒng)交換而來的數(shù)據(jù),屬信息的互聯(lián)互通,也是信息化發(fā)揮綜合效益的重要途徑。可見,從其他系統(tǒng)交換數(shù)據(jù)是信息系統(tǒng)數(shù)據(jù)的重要來源之一。
信息有粒度,數(shù)據(jù)也是有粒度的。從數(shù)據(jù)的產(chǎn)生過程可知,客觀事物信息數(shù)據(jù)化時(shí),即產(chǎn)生了單個(gè)的獨(dú)立數(shù)據(jù);同一類獨(dú)立數(shù)據(jù)的集合,形成數(shù)據(jù)組織的最原始單位,即數(shù)據(jù)項(xiàng);對多個(gè)數(shù)據(jù)的有序組織,就形成了數(shù)據(jù)集。因此,從數(shù)據(jù)組織角度,可將數(shù)據(jù)分為三個(gè)粒度:獨(dú)立數(shù)據(jù)、數(shù)據(jù)項(xiàng)、數(shù)據(jù)集。
(1)獨(dú)立數(shù)據(jù)
獨(dú)立數(shù)據(jù)是指單個(gè)的、具體的客觀事物的屬性值。例如“張三”,該數(shù)據(jù)代表某個(gè)人的姓名。獨(dú)立數(shù)據(jù)具有數(shù)量龐大、分散的特點(diǎn),不易管理。歸類是人類認(rèn)識(shí)事物的一個(gè)基本方法。在數(shù)據(jù)管理中,一般也對數(shù)據(jù)進(jìn)行歸類。
(2)數(shù)據(jù)項(xiàng)
數(shù)據(jù)項(xiàng)是對客觀事物某個(gè)屬性標(biāo)識(shí)及其內(nèi)容的總稱,也稱為數(shù)據(jù)元素,可以理解為同一類數(shù)據(jù)的集合,數(shù)據(jù)項(xiàng)的定義即為該類數(shù)據(jù)的定義。例如,“姓名”代表了一個(gè)數(shù)據(jù)項(xiàng),“張三”是該數(shù)據(jù)項(xiàng)的一個(gè)特定值,該值必須服從“姓名”數(shù)據(jù)項(xiàng)的定義。數(shù)據(jù)項(xiàng)將數(shù)據(jù)按類別進(jìn)行有效組織,起到了提綱挈領(lǐng)的作用。數(shù)據(jù)項(xiàng)的定義包括類型、格式等,是計(jì)算機(jī)中對數(shù)據(jù)進(jìn)行組織的最小單位。數(shù)據(jù)項(xiàng)的定義對獨(dú)立數(shù)據(jù)形成了約束。在關(guān)系型數(shù)據(jù)庫中,數(shù)據(jù)項(xiàng)與“字段”的定義相對應(yīng)。
(3)數(shù)據(jù)集
數(shù)據(jù)集是指有限數(shù)據(jù)項(xiàng)及其內(nèi)容的集合。在交換中,一般是以數(shù)據(jù)集的方式進(jìn)行交換,數(shù)據(jù)集是交換數(shù)據(jù)的集合,可大可小。數(shù)據(jù)集的屬性包括其組織方式、內(nèi)容、表示方式等。
1.2 數(shù)據(jù)交換中的數(shù)據(jù)概念及其粒度
信息的價(jià)值是在交換中體現(xiàn)的。從前文可知,從其他系統(tǒng)交換數(shù)據(jù)是信息系統(tǒng)數(shù)據(jù)的一個(gè)重要來源。下面針對關(guān)系型數(shù)據(jù)庫之間的數(shù)據(jù)交換過程進(jìn)行分析。
在關(guān)系型數(shù)據(jù)庫中,所有數(shù)據(jù)都存儲(chǔ)在關(guān)系(通常所說的二維表)中。客觀事物的同一特性的數(shù)據(jù)存儲(chǔ)在二維表的一個(gè)列中,該列稱為一個(gè)字段(或?qū)傩裕?,字段的概念與數(shù)據(jù)項(xiàng)的概念相對應(yīng)。每一行對應(yīng)著一個(gè)客觀事物對象,稱為記錄(或元組)。因此,在以關(guān)系型為主的數(shù)據(jù)存儲(chǔ)中,數(shù)據(jù)的標(biāo)準(zhǔn)化就是對關(guān)系表的字段(即列)定義的統(tǒng)一規(guī)定。
在交換過程中,單個(gè)數(shù)據(jù)是最基本的交換內(nèi)容。數(shù)據(jù)的組織可分為以下三個(gè)層次。
(1)第一層次:采用以“行”為主的組織方式。由于單個(gè)數(shù)據(jù)自身信息的不完整性,例如,數(shù)據(jù)庫A中的字段A112中存儲(chǔ)了人員的身高數(shù)據(jù),需要傳遞到目標(biāo)數(shù)據(jù)庫中,但大多情況下僅傳遞身高數(shù)據(jù)到目標(biāo)數(shù)據(jù)庫中是無意義的,目標(biāo)數(shù)據(jù)庫不知道身高數(shù)據(jù)是誰的數(shù)據(jù)。因此,一般情況下,數(shù)據(jù)及其識(shí)別信息(數(shù)據(jù)表的主鍵)需要一起傳遞,如果將數(shù)據(jù)和其識(shí)別信息分離,在入庫時(shí)將增加復(fù)雜性。因此,交換數(shù)據(jù)集的數(shù)據(jù)結(jié)構(gòu)以“記錄”(一組相互關(guān)聯(lián)的數(shù)據(jù))為組織更為合理,便于數(shù)據(jù)的識(shí)別。
(2)第二層次:以相互獨(dú)立的交換單元容納多組關(guān)系數(shù)據(jù)。一個(gè)表的多條記錄能夠構(gòu)成一個(gè)內(nèi)部循環(huán)的交換單元,由于各個(gè)表的結(jié)構(gòu)不同,放在一起會(huì)增加數(shù)據(jù)解析的復(fù)雜性,因此,使多個(gè)單元相互獨(dú)立,在一個(gè)交換數(shù)據(jù)集中就可容納多個(gè)表的數(shù)據(jù)。
(3)第三層次:在交換數(shù)據(jù)集和交換單元中都增加描述信息,使數(shù)據(jù)集成為自描述的。這樣,在一個(gè)交換數(shù)據(jù)集便可自由地、完整地表示出包含多個(gè)數(shù)據(jù)關(guān)系(表)、多個(gè)屬性(字段)中任意數(shù)據(jù)(記錄)的一次交換。
關(guān)系型數(shù)據(jù)庫的交換數(shù)據(jù)集的數(shù)據(jù)結(jié)構(gòu)如圖1所示。
圖1所示模型體現(xiàn)了交換數(shù)據(jù)組織的相關(guān)性(相關(guān)數(shù)據(jù)使用“記錄”方式組織)、包容性(多個(gè)交換單元的數(shù)據(jù)共同交換)、靈活性(交換記錄的數(shù)量和內(nèi)容未受限定)、通用性(采用XML描述格式,適宜于異構(gòu)系統(tǒng)之間的交換),因此,該模型同樣也適用于其他的數(shù)據(jù)存儲(chǔ)方式。
可見,數(shù)據(jù)是以“記錄”為最小單元進(jìn)行共享交換的,因此,從交換信息的可識(shí)別性的角度,數(shù)據(jù)字段屬性的統(tǒng)一規(guī)定具有重要的作用。
2.1 交通運(yùn)輸數(shù)據(jù)庫字段名組成規(guī)則
字段名設(shè)計(jì)的目的是讓用戶能夠更好地理解該字段所包含數(shù)據(jù)的含義。字段名應(yīng)盡量采用自然語言的方式,但同時(shí)又要便于形式化處理。通俗來講,就是既要便于理解,又要簡潔。前綴和后綴可以提高字段名的可理解性,本文在設(shè)計(jì)字段名時(shí)選擇增加前綴的方式。在編程中,通常采用表名、字段類型等前綴進(jìn)行表示。這些類型的前綴僅能提供字段本身的屬性,屬于編程層次的識(shí)別性問題。
圖1 通用的交換模型示意圖
交通行業(yè)業(yè)務(wù)領(lǐng)域眾多,因此通過對業(yè)務(wù)領(lǐng)域進(jìn)行標(biāo)識(shí),使用者可以較容易地分辨該數(shù)據(jù)項(xiàng)所屬的業(yè)務(wù)領(lǐng)域,從而對數(shù)據(jù)項(xiàng)的范圍等相關(guān)信息進(jìn)行了解。另外,通過標(biāo)識(shí),可以較好地解決字段名重復(fù)的問題。對業(yè)務(wù)領(lǐng)域按照系統(tǒng)或者子系統(tǒng)所在業(yè)務(wù)領(lǐng)域的大類進(jìn)行劃分,可免除用戶對每個(gè)數(shù)據(jù)進(jìn)行確認(rèn)的繁瑣。
交通行業(yè)所頒布的標(biāo)準(zhǔn)眾多,僅僅交通運(yùn)輸數(shù)據(jù)方面的標(biāo)準(zhǔn)已發(fā)布一百多項(xiàng),隨著行業(yè)的發(fā)展將會(huì)產(chǎn)生更新、更多的標(biāo)準(zhǔn)。因此,通過對應(yīng)用標(biāo)準(zhǔn)類別標(biāo)識(shí),使用者可以了解到數(shù)據(jù)項(xiàng)所采用的標(biāo)準(zhǔn),繼而進(jìn)一步理解字段的含義。
本文提出的交通運(yùn)輸數(shù)據(jù)庫字段名包含三個(gè)部分,如圖2所示。
圖2 交通運(yùn)輸數(shù)據(jù)庫字段名組成規(guī)則
2.2 交通運(yùn)輸業(yè)務(wù)領(lǐng)域的標(biāo)識(shí)
2.2.1 基本業(yè)務(wù)領(lǐng)域的標(biāo)識(shí)方法
在現(xiàn)有的交通信息化標(biāo)準(zhǔn)中,共有兩個(gè)標(biāo)準(zhǔn)對交通信息資源的業(yè)務(wù)領(lǐng)域進(jìn)行了劃分。
《交通信息基礎(chǔ)數(shù)據(jù)元》(JT/T 697—2013)[1]對交通運(yùn)輸業(yè)務(wù)領(lǐng)域進(jìn)行了劃分,并對業(yè)務(wù)領(lǐng)域的代碼進(jìn)行了簡寫,如表1所示。
表1 交通運(yùn)輸業(yè)務(wù)領(lǐng)域及其字母代碼[1]
《公路水路交通信息資源業(yè)務(wù)分類》(JT/T 748—2009)[5]對交通運(yùn)輸信息資源進(jìn)行了分類,為資源目錄體系的建立提供參考,如表2所示。
表2 公路水路交通信息資源業(yè)務(wù)分類方法[5]
兩種分類方法在類別和代碼規(guī)定方面都有些區(qū)別。由于數(shù)據(jù)元在行業(yè)中認(rèn)可度更高,所以本文數(shù)據(jù)庫字段采用JT/T 697—2013中的數(shù)據(jù)元分類方法來進(jìn)行交通信息數(shù)據(jù)所在的業(yè)務(wù)領(lǐng)域的標(biāo)識(shí),即業(yè)務(wù)領(lǐng)域采用兩個(gè)字母進(jìn)行標(biāo)識(shí),據(jù)此,可在數(shù)據(jù)字段中保留兩位業(yè)務(wù)領(lǐng)域的標(biāo)識(shí)作為字段前綴。
2.2.2 自定義業(yè)務(wù)領(lǐng)域的標(biāo)識(shí)方法
對于表1中未能覆蓋的交通運(yùn)輸業(yè)務(wù)領(lǐng)域或具有特殊數(shù)據(jù)定義要求的系統(tǒng),用戶可采用自定義的兩位大寫字母進(jìn)行標(biāo)識(shí)。
自定義交通運(yùn)輸業(yè)務(wù)領(lǐng)域標(biāo)識(shí)編寫應(yīng)滿足如下要求:
(1)采用關(guān)鍵詞的漢語拼音縮寫;
(2)不與現(xiàn)有標(biāo)識(shí)重復(fù)。
2.3 引用標(biāo)準(zhǔn)的類別標(biāo)識(shí)
在交通運(yùn)輸行業(yè)中,ITS標(biāo)準(zhǔn)化組織、全國集裝箱標(biāo)準(zhǔn)化技術(shù)委員會(huì)、全國智能運(yùn)輸標(biāo)準(zhǔn)化技術(shù)委員會(huì)制訂了大量的國家標(biāo)準(zhǔn),如《產(chǎn)品數(shù)據(jù)字典的維護(hù)規(guī)范》(GB/T 28040—2011)、《信息技術(shù)數(shù)據(jù)元的規(guī)范與標(biāo)準(zhǔn)化》(GB/T 18391—2001);交通運(yùn)輸部信息通信及導(dǎo)航標(biāo)準(zhǔn)化技術(shù)委員會(huì)、交通運(yùn)輸部航測標(biāo)準(zhǔn)化委員會(huì)等也制訂了大量的交通運(yùn)輸行業(yè)標(biāo)準(zhǔn),如《交通信息基礎(chǔ)數(shù)據(jù)元》(JT/T 697—2013)以及各業(yè)務(wù)領(lǐng)域的接口標(biāo)準(zhǔn);除此以外,還有用戶引用的本地?cái)?shù)據(jù)字段相關(guān)標(biāo)準(zhǔn)。
以上標(biāo)準(zhǔn)為交通運(yùn)輸行業(yè)的發(fā)展奠定了良好的基礎(chǔ),因此本文擬將數(shù)據(jù)字段名的第三位作為標(biāo)準(zhǔn)的分類標(biāo)識(shí),用數(shù)字表示,具體意義如下:
0:國家標(biāo)準(zhǔn);
1:交通運(yùn)輸行業(yè)標(biāo)準(zhǔn);
2:其他行業(yè)標(biāo)準(zhǔn);
3:地方標(biāo)準(zhǔn);
4:國際標(biāo)準(zhǔn);
5:保留將來使用;
6:保留將來使用;
7:保留將來使用;
8:保留將來使用;
9:用戶自定義的數(shù)據(jù)字段。
2.4 字段中文/英文名稱縮寫方法
根據(jù)我國信息化行業(yè)習(xí)慣和國際發(fā)展趨勢,本文給出兩種交通運(yùn)輸信息數(shù)據(jù)字段名稱縮寫方法:字段中文名稱拼音縮寫法和字段英文名稱縮寫法。
2.4.1 中文名稱拼音縮寫的字段命名方法
中文名稱縮寫,即將名稱中每個(gè)漢字拼音縮寫為其聲母的首字母,這些首字母順序組合形成該字段的縮寫,其中首字母全部采用大寫。例如:“船舶登記號”數(shù)據(jù)項(xiàng)名稱,其拼音首字母可以縮寫為:CBDJH。該數(shù)據(jù)項(xiàng)的業(yè)務(wù)領(lǐng)域?yàn)椤按啊?,在JT/T 697.5中對該數(shù)據(jù)項(xiàng)進(jìn)行了定義,則其字段可命名為CB1_CBDJH。
當(dāng)字段名在一個(gè)數(shù)據(jù)表或者數(shù)據(jù)集中重復(fù)出現(xiàn)時(shí),采用以下方法解決[6]。
(a)重復(fù)字段的中文名稱全拼不同。這種情況下可將后規(guī)定的中文名稱中不同字的全拼用小寫拼寫出來。例如:中文名稱為“加載船舶數(shù)量”和“減載船舶數(shù)量”的兩個(gè)字段,按照命名規(guī)則,它們的字段名都為:CB1_JZCBSL,但它們的中文全拼不完全相同,可將后面一個(gè)數(shù)據(jù)元命名為CB1_JianZCBSL。
(b)重復(fù)字段的中文名稱全拼完全相同。將重復(fù)的字段命名后面依次添加“_1”、“_2”等后綴。例如:“航行作業(yè)性質(zhì)”數(shù)據(jù)項(xiàng),第一個(gè)的同名字段可命名為CB1_HXZYXZ_1,第二個(gè)的同名字段可命名為CB1_HXZYXZ_2。
2.4.2 英文名稱縮寫的字段命名方法
牛津字典給出的英文縮寫方法有如下幾種[]:
(1)壓縮是一種省略單詞中間字母的縮寫類型;
(2)縮略詞是一種省略單詞開頭或結(jié)尾的縮寫類型,有些情況下開頭與結(jié)尾皆省略;
(3)首字母縮略詞是一種保留單詞中最初發(fā)音字母的縮寫類型;
(4)縮略語是一種由單詞的首字母組成一個(gè)新單詞的縮寫類型,并且縮略語按照新單詞的拼寫發(fā)音。
《JCR收錄的英文刊名常用詞縮寫分析》給出下述縮寫規(guī)則[]:
(1)少于五個(gè)(含五個(gè))字母的單詞一般不縮寫;
(2)單詞縮寫應(yīng)省略在輔音之后,元音之前;
(3)英文單詞縮寫一般以輔音結(jié)尾,而不以元音結(jié)尾,如American省略為Am,而不省略為Ame或Amer。
結(jié)合上述,參考《牛津字典》中的英文縮寫方法,以明確字段名含義、便于用戶理解數(shù)據(jù)所存儲(chǔ)內(nèi)容為目的,從易于編程實(shí)現(xiàn)的角度,本文建議選取單詞的第一個(gè)音節(jié)作為其縮寫,并總結(jié)出以下英文縮寫規(guī)則。
(1)字段英文名稱為單個(gè)單詞,直接用該單詞作為字段名。
(2)字段英文名稱為兩個(gè)及兩個(gè)以上單詞,則采用縮寫拼接法,即對每個(gè)單詞進(jìn)行縮寫后拼接,每個(gè)縮寫單詞首字母大寫,其余字母小寫,縮寫單詞之間無分隔符。英文單詞的縮寫常用規(guī)則為:
①英文單詞縮寫一般規(guī)則為:省略在輔音之后,元音之前;
②英文單詞縮寫至少保留一個(gè)元音;
③英文單詞縮寫一般以輔音結(jié)尾,而不以元音結(jié)尾,如American省略為Am,而不省略為Ame或Amer;
④當(dāng)單詞的第二個(gè)字母為元音時(shí),省略在第二個(gè)元音之前,如Medicine或Medical縮寫為Med,European縮寫為Eur等;
⑤當(dāng)遇到兩個(gè)相連的元音時(shí),以第一個(gè)元音結(jié)尾,省略第二個(gè),如Science,縮寫為Sci;
⑥英文名稱中的虛詞省略。
(3)當(dāng)字段名縮寫出現(xiàn)重復(fù)時(shí),全部拼寫英文名稱中的第一個(gè)單詞。如果仍然重復(fù),依次向后使用單詞的全部拼寫。所有單詞全部拼寫后仍然重復(fù)的情況下,可在縮寫的字段名后面依次添加“_1”、“_2”等后綴。
例如:機(jī)動(dòng)車道最大寬度的英文推薦名是CK1_DrMW;機(jī)動(dòng)車道最小寬度的英文推薦名是CK1_DrMinW。
3.1 字段類型和格式屬性推薦
理論上,用戶可以采用任何合法的數(shù)據(jù)類型和格式進(jìn)行數(shù)據(jù)存儲(chǔ)。但為了方便共享交換,需對數(shù)據(jù)元標(biāo)準(zhǔn)規(guī)定的數(shù)據(jù)格式具有統(tǒng)一的理解,在字段類型和格式定義時(shí),本文給出表3推薦的要求,對其他類型的用戶存儲(chǔ)要求未做規(guī)定,用戶可以自行設(shè)計(jì)。
表3 字段類型屬性推薦表[9-11]
表3 (續(xù))
3.2 字段備注屬性推薦
在各類數(shù)據(jù)庫的字段定義中,一般都有備注屬性。但在數(shù)據(jù)庫建立時(shí),絕大部分設(shè)計(jì)人員都未對字段的備注屬性進(jìn)行填寫,使得設(shè)計(jì)階段的信息難以傳遞到實(shí)現(xiàn)階段,造成代碼維護(hù)困難。本文建議在備注屬性中填入字段的中文描述、對應(yīng)標(biāo)準(zhǔn)項(xiàng)編號、值域、單位和備注等內(nèi)容。
備注屬性內(nèi)容的格式可表示為:
[{中文描述:××××××}][{標(biāo)準(zhǔn)項(xiàng)編號:××××××}] [{值域:××××××}][{單位:××××××}][{備注:××××××}]
其中:[]表示可選項(xiàng)內(nèi)容的分界符;{}表示不同內(nèi)容之間的分界符;××××××表示相應(yīng)部分的具體內(nèi)容,且不能是“{”、“}”、“:”;冒號(:)表示連接符,銜接備注屬性和其具體內(nèi)容。
示例:“{中文描述:船型標(biāo)準(zhǔn)標(biāo)識(shí)}{值域:0,是;1,否}{備注:真假二值數(shù)據(jù)}”、“{中文描述:行政區(qū)域代碼}{備注:GB/T2260}”都是符合規(guī)則的備注字段格式。
“十二五”期間,某省交通運(yùn)輸廳為提高本省公路水路交通運(yùn)輸運(yùn)行效能,促進(jìn)其公路水路交通運(yùn)輸又好又快發(fā)展,提出要大力推動(dòng)交通運(yùn)輸信息化建設(shè),充分利用現(xiàn)代信息技術(shù)手段,提升交通運(yùn)輸運(yùn)行管理、預(yù)警預(yù)控、應(yīng)急指揮、決策支持和信息服務(wù)能力,為此在全省范圍內(nèi)實(shí)施了交通信息化建設(shè)工程。在此過程中,以本文及其他相關(guān)內(nèi)容為主體的幾項(xiàng)標(biāo)準(zhǔn)正在進(jìn)行編制和意見征求。為了提高工程的標(biāo)準(zhǔn)化程度,促進(jìn)共享交換,該工程中運(yùn)用本文主要研究成果對原有的部分設(shè)計(jì)進(jìn)行了改進(jìn),舉例分析如下。表4是用戶以前自定義的數(shù)據(jù)字典樣例,表5是運(yùn)用本文規(guī)則改進(jìn)后的數(shù)據(jù)字典樣例。
表4 用戶自定義的數(shù)據(jù)庫字典部分內(nèi)容
表5 改進(jìn)后的數(shù)據(jù)庫字典部分內(nèi)容
表5是按照本文所介紹的字段命名方法及屬性定義推薦給出了表4中的中英文字段名,從給出的字段名中,用戶可以很容易分辨出是否為標(biāo)準(zhǔn)字段。例如,表5中的“行政區(qū)域”和“歸屬單位”,其字段名以DY1開頭,說明其遵從《交通信息基礎(chǔ)數(shù)據(jù)元第7部分:道路運(yùn)輸信息基礎(chǔ)數(shù)據(jù)元》(JT/T 697.7—2013)的規(guī)定,屬于標(biāo)準(zhǔn)字段,其數(shù)據(jù)類型和格式都按照標(biāo)準(zhǔn)規(guī)定進(jìn)行定義;“經(jīng)度”、“緯度”采用《交通信息基礎(chǔ)數(shù)據(jù)元第10部分:交通統(tǒng)計(jì)信息基礎(chǔ)數(shù)據(jù)元》(JT/T 697.10—2013)的規(guī)定;其他字段名以DY9開頭,說明其屬于道路運(yùn)輸領(lǐng)域,為用戶自定義的數(shù)據(jù)字段。這樣,在交換時(shí),接收方可以分類進(jìn)行處理。
另外,《交通信息基礎(chǔ)數(shù)據(jù)元》(JT/T 697—2013)中的數(shù)據(jù)屬性缺乏針對特定數(shù)據(jù)庫的規(guī)定,使得用戶對于標(biāo)準(zhǔn)規(guī)定難以執(zhí)行。例如,標(biāo)準(zhǔn)規(guī)定“經(jīng)度”的格式為an..14,在數(shù)據(jù)庫管理系統(tǒng)中有不同的實(shí)現(xiàn)方法,按照表3的規(guī)定,用戶則能夠準(zhǔn)確地執(zhí)行標(biāo)準(zhǔn)。
在對數(shù)據(jù)字段和屬性改進(jìn)之后,項(xiàng)目數(shù)據(jù)字典文檔與《交通運(yùn)輸信息系統(tǒng)數(shù)據(jù)字典規(guī)范》的符合度達(dá)到100%,標(biāo)準(zhǔn)符合性檢測檢測率提高了20%,與交通信息數(shù)據(jù)元標(biāo)準(zhǔn)的符合程度提高了52%。
本文提出了兩種交通運(yùn)輸信息系統(tǒng)數(shù)據(jù)庫字段命名方法及字段屬性推薦,首次統(tǒng)一規(guī)范了交通運(yùn)輸數(shù)據(jù)庫字段的命名規(guī)則,便于存儲(chǔ)、交換、共享龐大的交通運(yùn)輸數(shù)據(jù),便于數(shù)據(jù)元標(biāo)準(zhǔn)的引用,為信息的交換和共享奠定了良好的基礎(chǔ)。本文的主要內(nèi)容已編制成為相關(guān)標(biāo)準(zhǔn)并已報(bào)批。由于行業(yè)內(nèi)長期存在不統(tǒng)一的多種命名方法,本文的研究成果存在不能及時(shí)生效的問題,所以下一步將通過標(biāo)準(zhǔn)的宣貫培訓(xùn),加大宣傳力度,使標(biāo)準(zhǔn)能夠真正發(fā)揮作用,促進(jìn)交通運(yùn)輸信息系統(tǒng)數(shù)據(jù)庫構(gòu)建的合理發(fā)展。
[1]中華人民共和國交通運(yùn)輸部.JT/T 697—2013交通信息基礎(chǔ)數(shù)據(jù)元[S].北京:人民交通出版社,2007.
[2]劉麗,岳建偉,戴家文.省級國土資源數(shù)據(jù)中心數(shù)據(jù)庫命名規(guī)則研究[J].地理信息世界,2010(3):2-5.
[3]張永波,梁國玲,張禮中,等.中國地下水資源空間數(shù)據(jù)庫標(biāo)準(zhǔn)化研究[J].地球?qū)W報(bào),2003,24(4):1-4.
[4]王霞,徐勇勇,劉丹紅.我國衛(wèi)生信息編碼標(biāo)準(zhǔn)化可利用的標(biāo)準(zhǔn)代碼體系[J].中國衛(wèi)生質(zhì)量管理,2005,12(6):1-5.
[5]中華人民共和國交通運(yùn)輸部.JT/T 748—2009公路水路交通信息資源業(yè)務(wù)分類[S].北京:人民交通出版社,2009.
[6]施曉林.數(shù)據(jù)庫設(shè)計(jì)中的重復(fù)字段和冗余字段[J].軟件技術(shù)研究,2006(11):1-2.
[7]皮爾素.牛津英語詞典[M].上海:上海外語教育出版社,2001.
[8]羅承麗.JCR收錄的英文刊名常用詞縮寫分析[J].編輯學(xué)報(bào),2006,18(2):1-3.
[9]明日科技.Oracle從入門到精通[M].北京:清華大學(xué)出版社,2012.
[10]賀特克.SQL Server2008從入門到精通[M].北京:清華大學(xué)出版社,2011.
[11]辛運(yùn)幃.Java語言程序設(shè)計(jì)[M].北京:人民郵電出版社,2009.
Specification for Field Naming and Attribute Definition of Database for Traffic&Transportation Information System
WANG Yu-yuan1,ZHAO Huai-xin2,ZHANG Shao-yang1,SONG Wen-li3
(1.School of Information Engineering,Chang′an University,Xi′an 710064,China; 2.Comprehensive Planning Office of Shaanxi Provincal Transport Department,Xi′an 710021,China; 3.Xingwang Communication Technology Co.,Ltd.,Xi′an 710075,China)
In order to promote the quality of data sharing and exchanging in traffic&transportation industry,and to enhance the comprehensibility of information and maintainability of information system, the method which unified field naming and attribute definition of database was developed,combining with the current situation of traffic&transportation informatization.In field naming,considering the service attribute,standardization and comprehensibility of field name,the field naming rule was introduced, which consisted of the identifier of basic service field,the category identifier of quoted standard and the abbreviation of field name.The field name was abbreviated from Chinese name or English name.In attribute definition,some attributes such as the type,format and memo etc.of filed in 5 common database management systems were recommended,according to the definition method of data attribute in"Basic Data Element of Transportation Information".The application in projects of traffic&transportation informatization indicated that it not only ensures mutual recognition in data sharing and exchanging,but also increases the accuracy of standard conformance test by using the developed method.
traffic&transportation industry;field naming;field attribute;data sharing and ex?change;name abbreviation
U-9
B
2095-9931(2015)03-0089-08
10.16503/j.cnki.2095-9931.2015.03.016
2015-03-13
交通運(yùn)輸科技項(xiàng)目(2012364223500)
王昱元(1990—),女,新疆烏魯木齊人,碩士研究生,研究方向?yàn)榻煌ㄐ畔⒐こ獭?/p>
E-mail:844719819@qq.com。