亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        交通統(tǒng)計數(shù)據(jù)多維存儲模型構(gòu)建

        2015-05-27 13:18:58鵬,丁然,劉
        關(guān)鍵詞:統(tǒng)計數(shù)據(jù)數(shù)據(jù)庫信息

        任 鵬,丁 然,劉 凌

        (交通運輸部科學研究院 現(xiàn)代物流研發(fā)中心,北京100013)

        交通統(tǒng)計分析是交通管理部門科學決策的基礎性工作,涉及6 個部分近200 個交通指標的采集與分析,其數(shù)據(jù)類型繁多、數(shù)據(jù)關(guān)系復雜,采用人工統(tǒng)計手段很難保證統(tǒng)計數(shù)據(jù)的有效性與可靠性,因此運用信息化手段簡化統(tǒng)計工作復雜度、提升統(tǒng)計數(shù)據(jù)的質(zhì)量是近年來相關(guān)交通研究機構(gòu)的重要課題之一[1-3]。為了降低統(tǒng)計人員的工作強度,保證統(tǒng)計數(shù)據(jù)的質(zhì)量,交通運輸管理部門已開始利用專業(yè)的交通統(tǒng)計分析完成基本的數(shù)據(jù)匯總、審核和上報工作。現(xiàn)有的交通統(tǒng)計分析系統(tǒng)通常采用傳統(tǒng)的二維數(shù)據(jù)結(jié)構(gòu)存儲統(tǒng)計數(shù)據(jù),在一定程度上滿足了統(tǒng)計數(shù)據(jù)的查詢分析工作,但是,由于其數(shù)據(jù)存儲效率低下,數(shù)據(jù)的可擴充性、可維護性較差,很難滿足統(tǒng)計工作對于歷史數(shù)據(jù)對比、復雜自定義數(shù)據(jù)查詢等功能的需求。因此,引入多維數(shù)據(jù)模型構(gòu)建交通統(tǒng)計分析系統(tǒng)數(shù)據(jù)庫成為優(yōu)化統(tǒng)計數(shù)據(jù)存儲結(jié)構(gòu)的有效途徑。

        多維數(shù)據(jù)模型主要是根據(jù)業(yè)務分析主題的要求,從事實、維度、層次等多個度量角度對業(yè)務邏輯活動進行建模,可以在關(guān)系數(shù)據(jù)庫、多維數(shù)據(jù)庫甚至是面向?qū)ο蟮臄?shù)據(jù)庫上實現(xiàn)[4]。多維數(shù)據(jù)模型主要由事實表和維表構(gòu)成。事實表是多維數(shù)據(jù)模型的中央表,包含聯(lián)系事實與維度的數(shù)字度量值和鍵,維表則是維度屬性集合。多維數(shù)據(jù)模型主要包含星形模式、雪花模式和事實星座模式3 種模式,如表1 和圖1 所示。

        表1 多維數(shù)據(jù)模型基本形式

        圖1 多維數(shù)據(jù)模型基本形式關(guān)系圖

        1 交通統(tǒng)計數(shù)據(jù)基本特征

        交通統(tǒng)計制度[5]是交通統(tǒng)計工作的基礎內(nèi)容,主要由交通運輸綜合統(tǒng)計、港口綜合統(tǒng)計、交通固定資產(chǎn)投資統(tǒng)計、城市客運統(tǒng)計和交通運輸扶貧統(tǒng)計6 個部分構(gòu)成,每個部分由一系列標準格式的數(shù)據(jù)報表組成。交通統(tǒng)計制度報表根據(jù)統(tǒng)計周期不同可劃分為年報和定期報表兩大類,其中定期報表又可細分為月報、季報和半年報等類型。交通統(tǒng)計數(shù)據(jù)上報一般采取企業(yè)、縣級、地市級、省級、部級層層上報的模式,每個級別的行業(yè)主管部門負責對所轄數(shù)據(jù)的收集、整理和分析工作。為了優(yōu)化交通統(tǒng)計數(shù)據(jù)內(nèi)容,提高交通統(tǒng)計工作的效率與質(zhì)量,交通統(tǒng)計制度會根據(jù)實際需求進行周期性調(diào)整(通常為一年)。交通統(tǒng)計制度是人工統(tǒng)計階段下的產(chǎn)物,詳細規(guī)定了數(shù)據(jù)統(tǒng)計內(nèi)容和規(guī)則,但由于交通統(tǒng)計數(shù)據(jù)的多元性、歷史性和易變性,其數(shù)據(jù)關(guān)系需要進一步梳理才能轉(zhuǎn)化為數(shù)據(jù)庫形式。交通統(tǒng)計報表數(shù)據(jù)主要有以下幾個基本特征:

        (1)交通統(tǒng)計數(shù)據(jù)是一種多維數(shù)據(jù)。交通統(tǒng)計制度中的機構(gòu)、時間周期、統(tǒng)計表格等要素的形式經(jīng)常會根據(jù)需求不斷變化,因此交通統(tǒng)計數(shù)據(jù)應當采用延展性強且可擴展的數(shù)據(jù)描述方式。交通統(tǒng)計數(shù)據(jù)由限定詞和指標值兩部分構(gòu)成,指標值只是表示具體數(shù)量,沒有實際意義,而限定詞則是對指標值的具體描述,可以由統(tǒng)計機構(gòu)、統(tǒng)計周期、統(tǒng)計時間、統(tǒng)計分類及統(tǒng)計單位等維度疊加,因此交通統(tǒng)計數(shù)據(jù)本質(zhì)上是一種多維數(shù)據(jù)。

        (2)交通統(tǒng)計數(shù)據(jù)之間存在一定關(guān)聯(lián)性。交通統(tǒng)計數(shù)據(jù)之間并不是完全獨立的,某項指標可由其他數(shù)據(jù)推導得出。交通統(tǒng)計數(shù)據(jù)間的關(guān)聯(lián)主要表現(xiàn)為兩種:①邏輯性關(guān)聯(lián),即數(shù)據(jù)與數(shù)據(jù)之間存在某種邏輯關(guān)聯(lián)。如由貨運車輛總噸位可以推導出貨運量的范圍;②合理性關(guān)聯(lián),即數(shù)據(jù)與數(shù)據(jù)之間存在著某種必然的推導關(guān)系。合理性關(guān)聯(lián)包括推導性關(guān)聯(lián)和匯總性關(guān)聯(lián)。推導性關(guān)聯(lián)主要是指統(tǒng)計數(shù)據(jù)之間存在固定的計算公式,某項指標可根據(jù)具體公式由其他指標計算得來。匯總性關(guān)聯(lián)主要是指數(shù)據(jù)的匯總是由分項數(shù)據(jù)加和得來,如在時間維度上的匯總(年報由月報匯總)、機構(gòu)間匯總等。

        (3)交通統(tǒng)計數(shù)據(jù)間存在一定的重復性。交通統(tǒng)計的重復性一方面是由于交通統(tǒng)計中涉及指標較多,數(shù)據(jù)間的關(guān)聯(lián)關(guān)系難以厘清;另一方面是由于在統(tǒng)計工作中對數(shù)據(jù)信息獲取需求不同,如公路里程總長既可以由不同公路技術(shù)等級建設情況匯總得出,也可以由不同公路路面類型建設情況匯總得出。雖然結(jié)果相同,但出于對建設情況細節(jié)數(shù)據(jù)信息獲取的需求,必須分別統(tǒng)計。

        綜上所述,交通統(tǒng)計數(shù)據(jù)是一種復雜數(shù)據(jù),其多維性、關(guān)聯(lián)性和重復性特征使傳統(tǒng)數(shù)據(jù)庫建模方案難以適用,將多維數(shù)據(jù)模型理論引入交通統(tǒng)計分析系統(tǒng)數(shù)據(jù)庫建模之中,對滿足交通統(tǒng)計數(shù)據(jù)對于兼容性、易擴展等方面的存儲需求有著積極意義。

        2 交通統(tǒng)計數(shù)據(jù)基本數(shù)據(jù)類型

        交通統(tǒng)計報表是統(tǒng)計數(shù)據(jù)的最終結(jié)果的表現(xiàn)形式,它是多種類型數(shù)據(jù)形式的綜合體。通過對交通統(tǒng)計制度的分析,交通統(tǒng)計數(shù)據(jù)庫系統(tǒng)設計主要應考慮以下幾種基本數(shù)據(jù)類型:

        (1)輔助類數(shù)據(jù)。輔助類數(shù)據(jù)主要是指交通統(tǒng)計過程中所需要的基礎類數(shù)據(jù),這些數(shù)據(jù)雖然在最終報表較少或沒有直接體現(xiàn),但在統(tǒng)計過程中會使用到,如統(tǒng)計參與機構(gòu)數(shù)據(jù)、統(tǒng)計人員數(shù)據(jù)、交通運營企業(yè)數(shù)據(jù)、行政區(qū)劃面積人口數(shù)據(jù)等。

        (2)操作類數(shù)據(jù)。操作類數(shù)據(jù)主要是指由系統(tǒng)相關(guān)功能操作所生成的數(shù)據(jù),這些數(shù)據(jù)主要記錄用戶的操作過程及狀態(tài),如數(shù)據(jù)的審核操作。

        (3)明細類數(shù)據(jù)。明細類數(shù)據(jù)主要是具體的交通設備設施的詳細特征信息,如高速公路明細、運輸船舶名錄等,明細類數(shù)據(jù)可作為統(tǒng)計類數(shù)據(jù)的基礎數(shù)據(jù)。

        (4)統(tǒng)計類數(shù)據(jù)。統(tǒng)計類數(shù)據(jù)是統(tǒng)計工作所需要的最終結(jié)果,主要是對各項交通數(shù)據(jù)進行匯總或計算后得到的數(shù)據(jù)。交通統(tǒng)計報表制度所收集的數(shù)據(jù)大部分為統(tǒng)計類數(shù)據(jù)。

        交通統(tǒng)計數(shù)據(jù)間主要存在屬性標識、數(shù)據(jù)匯總和數(shù)據(jù)計算這3 種基本數(shù)據(jù)關(guān)系(見圖2),各類數(shù)據(jù)通過這3 種基本數(shù)據(jù)關(guān)系將輔助類數(shù)據(jù)、操作類數(shù)據(jù)和明細類數(shù)據(jù)最終聚合為統(tǒng)計類數(shù)據(jù)。需要說明的是,統(tǒng)計類數(shù)據(jù)與明細類數(shù)據(jù)實際上存在一定冗余,造成統(tǒng)計類數(shù)據(jù)與明細類數(shù)據(jù)同時存儲的原因主要有兩個方面:一是統(tǒng)計工作的實際需求。統(tǒng)計類數(shù)據(jù)往往在明細類數(shù)據(jù)匯總基礎上有所調(diào)整;二是明細數(shù)據(jù)的不完備性。很多明細數(shù)據(jù)無法獲取或獲取成本較高,統(tǒng)計類數(shù)據(jù)無法由明細類數(shù)據(jù)直接推出,往往由統(tǒng)計工作人員直接上報。

        圖2 交通統(tǒng)計數(shù)據(jù)基本數(shù)據(jù)關(guān)系

        3 交通統(tǒng)計數(shù)據(jù)基本描述形式

        交通統(tǒng)計數(shù)據(jù)庫的建模應充分考慮交通統(tǒng)計制度中的數(shù)據(jù)形式,交通統(tǒng)計數(shù)據(jù)信息通常由數(shù)據(jù)描述信息和數(shù)據(jù)值信息兩部分組成。數(shù)據(jù)值信息本身只是數(shù)字,并無具體含義,它只表示數(shù)量的大小。而數(shù)據(jù)描述信息則是對數(shù)據(jù)值信息的描述,交通統(tǒng)計數(shù)據(jù)主要包含指標名稱等7 類限定信息(如表2 所示)。交通統(tǒng)計數(shù)據(jù)完整的描述形式可采用式(1)表達形式。

        表2 交通統(tǒng)計數(shù)據(jù)基本限定信息

        交通統(tǒng)計數(shù)據(jù)=指標維度+機構(gòu)維度+周期維度+時間維度+單位維度+實體維度+特征維度(屬性1,屬性2,… ,屬性n)+ 指標值 (1)

        圖3 給出了某交通數(shù)據(jù)描述的具體實例,這種數(shù)據(jù)組織形式主要有3 個方面的優(yōu)點:①可以與現(xiàn)有的年報統(tǒng)計制度表格相對應,表格中每一個單元格數(shù)據(jù)都可以被描述,滿足了后期系統(tǒng)報表生成的需求;②一旦獲取基本維度信息,數(shù)據(jù)庫中數(shù)據(jù)可以被唯一確定;③可以實現(xiàn)靈活的自定義數(shù)據(jù)查詢功能。雖然該數(shù)據(jù)組織形式的數(shù)據(jù)維護成本較高,但它可以有效地將各種數(shù)據(jù)有機 融合,滿足系統(tǒng)復雜的數(shù)據(jù)操作需求。

        圖3 交通統(tǒng)計數(shù)據(jù)描述實例

        4 交通統(tǒng)計數(shù)據(jù)多維存儲模型架構(gòu)

        根據(jù)數(shù)據(jù)存儲的內(nèi)容及系統(tǒng)功能需求可將整個交通數(shù)據(jù)多維存儲模型劃分為系統(tǒng)數(shù)據(jù)區(qū)、明細數(shù)據(jù)區(qū)、統(tǒng)計數(shù)據(jù)描述區(qū)和統(tǒng)計值數(shù)據(jù)區(qū)4 個部分,如圖4 所示。系統(tǒng)數(shù)據(jù)區(qū)主要包含輔助類數(shù)據(jù)和操作類數(shù)據(jù)相關(guān)數(shù)據(jù)實體,其主要是滿足用戶登錄、數(shù)據(jù)審核等功能的數(shù)據(jù)存儲需求,部分數(shù)據(jù)實體可作為統(tǒng)計類數(shù)據(jù)的維表;明細類數(shù)據(jù)區(qū)主要包含一系列具體描述交通設備及設施的實體,可為統(tǒng)計類數(shù)據(jù)提供數(shù)據(jù)支持;統(tǒng)計數(shù)據(jù)描述區(qū)主要包含一系列統(tǒng)計數(shù)據(jù)值限定信息的抽象實體,對統(tǒng)計數(shù)據(jù)值進行描述;統(tǒng)計值數(shù)據(jù)區(qū)只包含一個事實表,主要記錄數(shù)字及數(shù)據(jù)提交時間信息,其數(shù)據(jù)含義通過統(tǒng)計數(shù)據(jù)描述區(qū)進行解釋。

        圖4 交通統(tǒng)計數(shù)據(jù)多維存儲模型

        交通統(tǒng)計數(shù)據(jù)多維存儲模型可以有效控制統(tǒng)計數(shù)據(jù)粒度,通過對統(tǒng)計數(shù)據(jù)描述體系的定義,確定統(tǒng)計數(shù)據(jù)各維度的基本描述單元,為交通統(tǒng)計分析系統(tǒng)提供動態(tài)靈活的數(shù)據(jù)查詢、匯總和分析功能[6-9]。當交通運輸統(tǒng)計年報制度發(fā)生改變時,無須變更數(shù)據(jù)庫結(jié)構(gòu),只需新增或修改數(shù)據(jù)描述區(qū)的相關(guān)實體存儲的數(shù)據(jù)內(nèi)容,即可在保證歷史數(shù)據(jù)含義統(tǒng)一的條件下適應新的數(shù)據(jù)存儲需求。交通統(tǒng)計數(shù)據(jù)存儲模型的基本數(shù)據(jù)查詢元組關(guān)系演算表達式可參見文獻[10],從中可以看出,一旦確定統(tǒng)計數(shù)據(jù)的基本維度信息即可確定其相關(guān)聯(lián)的唯一統(tǒng)計數(shù)值,統(tǒng)計數(shù)據(jù)的匯總分析也可以通過控制數(shù)據(jù)描述特征的查詢條件對結(jié)果集進行數(shù)值計算完成。

        5 結(jié)論

        交通統(tǒng)計數(shù)據(jù)多維存儲模型的構(gòu)建需要兼顧系統(tǒng)功能與數(shù)據(jù)優(yōu)化存儲兩方面的需求,其數(shù)據(jù)庫構(gòu)建有一定難度,運用多維數(shù)據(jù)模型理論可以將統(tǒng)計數(shù)據(jù)信息分解為多個維度的標準化單元,可有效地滿足系統(tǒng)數(shù)據(jù)挖掘的相關(guān)操作需求,保證交通統(tǒng)計分析系統(tǒng)功能的擴展與實現(xiàn)。交通統(tǒng)計數(shù)據(jù)多維存儲模型對結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)存儲具有廣泛適用性,相關(guān)技術(shù)對于交通大數(shù)據(jù)模型的建立也有一定借鑒意義。

        [1]張琪.交通運輸統(tǒng)計的現(xiàn)狀與發(fā)展[J]. 中國統(tǒng)計,2004(4):10 -11.

        [2]王珍珍. 交通部加快交通統(tǒng)計信息系統(tǒng)建設[N].中國交通報,2007 -07 -31(A01).

        [3]孔凡國,王先進. 我國交通統(tǒng)計信息工作發(fā)展規(guī)劃研究[J].交通世界,2002(7):23 -27.

        [4]HAN J W,KAMBER M,PEI J.數(shù)據(jù)挖掘概念與技術(shù)[M].范明,孟小峰,譯.3 版. 北京:機械工業(yè)出版社,2012:89 -99.

        [5]中國交通統(tǒng)計信息網(wǎng).交通統(tǒng)計制度[EB/OL].[2014-12-18].http://www.jttj.gov.cn /zhidu.asp.

        [6]吳薇,李志蜀.多維數(shù)據(jù)建模的設計方法[J]. 四川大學學報:自然科學版,2007,44(3):513 -516.

        [7]文俊浩,蔣渝,吳紅艷,等.復雜數(shù)據(jù)的多維數(shù)據(jù)模型應用研究[J].計算機應用研究,2004(4):139-142.

        [8]李盛恩,王珊.多維數(shù)據(jù)模型ER(H)[J].計算機學報,2005,28(12):2059 -2067.

        [9]湯艷艷,邵偉民,王子紅.數(shù)據(jù)倉庫中的多維數(shù)據(jù)模型及其對象關(guān)系的實現(xiàn)[J]. 計算機工程,2003,29(9):88 -92.

        [10]SILBERSCHATZ A,KORTH H F,SUDARSHAN S.數(shù)據(jù)庫系統(tǒng)概念[M].楊東青,李紅燕,唐世謂,等,譯.6 版.北京:機械工業(yè)出版社,2012:123-141.

        猜你喜歡
        統(tǒng)計數(shù)據(jù)數(shù)據(jù)庫信息
        創(chuàng)新視角下統(tǒng)計數(shù)據(jù)的提取與使用
        國際統(tǒng)計數(shù)據(jù)
        全球化(2018年6期)2018-09-10 21:29:09
        2017年居民消費統(tǒng)計數(shù)據(jù)資料
        訂閱信息
        中華手工(2017年2期)2017-06-06 23:00:31
        數(shù)據(jù)庫
        財經(jīng)(2017年2期)2017-03-10 14:35:35
        數(shù)據(jù)庫
        財經(jīng)(2016年15期)2016-06-03 07:38:02
        數(shù)據(jù)庫
        財經(jīng)(2016年3期)2016-03-07 07:44:46
        數(shù)據(jù)庫
        財經(jīng)(2016年6期)2016-02-24 07:41:51
        展會信息
        中外會展(2014年4期)2014-11-27 07:46:46
        統(tǒng)計數(shù)據(jù)
        暖暖视频在线观看免费| 久久99国产精品尤物| 精品午夜一区二区三区久久| 日本高清一区在线你懂得| 丰满少妇按摩被扣逼高潮| 小荡货奶真大水真多紧视频| 国产精品免费久久久免费| 国产一区二区三区免费小视频| 国内嫩模自拍诱惑免费视频| 小蜜被两老头吸奶头在线观看| 在线播放a欧美专区一区| 中文字幕国内一区二区| 国内自拍愉拍免费观看| 日韩欧群交p片内射中文| 欧美一区二区午夜福利在线yw| 中文字幕日韩一区二区不卡| 影音先锋久久久久av综合网成人| 国产sm调教视频在线观看| 久久水蜜桃亚洲av无码精品麻豆| 神马不卡影院在线播放| 国产乱人无码伦av在线a| 亚洲一区av无码少妇电影| 国产成人一区二区三区影院免费| 亚洲中文字幕高清av| 人妻夜夜爽天天爽三区| 午夜高清福利| 国产黄色一级到三级视频| 一级一片内射视频网址| 午夜免费视频| 国产成人国产在线观看入口| 亚洲综合免费在线视频| 蜜桃视频在线看一区二区三区 | 亚洲av纯肉无码精品动漫| 99热在线播放精品6| 99久久婷婷国产一区| 国产成人精品无码一区二区老年人| 囯产精品无码va一区二区| 亚洲国产大胸一区二区三区| 精品国产综合区久久久久久| 亚洲爆乳无码专区| 中文字幕中乱码一区无线精品 |