亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        數(shù)據(jù)挖掘在政府信息系統(tǒng)設(shè)計(jì)中的應(yīng)用研究

        2010-10-08 05:58:52住房和城鄉(xiāng)建設(shè)部信息中心郭理橋
        中國(guó)建設(shè)信息化 2010年4期
        關(guān)鍵詞:數(shù)據(jù)挖掘數(shù)據(jù)庫(kù)信息

        ◎ 住房和城鄉(xiāng)建設(shè)部信息中心 郭理橋

        1、引言

        隨著網(wǎng)絡(luò)技術(shù)和數(shù)據(jù)庫(kù)技術(shù)的飛速發(fā)展,政府的信息化進(jìn)程正在逐漸加快。政府信息化,就是指政府行政管理方式、內(nèi)容和手段的數(shù)字化、網(wǎng)絡(luò)化和智能化。當(dāng)今,人們對(duì)政府和職能部門(mén)高效運(yùn)轉(zhuǎn)的要求越來(lái)越高,政府重塑理論和新公共管理理論也在逐漸發(fā)展。電子政務(wù)自產(chǎn)生后就得到了快速發(fā)展并且迅速成為支持政府從傳統(tǒng)的管理方式向新型管理體系轉(zhuǎn)變的重要技術(shù)保證。電子政務(wù)的核心是利用信息技術(shù)優(yōu)化提高行政效率,實(shí)現(xiàn)行政和日常事務(wù)的優(yōu)化,建立政府、社會(huì)和公眾之間的有機(jī)互動(dòng)。經(jīng)過(guò)最近幾年電子政務(wù)基礎(chǔ)資源的大規(guī)模建設(shè),海量政務(wù)信息資源挖掘和電子政務(wù)知識(shí)管理等深層次應(yīng)用正逐步進(jìn)入電子政務(wù)舞臺(tái),對(duì)電子政務(wù)實(shí)施數(shù)據(jù)挖掘?qū)⒊蔀檎畔⒒囊粋€(gè)新的研究方向。

        2、數(shù)據(jù)挖掘理論概述

        數(shù)據(jù)挖掘(Data Mining)又稱(chēng)數(shù)據(jù)庫(kù)中的知識(shí)發(fā)現(xiàn),是指從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的實(shí)際應(yīng)用數(shù)據(jù)中,提取隱含在其中的、人們事先不知道的,但又是潛在有用的信息和知識(shí)的過(guò)程。對(duì)信息和知識(shí)的需求來(lái)自各行各業(yè),從商業(yè)管理、生產(chǎn)控制、市場(chǎng)分析到工程設(shè)計(jì)、科學(xué)探索等,數(shù)據(jù)挖掘作為一個(gè)新興的多學(xué)科交叉應(yīng)用領(lǐng)域,正在各行各業(yè)的決策支持活動(dòng)中扮演著越來(lái)越重要的角色。

        2.1、數(shù)據(jù)挖掘過(guò)程

        數(shù)據(jù)挖掘的工作過(guò)程從技術(shù)上可分為:數(shù)據(jù)的歸集、數(shù)據(jù)的存儲(chǔ)和管理、數(shù)據(jù)的展現(xiàn)等關(guān)鍵技術(shù)。

        (1)數(shù)據(jù)的歸集:數(shù)據(jù)的歸集是數(shù)據(jù)進(jìn)入倉(cāng)庫(kù)的入口。由于數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)獨(dú)立的數(shù)據(jù)環(huán)境,它需要通過(guò)歸集過(guò)程將數(shù)據(jù)從聯(lián)機(jī)事務(wù)處理系統(tǒng)、外部數(shù)據(jù)源、脫機(jī)的數(shù)據(jù)存儲(chǔ)介質(zhì)中導(dǎo)入數(shù)據(jù)倉(cāng)庫(kù)。數(shù)據(jù)歸集在技術(shù)上主要涉及互連、復(fù)制、增量、轉(zhuǎn)換、調(diào)度和監(jiān)控等方面的處理。在數(shù)據(jù)歸集方面,未來(lái)的技術(shù)發(fā)展將集中在系統(tǒng)功能集成化方面,以適應(yīng)數(shù)據(jù)倉(cāng)庫(kù)本身或數(shù)據(jù)源的變化,使系統(tǒng)更便于管理和維護(hù)。

        (2)數(shù)據(jù)的存儲(chǔ)和管理:數(shù)據(jù)倉(cāng)庫(kù)的組織管理方式?jīng)Q定了它有別于傳統(tǒng)數(shù)據(jù)庫(kù)的特性,也決定了其對(duì)外部數(shù)據(jù)的表現(xiàn)形式。數(shù)據(jù)倉(cāng)庫(kù)管理所涉及的數(shù)據(jù)量比傳統(tǒng)事務(wù)處理大得多,且隨時(shí)間的推移而快速累積。在數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)存儲(chǔ)和管理中需要解決的是如何管理大量的數(shù)據(jù)、如何并行處理大量的數(shù)據(jù)、如何優(yōu)化查詢(xún)等。

        (3)數(shù)據(jù)的展現(xiàn):在數(shù)據(jù)展現(xiàn)方面主要的方式有:

        查詢(xún):實(shí)現(xiàn)預(yù)定義查詢(xún)、動(dòng)態(tài)查詢(xún)、OLAP查詢(xún)與決策支持智能查詢(xún);

        報(bào)表:產(chǎn)生關(guān)系數(shù)據(jù)表格、復(fù)雜表格、OLAP表格、報(bào)告以及各種綜合報(bào)表;

        可視化:用易于理解的點(diǎn)線(xiàn)圖、直方圖、餅圖、網(wǎng)狀圖、交互式可視化、動(dòng)態(tài)模擬、計(jì)算機(jī)動(dòng)畫(huà)技術(shù)表現(xiàn)復(fù)雜數(shù)據(jù)及其相互關(guān)系;

        統(tǒng)計(jì):進(jìn)行平均值、最大值、最小值、期望、方差、匯總、排序等各種統(tǒng)計(jì)分析;

        挖掘:利用數(shù)據(jù)挖掘等方法,從數(shù)據(jù)中得到關(guān)于數(shù)據(jù)關(guān)系和模式的知識(shí)。

        從數(shù)據(jù)分析的角度,數(shù)據(jù)挖掘?qū)崿F(xiàn)的功能可以分為:描述式數(shù)據(jù)挖掘和預(yù)測(cè)式數(shù)據(jù)挖掘。描述式數(shù)據(jù)挖掘以簡(jiǎn)捷概要的方式描述數(shù)據(jù),預(yù)測(cè)式數(shù)據(jù)挖掘則通過(guò)分析建立模型并試圖預(yù)測(cè)新數(shù)據(jù)集的行為。

        2.2、數(shù)據(jù)預(yù)處理

        數(shù)據(jù)預(yù)處理是數(shù)據(jù)挖掘過(guò)程中第一個(gè)重要處理步驟,涉及數(shù)據(jù)清洗、數(shù)據(jù)集成、數(shù)據(jù)轉(zhuǎn)換和數(shù)據(jù)消減等主要處理方法。

        數(shù)據(jù)清洗,主要用于填補(bǔ)數(shù)據(jù)記錄中(各屬性)的遺漏數(shù)據(jù),識(shí)別異常數(shù)據(jù),以及糾正數(shù)據(jù)中的不一致問(wèn)題。數(shù)據(jù)集成,主要用于將來(lái)自多個(gè)數(shù)據(jù)源的數(shù)據(jù)合并到一起并形成完整的數(shù)據(jù)集合。數(shù)據(jù)轉(zhuǎn)換,主要用于將數(shù)據(jù)轉(zhuǎn)換成適合數(shù)據(jù)挖掘的形式。如:規(guī)格化數(shù)據(jù)處理。數(shù)據(jù)消減,主要方法包括:數(shù)據(jù)立方合計(jì)、維度消減、數(shù)據(jù)壓縮、數(shù)據(jù)塊消減和離散化。這些方法主要用于在保證原來(lái)數(shù)據(jù)信息內(nèi)涵減少最小化的同時(shí)對(duì)原來(lái)數(shù)據(jù)規(guī)模進(jìn)行消減,并提出一個(gè)簡(jiǎn)潔的數(shù)據(jù)表示。

        2.3、數(shù)據(jù)挖掘中的關(guān)聯(lián)規(guī)則

        數(shù)據(jù)關(guān)聯(lián)是數(shù)據(jù)庫(kù)中存在的一類(lèi)重要的可被發(fā)現(xiàn)的知識(shí)。若兩個(gè)或多個(gè)變量的取值之間存在某種規(guī)律性,就稱(chēng)為關(guān)聯(lián)。關(guān)聯(lián)可分為簡(jiǎn)單關(guān)聯(lián)、時(shí)序關(guān)聯(lián)、因果關(guān)聯(lián)。關(guān)聯(lián)規(guī)則挖掘就是從大量的數(shù)據(jù)中挖掘出有價(jià)值描述數(shù)據(jù)項(xiàng)之間相互聯(lián)系的有關(guān)知識(shí)。隨著收集和存儲(chǔ)在數(shù)據(jù)庫(kù)中的數(shù)據(jù)規(guī)模越來(lái)越大,人們對(duì)從這些數(shù)據(jù)中挖掘相應(yīng)的關(guān)聯(lián)知識(shí)越來(lái)越有興趣。關(guān)聯(lián)規(guī)則挖掘過(guò)程主要包含兩個(gè)階段:第一階段必須先從資料集合中找出所有的高頻項(xiàng)目組(Frequent Itemsets),第二階段再由這些高頻項(xiàng)目組中產(chǎn)生關(guān)聯(lián)規(guī)則(Association Rules)。關(guān)聯(lián)規(guī)則挖掘的相關(guān)算法主要有:Apriori算法、基于劃分的算法、FP-樹(shù)頻集算法。近年來(lái)大量研究從不同的角度對(duì)關(guān)聯(lián)規(guī)則做了擴(kuò)展,將更多的因素集成到關(guān)聯(lián)規(guī)則挖掘方法之中,以此豐富關(guān)聯(lián)規(guī)則的應(yīng)用領(lǐng)域,拓寬支持管理決策的范圍。

        2.4、數(shù)據(jù)挖掘中的聚類(lèi)分析

        聚類(lèi)(Clustering)是一個(gè)將數(shù)據(jù)集劃分為若干組(class)或類(lèi)(cluster)的過(guò)程,并使得同一個(gè)組內(nèi)的數(shù)據(jù)對(duì)象具有較高的相似度;而不同組中的數(shù)據(jù)對(duì)象是不相似的。相似或不相似的描述是基于數(shù)據(jù)描述屬性的取值來(lái)確定的。聚類(lèi)分析所涉及的領(lǐng)域包括:數(shù)據(jù)挖掘、統(tǒng)計(jì)學(xué)、機(jī)器學(xué)習(xí)、空間數(shù)據(jù)庫(kù)技術(shù)、生物學(xué)和市場(chǎng)學(xué)等。聚類(lèi)分析是數(shù)據(jù)挖掘中的一個(gè)很活躍的研究領(lǐng)域,已提出的聚類(lèi)算法可以被分為劃分方法、層次方法、基于密度方法、基于網(wǎng)格方法和基于模型方法。

        由于各應(yīng)用數(shù)據(jù)庫(kù)所包含的數(shù)據(jù)量越來(lái)越大,聚類(lèi)分析已成為數(shù)據(jù)挖掘研究中一個(gè)非?;钴S的研究課題,以下就是對(duì)數(shù)據(jù)挖掘中的聚類(lèi)分析的一些典型要求:

        (1)可擴(kuò)展性。許多聚類(lèi)算法在小數(shù)據(jù)集(少于200個(gè)數(shù)據(jù)對(duì)象)時(shí)可以工作很好;但一個(gè)大數(shù)據(jù)庫(kù)可能會(huì)包含數(shù)以百萬(wàn)的對(duì)象。利用采樣方法進(jìn)行聚類(lèi)分析可能得到一個(gè)有偏差的結(jié)果,這時(shí)就需要可擴(kuò)展的聚類(lèi)分析算法。

        (2)處理不同類(lèi)型屬性的能力。許多算法是針對(duì)基于區(qū)間的數(shù)值屬性而設(shè)計(jì)的。但是有些應(yīng)用需要對(duì)其它類(lèi)型數(shù)據(jù),如:二值類(lèi)型、符號(hào)類(lèi)型、順序類(lèi)型,或這些數(shù)據(jù)類(lèi)型的組合。

        (3)發(fā)現(xiàn)任意形狀的聚類(lèi)。許多聚類(lèi)算法是根據(jù)歐氏距離和Manhattan距離來(lái)進(jìn)行聚類(lèi)的?;谶@類(lèi)距離的聚類(lèi)方法一般只能發(fā)現(xiàn)具有類(lèi)似大小和密度的圓形或球狀聚類(lèi)。而實(shí)際上一個(gè)聚類(lèi)是可以具有任意形狀的,因此設(shè)計(jì)出能夠發(fā)現(xiàn)任意形狀類(lèi)集的聚類(lèi)算法是非常重要的。

        (4)處理噪聲數(shù)據(jù)的能力。大多數(shù)現(xiàn)實(shí)世界的數(shù)據(jù)庫(kù)均包含異常數(shù)據(jù)、不明數(shù)據(jù)、數(shù)據(jù)丟失和噪聲數(shù)據(jù),有些聚類(lèi)算法對(duì)這樣的數(shù)據(jù)非常敏感并會(huì)導(dǎo)致獲得質(zhì)量較差的數(shù)據(jù)。

        (5)高維問(wèn)題。一個(gè)數(shù)據(jù)庫(kù)或一個(gè)數(shù)據(jù)倉(cāng)庫(kù)或許包含若干維或?qū)傩?。許多聚類(lèi)算法在處理低維數(shù)據(jù)時(shí)(僅包含二到三個(gè)維)時(shí)表現(xiàn)很好。人的視覺(jué)也可以幫助判斷多至三維的數(shù)據(jù)聚類(lèi)分析質(zhì)量。然而設(shè)計(jì)對(duì)高維空間中的數(shù)據(jù)對(duì)象,特別是對(duì)高維空間稀疏和怪異分布的數(shù)據(jù)對(duì)象,能進(jìn)行較好聚類(lèi)分析的聚類(lèi)算法已成為聚類(lèi)研究中的一項(xiàng)挑戰(zhàn)。

        (6)基于約束的聚類(lèi)?,F(xiàn)實(shí)世界中的應(yīng)用可能需要在各種約束之下進(jìn)行聚類(lèi)分析。假設(shè)需要在一個(gè)城市中確定一些新加油站的位置,就需要考慮諸如:城市中的河流、高速路,以及每個(gè)區(qū)域的客戶(hù)需求等約束情況下居民住地的聚類(lèi)分析。設(shè)計(jì)能夠發(fā)現(xiàn)滿(mǎn)足特定約束條件且具有較好聚類(lèi)質(zhì)量的聚類(lèi)算法也是一個(gè)重要聚類(lèi)研究任務(wù)。

        (7)可解釋性和可用性。用戶(hù)往往希望聚類(lèi)結(jié)果是可理解的、可解釋的,以及可用的。這就需要聚類(lèi)分析要與特定的解釋和應(yīng)用聯(lián)系在一起。因此研究一個(gè)應(yīng)用的目標(biāo)是如何影響聚類(lèi)方法選擇也是非常重要的。

        3、數(shù)據(jù)挖掘與電子政務(wù)現(xiàn)狀分析

        經(jīng)過(guò)多年的實(shí)踐,我國(guó)電子政務(wù)建設(shè)和應(yīng)用已初見(jiàn)成效。人口基礎(chǔ)信息庫(kù)、法人單位基礎(chǔ)信息庫(kù)、自然資源和空間地理基礎(chǔ)數(shù)據(jù)庫(kù)、宏觀(guān)經(jīng)濟(jì)數(shù)據(jù)庫(kù)的建立產(chǎn)生了海量的空間數(shù)據(jù)和非空間數(shù)據(jù)。這些數(shù)據(jù)中隱藏了豐富的知識(shí)和規(guī)則,但目前的許多系統(tǒng)只是實(shí)現(xiàn)數(shù)據(jù)的輸入、查詢(xún)、統(tǒng)計(jì)等功能,難以發(fā)現(xiàn)數(shù)據(jù)中存在的關(guān)聯(lián)、關(guān)系和規(guī)則,無(wú)法從大量的數(shù)據(jù)中提取有用信息以預(yù)測(cè)發(fā)展趨勢(shì)。從海量的數(shù)據(jù)中提取出這些規(guī)則,將有望為電子政務(wù)空間輔助決策系統(tǒng)建立提供支持。在電子政務(wù)中數(shù)據(jù)挖掘的常用方法主要有決策樹(shù)方法、統(tǒng)計(jì)的方法、歸納法、神經(jīng)網(wǎng)絡(luò)方法、遺傳算法、粗糙集方法、人工智能、模糊集方法等。

        3.1 現(xiàn)有信息系統(tǒng)常見(jiàn)缺陷

        當(dāng)前政府機(jī)關(guān)的各種應(yīng)用信息系統(tǒng)雖然已經(jīng)基本上建立起來(lái),但是各種信息系統(tǒng)在建立之前,缺乏數(shù)據(jù)信息和系統(tǒng)的統(tǒng)一標(biāo)準(zhǔn)接口的規(guī)劃,使得整個(gè)信息系統(tǒng)有如下缺陷:

        (1)數(shù)據(jù)格式多種多樣,一致性較差,存在數(shù)據(jù)冗余;

        (2)數(shù)據(jù)來(lái)源多,數(shù)據(jù)存放分散,缺乏統(tǒng)一管理和聯(lián)系;

        (3)數(shù)據(jù)量雖大,但對(duì)數(shù)據(jù)資源的開(kāi)發(fā)利用不充分。

        3.2 電子政務(wù)對(duì)數(shù)據(jù)挖掘技術(shù)的要求

        (1)降低成本、減少財(cái)政開(kāi)支。數(shù)據(jù)挖掘技術(shù)的應(yīng)用可以打破各級(jí)政府之間文件傳遞的繁瑣性,用快捷的電子方式在政府上下級(jí)之間進(jìn)行信息傳遞。不僅降低了政府辦公用品及相關(guān)開(kāi)銷(xiāo),而且無(wú)形中節(jié)約了大量的時(shí)間、減少了大量的額外開(kāi)支,大大提高了工作效率。

        (2)提供實(shí)時(shí)、有效的信息。政府部門(mén)若要充分發(fā)揮其職能作用,就必須進(jìn)行及時(shí)、有效的監(jiān)控和管理。數(shù)據(jù)挖掘技術(shù)可以幫助增強(qiáng)公眾與政府間溝通、通訊的時(shí)效性,保證雙方都可以及時(shí)、準(zhǔn)確地掌握到有效信息,建立起一個(gè)可以有效收集、監(jiān)理、分析所獲數(shù)據(jù)的系統(tǒng)。

        (3)提供形勢(shì)分析與決策支持。電子政務(wù)中的數(shù)據(jù)挖掘技術(shù),可以對(duì)政務(wù)系統(tǒng)中的海量數(shù)據(jù)進(jìn)行開(kāi)采、挖掘和分析,從中識(shí)別、抽取隱含信息,并利用這些信息為政府部門(mén)重大決策、法規(guī)的制定提供依據(jù)。

        (4)提供功能強(qiáng)大的搜索引擎。數(shù)據(jù)挖掘技術(shù)是目前網(wǎng)絡(luò)信息檢索發(fā)展的一個(gè)關(guān)鍵。如通過(guò)對(duì)網(wǎng)頁(yè)內(nèi)容的挖掘,可以實(shí)現(xiàn)對(duì)網(wǎng)頁(yè)的聚類(lèi)、分類(lèi),實(shí)現(xiàn)網(wǎng)絡(luò)信息的分類(lèi)瀏覽與檢索;同時(shí),通過(guò)對(duì)用戶(hù)所使用的提問(wèn)式歷史記錄的分析,可以有效進(jìn)行提問(wèn)擴(kuò)展,提高檢索效果;另外,運(yùn)用數(shù)據(jù)挖掘技術(shù)還可以改進(jìn)關(guān)鍵詞加權(quán)算法、提高網(wǎng)絡(luò)信息的標(biāo)引準(zhǔn)確度,從而改善檢索效果,大大提高電子政務(wù)處理的效果和效率。

        4、基于數(shù)據(jù)挖掘的實(shí)際系統(tǒng)設(shè)計(jì)

        2007年,我在杭州市主持建設(shè)政務(wù)信息資源共享與業(yè)務(wù)協(xié)同項(xiàng)目,建立了市級(jí)政府各部門(mén)之間的目錄體系與交換體系,利用目錄和交換體系的基礎(chǔ)支撐作用,實(shí)現(xiàn)經(jīng)濟(jì)調(diào)節(jié)、市場(chǎng)監(jiān)管、社會(huì)管理、公共服務(wù)四大政府職能領(lǐng)域的多項(xiàng)業(yè)務(wù)協(xié)同應(yīng)用?,F(xiàn)有交換體系是基于Tibco的交換中間件產(chǎn)品構(gòu)建的交換平臺(tái),任何一項(xiàng)數(shù)據(jù)交換需求都需要獨(dú)立進(jìn)行交換設(shè)計(jì)和流程部署。在交換部門(mén)不斷增加、交換需求也日益增多的情況下,交換平臺(tái)的監(jiān)控與管理就顯得日益復(fù)雜,重新優(yōu)化設(shè)計(jì)交換模式就顯得尤為需要。

        4.1 目錄和交換體系設(shè)計(jì)總體目標(biāo)

        基于人口與法人單位數(shù)據(jù)庫(kù),具備初步的數(shù)據(jù)挖掘、分析和預(yù)警能力,支持初步的輔助決策要求?;跀?shù)據(jù)挖掘的需求建立主題庫(kù),以利于進(jìn)一步工作。系統(tǒng)設(shè)計(jì)的主要任務(wù)是建立三個(gè)主要的功能模塊:個(gè)人信息數(shù)據(jù)分析功能模塊、法人信息數(shù)據(jù)分析功能模塊和個(gè)人與法人信息數(shù)據(jù)分析功能模塊。

        4.2 目錄和交換體系架構(gòu)

        以電子政務(wù)外網(wǎng)為基礎(chǔ),構(gòu)建包含交換中心和資源目錄中心以及部門(mén)交換節(jié)點(diǎn)在內(nèi)的政務(wù)信息資源綜合交換平臺(tái)。各業(yè)務(wù)部門(mén)通過(guò)交換體系的通用橋接系統(tǒng)將本部門(mén)的業(yè)務(wù)信息發(fā)布到共享信息庫(kù)中,并根據(jù)協(xié)同應(yīng)用規(guī)范編制并部署有關(guān)服務(wù)應(yīng)用。通過(guò)目錄體系的編目軟件將包括服務(wù)的信息進(jìn)行編目操作提交到中心審核并發(fā)布。使用部門(mén)通過(guò)目錄分類(lèi)查找信息資源并根據(jù)有關(guān)規(guī)章制度進(jìn)行信息資源的索?。ㄈ耍瓩C(jī)界面)、信息資源的交換(機(jī)-機(jī)界面)和信息服務(wù)的調(diào)用(機(jī)-機(jī)界面)。目錄中心與交換中心提供共享目錄服務(wù)與交換服務(wù)和四大基礎(chǔ)信息庫(kù),為業(yè)務(wù)協(xié)同應(yīng)用提供支撐服務(wù)。

        圖4.1 系統(tǒng)架構(gòu)圖

        現(xiàn)有的前置機(jī)系統(tǒng)存在比較普遍的“一數(shù)多源”現(xiàn)象,在此基礎(chǔ)之上構(gòu)建數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)存在一定的困難,數(shù)據(jù)的清洗和校驗(yàn)必須有既定的數(shù)據(jù)標(biāo)準(zhǔn),因此有必要在現(xiàn)有系統(tǒng)基礎(chǔ)之上構(gòu)建標(biāo)準(zhǔn)的共享信息庫(kù)。

        處理流程和數(shù)據(jù)流程包括:

        (1)根據(jù)現(xiàn)有的前置機(jī)數(shù)據(jù),對(duì)共享數(shù)據(jù)指標(biāo)項(xiàng)進(jìn)行多方比對(duì)和校驗(yàn),之后存入中心共享數(shù)據(jù)庫(kù),作為標(biāo)準(zhǔn)共享數(shù)據(jù)供所有部門(mén)使用。

        (2)根據(jù)部門(mén)業(yè)務(wù)數(shù)據(jù)庫(kù)構(gòu)建部門(mén)共享信息庫(kù),和中心共享信息庫(kù)的指標(biāo)進(jìn)行比對(duì)校驗(yàn),和中心共享標(biāo)準(zhǔn)數(shù)據(jù)不符的,以中心數(shù)據(jù)為準(zhǔn)存入部門(mén)共享信息庫(kù)。

        (3)根據(jù)部門(mén)共享信息庫(kù)和中心共享信息庫(kù)的數(shù)據(jù),構(gòu)建數(shù)據(jù)倉(cāng)庫(kù),提供人口和法人數(shù)據(jù)挖掘信息,作為輔助決策依據(jù)。

        4.3 數(shù)據(jù)挖掘?qū)哟谓Y(jié)構(gòu)分析

        在數(shù)據(jù)采集層中(即前置機(jī)部分),其數(shù)據(jù)內(nèi)容是依靠事先約定由各個(gè)相關(guān)業(yè)務(wù)部門(mén)提供,這些數(shù)據(jù)是后續(xù)數(shù)據(jù)分析的根本。

        在數(shù)據(jù)存儲(chǔ)層中,將根據(jù)數(shù)據(jù)采集層中提供的數(shù)據(jù)源,建立數(shù)據(jù)核心級(jí)的數(shù)據(jù)倉(cāng)庫(kù)。數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù),依據(jù)大數(shù)據(jù)量的建庫(kù)模型,形成多數(shù)據(jù)源的索引數(shù)據(jù)結(jié)構(gòu)。這種數(shù)據(jù)結(jié)構(gòu)既解決后續(xù)數(shù)據(jù)分析請(qǐng)求的及時(shí)響應(yīng),又要解決與數(shù)據(jù)采集層中數(shù)據(jù)源的及時(shí)性數(shù)據(jù)同步。數(shù)據(jù)倉(cāng)庫(kù)是系統(tǒng)的數(shù)據(jù)存儲(chǔ)核心。

        圖4.2 數(shù)據(jù)挖掘?qū)哟谓Y(jié)構(gòu)圖

        圖4.3 數(shù)據(jù)挖掘流程分析圖

        在數(shù)據(jù)分析層中,依據(jù)數(shù)據(jù)源與數(shù)據(jù)應(yīng)用,將建立多種數(shù)據(jù)分析模型。這些數(shù)據(jù)模型都作為不同應(yīng)用而采用不同的數(shù)據(jù)算法,并能將雜亂的數(shù)據(jù)信息轉(zhuǎn)換為應(yīng)用數(shù)據(jù)結(jié)構(gòu)。數(shù)據(jù)模型是系統(tǒng)的技術(shù)算法核心。

        在數(shù)據(jù)展現(xiàn)層中,依據(jù)數(shù)據(jù)分析層提供的數(shù)據(jù)分析結(jié)果,將數(shù)據(jù)結(jié)果通過(guò)易用的B/S模式提供給使用者與管理者。

        4.4 數(shù)據(jù)挖掘流程分析

        首先,數(shù)據(jù)采集層中提取各業(yè)務(wù)部門(mén)的數(shù)據(jù)源,這里的數(shù)據(jù)傳輸是業(yè)務(wù)部門(mén)主動(dòng)的單向推送數(shù)據(jù)至前置機(jī)中,系統(tǒng)不會(huì)操作業(yè)務(wù)部門(mén)的數(shù)據(jù)庫(kù),保障業(yè)務(wù)部門(mén)原始數(shù)據(jù)的安全性和穩(wěn)定性。在業(yè)務(wù)數(shù)據(jù)到達(dá)前置機(jī)后,系統(tǒng)的預(yù)處理過(guò)程同時(shí)會(huì)對(duì)數(shù)據(jù)進(jìn)行初次清理,主要會(huì)處理數(shù)據(jù)的唯一性、可用性,以及數(shù)據(jù)不完整時(shí)做標(biāo)記提供后續(xù)工作的依據(jù)。

        其次,數(shù)據(jù)經(jīng)過(guò)采集層后,將依據(jù)數(shù)據(jù)儲(chǔ)存模型,建立核心的數(shù)據(jù)倉(cāng)庫(kù)。各個(gè)數(shù)據(jù)源數(shù)據(jù)匯總至數(shù)據(jù)倉(cāng)庫(kù),并依據(jù)不同業(yè)務(wù)類(lèi)型、數(shù)據(jù)類(lèi)型等關(guān)鍵信息,存儲(chǔ)完成的數(shù)據(jù)內(nèi)容,建立關(guān)鍵信息索引。

        之后,各數(shù)據(jù)處理模型,依據(jù)應(yīng)用的請(qǐng)求,從數(shù)據(jù)倉(cāng)庫(kù)中查詢(xún)、提取、索引相關(guān)的數(shù)據(jù)集,綜合處理不同數(shù)據(jù)類(lèi)型,轉(zhuǎn)化為可展現(xiàn)的結(jié)果集,提供給數(shù)據(jù)展現(xiàn)層。

        最后,數(shù)據(jù)展現(xiàn)層將數(shù)據(jù)提供的終端顯示給使用者與管理者 。

        4.5 系統(tǒng)技術(shù)特點(diǎn)

        (1)系統(tǒng)的安全性

        系統(tǒng)的安全是整個(gè)系統(tǒng)的重要部分,政務(wù)信息數(shù)據(jù)是政府的重要資源,數(shù)據(jù)挖掘功能是輔助決策工作的重要補(bǔ)充,建立完善的安全體系,保障系統(tǒng)安全,保證數(shù)據(jù)安全,是方案的主要內(nèi)容。數(shù)據(jù)挖掘系統(tǒng)的主要安全需求有:應(yīng)用安全、網(wǎng)絡(luò)的安全管理、入侵檢測(cè)與監(jiān)控、主機(jī)防護(hù)和訪(fǎng)問(wèn)控制、身份認(rèn)證、信息記錄和安全審計(jì)、病毒防護(hù)、數(shù)據(jù)備份與恢復(fù)、安全集中管理。

        (2)系統(tǒng)的擴(kuò)展性

        數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)是一個(gè)面向未來(lái)的分析系統(tǒng),數(shù)據(jù)與業(yè)務(wù)的發(fā)展對(duì)該系統(tǒng)的未來(lái)產(chǎn)生最大的影響,因此系統(tǒng)的設(shè)計(jì)必須著眼于未來(lái),具備良好的擴(kuò)展性。系統(tǒng)的擴(kuò)展性主要針對(duì)系統(tǒng)容量擴(kuò)展、系統(tǒng)性能擴(kuò)展和系統(tǒng)應(yīng)用功能擴(kuò)展三個(gè)方面。

        5、結(jié)論

        利用數(shù)據(jù)挖掘技術(shù)建設(shè)目錄體系和交換體系,可以向政府工作人員提供個(gè)性化的多維信息,使分析處理信息的能力大為提高,并幫助決策者更快、更好地制定和做出決策,進(jìn)而實(shí)現(xiàn)政府職能部門(mén)的多項(xiàng)業(yè)務(wù)協(xié)同應(yīng)用。數(shù)據(jù)挖掘是電子政務(wù)一項(xiàng)重要的應(yīng)用技術(shù)和支持技術(shù),可以為各級(jí)政府的決策提供科學(xué)的依據(jù),提高各項(xiàng)政策制訂的科學(xué)性和合理性。隨著分析決策難度的增強(qiáng),人們對(duì)決策分析工作的智能化、自動(dòng)化要求越來(lái)越高,數(shù)據(jù)挖掘?qū)⒊蔀閷?shí)現(xiàn)政府決策支持的核心技術(shù),以數(shù)據(jù)挖掘?yàn)橐劳械恼疀Q策支持系統(tǒng)將發(fā)揮重要作用。今后電子政務(wù)研究的重點(diǎn)主要包括研究實(shí)用的數(shù)據(jù)挖掘算法,開(kāi)發(fā)業(yè)務(wù)型數(shù)據(jù)挖掘平臺(tái)和工具,實(shí)現(xiàn)其與電子政務(wù)系統(tǒng)的集成,促進(jìn)電子政務(wù)向智能化分析的發(fā)展。

        猜你喜歡
        數(shù)據(jù)挖掘數(shù)據(jù)庫(kù)信息
        探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
        訂閱信息
        中華手工(2017年2期)2017-06-06 23:00:31
        基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
        電力與能源(2017年6期)2017-05-14 06:19:37
        數(shù)據(jù)庫(kù)
        數(shù)據(jù)庫(kù)
        數(shù)據(jù)庫(kù)
        數(shù)據(jù)庫(kù)
        一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
        展會(huì)信息
        基于GPGPU的離散數(shù)據(jù)挖掘研究
        亚洲第一女人的天堂av| 亚洲国产一区在线二区三区| 国产午夜亚洲精品一级在线| 少妇又色又爽又刺激的视频| 国产白浆一区二区三区性色| 无人高清电视剧在线观看| 丁香综合网| 久久爱91精品国产一区| 男女啪啪视频高清视频| 中文字幕久久熟女蜜桃 | 看国产黄大片在线观看| 成年女人在线观看毛片| 亚洲综合小综合中文字幕| 狠狠色丁香婷婷综合潮喷| 在线观看国产视频你懂得| 日韩av无码精品一二三区| 久久香蕉国产精品一区二区三| 国产亚洲精品日韩综合网| 美国又粗又长久久性黄大片| 久久久国产精品黄毛片| 无码国内精品久久人妻| 越南女子杂交内射bbwxz| 亚洲公开免费在线视频| 国产精品麻豆一区二区三区 | 精品九九人人做人人爱| 波多野吉衣av无码| 中文字幕亚洲无线码高清| 国产精品第一区亚洲精品| 在线视频夫妻内射| 国产乱子伦视频大全| 女女同性黄网在线观看| 国产在线视频一区二区三区| 天天躁夜夜躁狠狠是什么心态 | 一区二区日韩国产精品| 激情视频国产在线观看| 四虎永久在线精品免费网址| a级毛片100部免费观看| 99亚洲精品久久久99| 日韩精品首页在线观看 | 国产一区二区三区毛片| 国内精品伊人久久久久影院对白|