廖飛
(重慶市信息通信咨詢設計院有限公司,重慶 400041)
在科學和技術水平高度發(fā)達的今天,各行企業(yè)都已經(jīng)逐漸地進入到一個電子和信息化的辦公時期。對于一些政府機構而言,電子信息技術把傳統(tǒng)意義上的事務性辦公方式轉(zhuǎn)變?yōu)橐环N更加符合新時期潮流的有效性辦公方式。既方便了人民和廣大群眾,又有利于優(yōu)化組織結構,同時也調(diào)動了政務機關的積極性。政府承載著領導和管理整個社會的重要責任,它處置的問題及其解決問題的能力與否直接關系到每個公民的切身利益。尤其是在移動互聯(lián)網(wǎng)的今天,大多數(shù)部門的資料都是通過網(wǎng)絡進行傳播與存儲。所以我們想要做到更好的處理這些信息,就一定需要進行政府機構的電子辦公化。然后在此基礎上,大力發(fā)展與其相關的技術,從而進一步實現(xiàn)經(jīng)濟社會全局的信息化。本文主要是通過探究如何在電子政務中應用的數(shù)據(jù)分析挖掘等技術,尋找更加便捷的途徑,為構建和諧信息社會奠定良好的基礎。
數(shù)據(jù)挖掘技術也可以稱為數(shù)據(jù)采集或者是數(shù)據(jù)開發(fā),它主要指的就是一種泛指從各種類型的大型數(shù)據(jù)庫中收集得到的信息和數(shù)據(jù),并且提供給了人們所需要和感興趣的信息,而這些信息和知識都實際上是一種隱藏著事前不為人知和潛在有用資料。原始數(shù)據(jù)大多是一種結構性的,比如文字、圖形和影像等數(shù)據(jù),甚至還包括了各種不同的分布式網(wǎng)絡中的異構化數(shù)據(jù)。發(fā)現(xiàn)其知識的途徑和方法既可以是數(shù)學的,也或者是其他的;它既可能被演繹出來,也可能被歸納出來。發(fā)現(xiàn)出來的所掌握的知識既可以應用于資料管理、查詢和優(yōu)化、決策支撐過程控制等,又可以應用于資料自身。因此,它匯聚了不同行業(yè)和領域的研究,特別是在數(shù)據(jù)庫、人工智能、數(shù)理統(tǒng)計等各個方面的學者和專家的研究資料。數(shù)據(jù)挖掘法就是可以從一些實例的數(shù)據(jù)中直接引入導出法則,用來建立一個知識庫;也就是可在數(shù)據(jù)庫中針對已經(jīng)存在的規(guī)則性信息進行驗證,因此對于知識庫的維護和更新是有必要的。
大量研發(fā)數(shù)據(jù)需求依靠的是人工智能。它也可以說是充分運用了目前在現(xiàn)代人工智能中一些已經(jīng)成熟的算法和科學技術,例如:人工神經(jīng)網(wǎng)絡、決策樹、相鄰搜索方法、規(guī)律推理、模糊邏輯等。它與現(xiàn)代人工智能相比,具有很小的復雜性。在數(shù)據(jù)挖掘系統(tǒng)中所需要利用到的技術量就越大,所得到的結果精確程度也就越高。數(shù)據(jù)挖掘系統(tǒng)中所利用的技術量越大,所獲得的結果準確度也越高。這主要是由于一個問題的類型以及其中大量數(shù)據(jù)的各種類型和規(guī)模不同,而導致的無論是采用何種技術手段來實現(xiàn)所需要的任務,從其功能上都可以把對數(shù)據(jù)進行挖掘的分析,大致方法劃分為以下3 種:
基于關聯(lián)性的分析:關聯(lián)分析的主要目標之一就是通過對隱含數(shù)據(jù)之間的挖掘和分析來分析這些信息中的相互關系。分類記錄分析:采用分類記錄分析法的數(shù)據(jù)輸入集就是一組數(shù)據(jù)記錄的集合和幾個標記,首先給每一個數(shù)據(jù)記錄賦予一個標記,然后按照所標記的數(shù)據(jù)進行分類和記錄,最后通過檢查此標記的數(shù)據(jù)描述來找出這次記錄的特點。聚類分析:聚類分析:聚類分析法的主要特點是輸入集通常都是一組不被標記的數(shù)據(jù)和信息,即這時對于該數(shù)據(jù)和信息所做出的記錄尚沒有被用來做出任何的分類。它的目的主要在于根據(jù)某種特殊的規(guī)律,合理地劃分每一個記錄的數(shù)量和集合,并以一種顯式或者隱性的形式將其排列到不同的類別中,而所需要依賴和遵循的這些方法與規(guī)律都是由通過集成聚類分析工具來決定的[1]。
電子政務系統(tǒng)是近年來隨著互聯(lián)網(wǎng)和電子信息技術的廣泛傳播而逐漸興起的一個新名詞,其基本含義主要是指各級政府部門充分運用先進的網(wǎng)絡信息技術對各個部門重新地進行了規(guī)劃和歸集分類,利用先進的電子通信將它們相互地連接,并將它們共同地納入一個網(wǎng)絡的管理之內(nèi),利用先進的計算機和電子通信將它們相互連接,并將它們共同地納入一個互聯(lián)網(wǎng)的經(jīng)營管理之內(nèi),通過先進的互聯(lián)網(wǎng)技術有效地對企業(yè)進行流暢、透明地經(jīng)營和管理,實現(xiàn)對各級地方政府部門資源優(yōu)化與資產(chǎn)重組。電子政務能夠很好地緩解因為時間、空間所給我們帶來的障礙,實現(xiàn)了各個單位之間毫不隔閡的聯(lián)系,共同為社會、人民群眾一個最好質(zhì)量的服務。此時采取傳統(tǒng)處理方法已經(jīng)遠遠無法很好地解決問題,需要運用一些新的處理技術。數(shù)據(jù)挖掘,正是一種符合這一要求的技術,它不但可以準確處理海量的信息,還可以將有效的信息從中獲取出來,使大量的信息資源和數(shù)據(jù)都得到了維護,從而大大提高了政府的辦公工作效率。因此,在電子政務中對于數(shù)據(jù)挖掘等新技術的研究和運用,是非常值得各級政府部門深入學習和大力推動的。
電子政務大數(shù)據(jù)挖掘主要目的就是把有用的大數(shù)據(jù)進行挖掘直接地折射給各級政府部門,使得各級政府部門的內(nèi)部資料和外部信息與外部資料之間能夠進行有效的整合和分析,這樣政府部門才能夠更好、較有效地將自己的資料發(fā)布出去,向最想要得到他們的社會公眾公布。另外,由于各級政府部門自動化的實施產(chǎn)生了大量的統(tǒng)計資料,對這些統(tǒng)計資料進行了收集分析,可以及時地獲得一些直接影響到政府部門管理工作的重要性和關鍵因素,從而有效地為各級政府部門管理人員的決策工作提供了依據(jù),幫助各級政府部門提升政府信息化的能力和水平,促進整個經(jīng)濟社會發(fā)展。數(shù)據(jù)挖掘技術在電子政務領域的應用有很多特點,這些技術主要表現(xiàn)在以下幾個層次[2]。
電子政務體系的構建所帶來的直接經(jīng)濟效益,就是它徹底地打破了各級人民政府之間的文件傳輸信息的繁雜化,用最快捷的手段和電子服務方式向各級人民政府上下級之間傳輸信息,這不但大大降低了人民政府的辦公生活用品和其他相關費用的開銷,而且在無形中也為人民政府減少了巨大的額外開銷。通過對數(shù)據(jù)的挖掘能夠掌握各個單位的費用和開支情況,并為客戶提出可行的降低成本和有效控制的解決方案。
電子政務大數(shù)據(jù)挖掘技術可以將各級政務機構在系統(tǒng)的大數(shù)據(jù)中所收集到的海量信息綜合地進行開采、挖掘和綜合分析,從中準確地識別、抽取它們所蘊含的信息,并充分利用這些信息能夠為各級政府部門和機關重大的決策、法規(guī)制定工作提供有效的決策依據(jù)。例如,通過對各地方政府、社會公共網(wǎng)站的數(shù)據(jù)資料進行搜索和收集,然后采用數(shù)據(jù)挖掘的方法對其他網(wǎng)站進行挖掘,從中獲取出對于提高各類政府工作效率有益的基礎知識,從而給各類政府機構及相關工作人員提供一種科學、實用的幫助以及決策支撐。
政府部門需要做到充分發(fā)揮自身的職能,對各單位進行有效的監(jiān)控與管理,同時也是為了提高民眾和政府之間交流與溝通的準確度,及時掌握有效信息,就必須建立一個能夠有效地對收集、監(jiān)督和分析獲取的大量資料進行整合的系統(tǒng)[3]。
為了能夠更好地分析和發(fā)現(xiàn)在我國的政務系統(tǒng)中網(wǎng)站和瀏覽器對于用戶的各種訪問模式和其行為方向,就需要我們可以通過使用大量的數(shù)據(jù)挖掘技術,來針對網(wǎng)站和瀏覽器上的服務器和網(wǎng)站日志中所記錄的大量信息和數(shù)據(jù)進行分析挖掘處理,從中收集得到的信息并有針對性地加以分析。例如,通過對于使用者在某頁面停留的時間,就能夠準確地判斷得出使用者對于這些信息資源有什么特殊的興趣,從而開始進行一種個性化的服務。
為了有效地組織和整合收集政府網(wǎng)站中的信息,我們可以考慮通過對政府網(wǎng)站中的文字資源進行挖掘,主要就是通過對政府網(wǎng)站中的各種文字資源內(nèi)容。例如,我們就能夠使用聚類技術自動將一個網(wǎng)站中所有的文本內(nèi)容都由其他信息進行了一個自動的分類和劃定相應的類型,從而使我們能夠很好地實現(xiàn)對一個網(wǎng)站中所有信息的多維度、層次化的組織和方式,便于我們對這些文本內(nèi)容的搜索進行分類、瀏覽和檢索;同時,還使我們可以充分地結合對于一些網(wǎng)絡上用戶所需要訪問的日志記錄資料信息等數(shù)據(jù)進行挖掘,把握好了用戶的需求,從而積極地開展一些個性化的信息服務和具有針對性的電子政務等活動,進而吸引人們到更多的注意力。
創(chuàng)新涉及政府制訂發(fā)展戰(zhàn)略的實施和公眾政策方面的創(chuàng)新。電子政務大數(shù)據(jù)的挖掘,增強了我國政府部門應對各種突發(fā)事件的迅猛反應能力,提高了我國政府部門工作的自主創(chuàng)新能力和專業(yè)技術人才素質(zhì)。例如,在災害預警系統(tǒng)中運用了數(shù)據(jù)挖掘的關聯(lián)分析和回歸預測等技術,對于歷史資料的分析進行分析,可以準確地預測到與災害有關的影響因素、災害所處地區(qū)發(fā)生的變化趨勢,并為其制定緊急救援措施[4]。
對過去從事行政管理工作中獲取的數(shù)據(jù)資源進行分析挖掘可以獲取到許多未知的行政管理經(jīng)歷和知識,這就是電子政務大數(shù)據(jù)挖掘的強大魅力。但是,目前關于數(shù)據(jù)挖掘技術的基礎研究并不是很成熟,距離實踐中的應用仍然存在一些差距,主要體現(xiàn)在以下幾個方面:
第一,知識的表達和解釋機制,對于挖掘得到的知識如何以一種用戶可能接受和理解的方式將其表達得出來,這就要求我們對于知識的表述不能僅僅停留在數(shù)字或者符號上,而是應該以一種比較容易被人理解的手段。第二,挖掘的對象規(guī)模大而復雜,政府數(shù)據(jù)采集和管理的變革使得數(shù)據(jù)開發(fā)面臨著更多的數(shù)據(jù)庫、更多的維度以及各種屬性之間的繁瑣關系,所處理的數(shù)據(jù)量變得更加龐大了,從而直接導致了組合式的爆炸[5]。目前,主要是通過綜合地利用先進的并行技術或者抽取等方式處理各種大規(guī)模數(shù)據(jù),以此為基礎來達到較高的挖掘效率。第三,證實技術的局限,主要表現(xiàn)在兩個重要的方面:一個就是對所研究出來的知識進行證實;二是對所有參與挖掘的來源數(shù)據(jù)進行抽取挖掘,選擇算法本身等是否正確地進行證實。
實施電子政務系統(tǒng)是現(xiàn)代信息科學技術進步的必然產(chǎn)物。在當前全球經(jīng)濟一體化的背景下,應當進一步加強對于網(wǎng)絡安全的立法以及網(wǎng)絡的監(jiān)管,積極推動互聯(lián)網(wǎng)網(wǎng)絡資源的構建。充分發(fā)揮政府的獨特資源優(yōu)勢,促進管理的革命性創(chuàng)新和科學技術的創(chuàng)新,使得政府能夠運用電子政務更好地為人民服務。