李 晶
(西安文理學(xué)院商學(xué)院,陜西西安,710065)
數(shù)據(jù)處理的技術(shù)基礎(chǔ)是電子信息及軟件工程。數(shù)據(jù)處理技術(shù)涉及到數(shù)據(jù)庫管理系統(tǒng)、分布式數(shù)據(jù)處理系統(tǒng)、文檔系統(tǒng)等方面的技術(shù)。數(shù)據(jù)處理離不開軟件的支持,數(shù)據(jù)處理軟件包括:管理數(shù)據(jù)的數(shù)據(jù)庫系統(tǒng)和文檔系統(tǒng),書寫處理程序的程序各種設(shè)計語言及其編譯程序,以及各種數(shù)據(jù)處理方法的應(yīng)用軟件包。此外,為了保證數(shù)據(jù)安全可靠,還需要有一整套數(shù)據(jù)安全保密的技術(shù)。
1.1 提升政府的信息服務(wù)。通過計算機數(shù)據(jù)處理進行信息管理已成為政府為公眾提供信息服務(wù)的重要方式。大量社會經(jīng)濟數(shù)據(jù)(人口、交通、工農(nóng)業(yè)等),常要求進行綜合性數(shù)據(jù)處理,對各種原始數(shù)據(jù)(包括數(shù)值的和非數(shù)值的)進行分析、整理、計算和編輯加工的技術(shù)過程。必須建立數(shù)據(jù)庫,系統(tǒng)地整理和存儲數(shù)據(jù),分析數(shù)據(jù)取得有意義的信息,發(fā)展數(shù)據(jù)處理軟件,充分利用數(shù)據(jù)庫技術(shù)進行數(shù)據(jù)管理和處理。信息化的數(shù)據(jù)處理技術(shù)相對于傳統(tǒng)人工方式而言,大大提高了政府工作效率,擴充了政府信息服務(wù)內(nèi)容。
1.2 建立電子化政府。搜索引擎網(wǎng)絡(luò)數(shù)據(jù)處理是目前網(wǎng)絡(luò)信息檢索發(fā)展的一個關(guān)鍵。通過對網(wǎng)頁內(nèi)容的數(shù)據(jù)整理,可以實現(xiàn)對網(wǎng)頁的聚類、分類,實現(xiàn)網(wǎng)絡(luò)信息的分類瀏覽與檢索;同時,通過對用戶所使用的互動提問式的歷史記錄分析,可以有效地進行提問擴展,增強用戶的檢索效果;另外,運用網(wǎng)絡(luò)內(nèi)容數(shù)據(jù)處理技術(shù)改進關(guān)鍵詞加權(quán)算法,可以提高網(wǎng)絡(luò)信息的標(biāo)引準確度,從而改善檢索效果。
由于政府網(wǎng)站的訪問量非常大,時常需要做數(shù)據(jù)處理。在進行一些專業(yè)的數(shù)據(jù)分析時,往往要有針對性的數(shù)據(jù)清洗,即把無關(guān)的數(shù)據(jù)、不重要的數(shù)據(jù)等處理掉。接著對數(shù)據(jù)進行相關(guān)分分類,進行分類劃分之后,就可以根據(jù)具體的分析需求選擇模式分析的技術(shù),如路徑分析、興趣關(guān)聯(lián)規(guī)則、聚類等。
1.3 促進政府之間交流。在服務(wù)器以及瀏覽器端日志記錄的數(shù)據(jù)中隱藏著模式信息,運用網(wǎng)絡(luò)用法數(shù)據(jù)處理技術(shù)可以自動發(fā)現(xiàn)系統(tǒng)的訪問模式和用戶的行為模式,從而進行預(yù)測分析。例如,通過評價用戶對某一信息資源瀏覽所花費的時間,可以判斷出用戶對何種資源感興趣;對日志文件所收集到的域名數(shù)據(jù),根據(jù)國家或類型進行分類分析;應(yīng)用聚類分析來識別用戶的訪問動機和訪問趨勢等。這項技術(shù)已經(jīng)有效地運用在政府之間的交流中。通過模式分析,找到有用的信息,再通過聯(lián)機分析(OLAP)的驗證,結(jié)合客戶登記信息,找出政務(wù)交往對象,或發(fā)現(xiàn)潛在的交流價值。
1.4 為政府重大政策出臺提供信息支持。例如,通過對網(wǎng)站所公布的各種經(jīng)濟資源的數(shù)據(jù)分析處理,確定未來經(jīng)濟的走勢,從而制定出相應(yīng)的宏觀經(jīng)濟調(diào)控政策。同理,通過對各類渠道獲取的社會資源的數(shù)據(jù)分析處理,可以科學(xué)地制定出一些社會服務(wù)、社會保障與福利政策。
數(shù)據(jù)包括數(shù)字、符號、字母和各種文字的集合。數(shù)據(jù)處理系統(tǒng)需要用計算機收集、記錄數(shù)據(jù),經(jīng)加工產(chǎn)生新的信息形式的技術(shù)。一個完整的計算機數(shù)據(jù)處理體系主要包括8個方面。
①數(shù)據(jù)采集:采集所需的信息。
②數(shù)據(jù)轉(zhuǎn)換:把信息轉(zhuǎn)換成機器能夠接收的形式。
③數(shù)據(jù)分組:指定編碼,按有關(guān)信息進行有效的分組。
④數(shù)據(jù)組織:整理數(shù)據(jù)或用某些方法安排數(shù)據(jù),以便進行處理。
⑤數(shù)據(jù)計算:進行各種算術(shù)和邏輯運算,以便得到進一步的信息。
⑥數(shù)據(jù)存儲:將原始數(shù)據(jù)或計算的結(jié)果保存起來,供以后使用。
⑦數(shù)據(jù)檢索:按用戶的要求找出有用的信息。
⑧數(shù)據(jù)排序:把數(shù)據(jù)按一定要求排成次序。
數(shù)據(jù)處理原理圖如圖1所示:
圖1 數(shù)據(jù)處理原理圖
數(shù)據(jù)處理的過程大致分為數(shù)據(jù)的錄入、處理和輸出3個階段的工序。
數(shù)據(jù)錄入階段,也可以稱為數(shù)據(jù)的準備階段。數(shù)據(jù)錄入以后,就要由計算機對數(shù)據(jù)進行處理,為此預(yù)先要由用戶編制程序并把程序輸入到計算機中,計算機是按程序的指示和要求對數(shù)據(jù)進行處理的。所謂處理,就是指上述8個工作方面中的一個或若干個的組合。數(shù)據(jù)經(jīng)處理,最后輸出的是各種文字和數(shù)字的報表或表格。工作順序流程圖如圖2所示:
概括的講,數(shù)據(jù)錄入是基礎(chǔ),數(shù)據(jù)處理是重點,數(shù)據(jù)輸出是目的。數(shù)據(jù)采集、管理,其重點是在此基礎(chǔ)上進行分析和匯總,主要目的是為政府決策提供全面、準確、客觀、科學(xué)的數(shù)字依據(jù)。
數(shù)據(jù)處理根據(jù)處理設(shè)備的結(jié)構(gòu)方式、工作方式,以及數(shù)據(jù)的時間空間分布方式的不同,數(shù)據(jù)處理有不同的方式。不同的處理方式要求不同的硬件和軟件支持。每種處理方式都有自己的特點,應(yīng)當(dāng)根據(jù)應(yīng)用問題的實際環(huán)境選擇合適的處理方式。數(shù)據(jù)處理主要有四種分類方式:
①根據(jù)處理設(shè)備的結(jié)構(gòu)方式區(qū)分,有聯(lián)機處理方式和脫機處理方式。
②根據(jù)數(shù)據(jù)處理時間的分配方式區(qū)分,有批處理方式、分時處理方式和實時處理方式。
③根據(jù)數(shù)據(jù)處理空間的分布方式區(qū)分,有集中式處理方式和分布處理方式。
④根據(jù)計算機中央處理器的工作方式區(qū)分,有單道作業(yè)處理方式、多道作業(yè)處理方式和交互式處理方式。
隨著電子政務(wù)的發(fā)展和網(wǎng)絡(luò)用戶對高品質(zhì)、個性化的信息需求的不斷擴大,必將對數(shù)據(jù)處理技術(shù)提出更高的要求。從發(fā)展趨勢上看,數(shù)據(jù)處理技術(shù)未來發(fā)展的重點將主要集中于智能性、易用性、集成性三個方面,需要從這三方面入手推動信息處理技術(shù)的不斷發(fā)展與完善,更好地為電子政務(wù)服務(wù),從而提高全球的信息化水平。
[1] 孫止興,戚魯.電于政務(wù)原理與技術(shù)[M].北京:人民郵電出版社.2003.
[2] 蘇新寧,吳鵬,朱曉峰等.電子政務(wù)技術(shù)[M].北京:國防工業(yè)出版社.2003.
[3] 徐子沛.大數(shù)據(jù):正在到來的數(shù)據(jù)革命,以及它如何改變政府、商業(yè)與我們的生活[M].廣西:廣西師范大學(xué)出版社.2012:191一193
圖2 工作順序流程圖